Jorge Mahecha Gómez Mecánica clásica avanzada Mahecha Gómez, Jorge Mecánica clásica avanzada / Jorge Mahecha Gómez. – Medellı́n : Editorial Universidad de Antioquia, 2006. xiv, 608 p. : il., diagrs. ; 24 cm. Incluye bibliografı́a e ı́ndice. ISBN: 958-655-847-9 1. Mecánica 2. Estática 3. Cinemática 4. Dinámica I. Tı́t. 531 cd 19 ed. A1072576 CEP-Banco de la República-Biblioteca Luis-Ángel Arango Mecánica clásica avanzada Jorge Mahecha Gómez Ciencia y Tecnologı́a Editorial Universidad de Antioquia Colección Ciencia y Tecnologı́a c Jorge Mahecha Gómez c Editorial Universidad de Antioquia ISBN: 958-655-847-9 Primera edición: enero de 2006 Diseño de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia Diagramación: Patricia Arredondo Corrección de textos: Arley Cárdenas Coordinación editorial: Gonzalo Montoya Velásquez Impresión y terminación: Imprenta Universidad de Antioquia Impreso y hecho en Colombia / Printed and made in Colombia Prohibida la reproducción total o parcial, por cualquier medio o con cualquier propósito, sin autorización escrita de la Editorial Universidad de Antioquia Editorial Universidad de Antioquia Teléfono: (574) 210 50 10. Telefax: (574) 263 82 82 E-mail: mercadeo@editorialudea.com Página web: www.editorialudea.com Apartado 1226. Medellı́n. Colombia Imprenta Universidad de Antioquia Teléfono: (574) 210 53 30. Telefax: (574) 210 53 32 E-mail: imprenta@quimbaya.udea.edu.co Índice general 1. Fundamentos de la mecánica newtoniana 1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de partı́culas. Variables dinámicas. Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Ecuaciones generales de la estática y la dinámica 2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . . 2.4. La ecuación general de la estática . . . . . . . . . . . . . . . . . . . . . . 2.5. Las ecuaciones de la estática en coordenadas generalizadas . . . . . . . . 2.6. La ecuación general de la dinámica . . . . . . . . . . . . . . . . . . . . . 2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas holónomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas no holónomos. Uso de coordenadas no independientes . . . . . . . . . . 3. El principio de Hamilton y las ecuaciones de Lagrange 3.1. Forma integral de la ecuación general de la dinámica para un sistema holónomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Algunas propiedades de la función lagrangiana . . . . . . . . . . . . . . 3.4. Simetrı́as de la lagrangiana y teoremas de conservación . . . . . . . . . 3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. La formulación hamiltoniana 4.1. Las variables hamiltonianas de estado . . . . . . . . . . 4.2. Simetrı́as y el teorema de conservación . . . . . . . . . . 4.3. La segunda forma del principio de Hamilton . . . . . . 4.4. Las transformaciones puntuales. Las transformaciones en 4.5. Las transformaciones canónicas o de contacto . . . . . . . . . . . . . . . . . . . . . . . . v . . . . . . 1 1 3 7 7 12 15 19 28 35 . 40 . 46 55 . . . . . 55 58 67 68 80 85 . . . . . . . . . . 85 . . . . . . . . . . 94 . . . . . . . . . . 97 el espacio de fases101 . . . . . . . . . . 107 vi 4.6. La función generatriz de una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . 108 4.7. La evolución temporal de un sistema considerada como una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5. Movimiento de dos partı́culas que interactúan por medio de una fuerza central 5.1. Coordenadas de centro de masa y coordenadas relativas . . . . . . . . . . . . . . . 5.2. El oscilador armónico tridimensional . . . . . . . . 5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . . 5.4. El problema de la dispersión bajo fuerzas centrales 125 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 136 140 156 6. Pequeñas oscilaciones de sistemas de varios grados de libertad 167 6.1. Modos normales de oscilación. Caso no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2. Modos normales de oscilación. Caso degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 6.3. Un campo mecánico unidimensional: la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 7. Cinemática del cuerpo rı́gido 7.1. Definición de cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . 7.2. Sistemas de coordenadas espacial y del cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . 7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . . 7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido 7.5. El rotador rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6. Los ángulos de Euler . . . . . . . . . . . . . . . . . . . . . . . 7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros 7.8. Representación del grupo de rotaciones por medio de matrices 2 × 2. Los parámetros de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . 7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones . . 205 . . . . . . 205 . . . . . . . . . . . . . . . . . . . . . . . . . de Euler . . . . . . 206 210 217 221 222 226 . . . . . . 230 . . . . . . 241 8. Dinámica del cuerpo rı́gido 253 8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 8.2. Diagonalización del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260 8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268 8.4. El movimiento de un cuerpo rı́gido libre . . . . . . . . . . . . . . . . . . . 277 8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo 295 8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310 vii 9. Las 9.1. 9.2. 9.3. 9.4. 9.5. 9.6. 9.7. 9.8. 9.9. transformaciones canónicas La acción en función de las variables de estado . . . . . La integral invariante de Poincaré-Cartán . . . . . . . . El principio de mı́nima acción y expresiones equivalentes El teorema de Li Hua Chung . . . . . . . . . . . . . . . Las transformaciones canónicas . . . . . . . . . . . . . . La ecuación de Hamilton-Jacobi . . . . . . . . . . . . . . Las transformaciones canónicas infinitesimales . . . . . . Los corchetes de Poisson . . . . . . . . . . . . . . . . . . Pruebas del carácter canónico de una transformación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 319 323 328 332 343 364 374 378 400 10.La ecuación de Hamilton-Jacobi con variables de acción-ángulo 10.1. Los invariantes adiabáticos . . . . . . . . . . . . . . . . . . . . . . 10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . . 10.3. Las variables acción-ángulo . . . . . . . . . . . . . . . . . . . . . . 10.4. Problema de Kepler (coordenadas esféricas) . . . . . . . . . . . . . 10.5. Problema de Kepler (coordenadas parabólicas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 415 420 429 445 462 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.Teorı́a de perturbaciones 11.1. Teorı́a de perturbaciones dependiente del tiempo . . . . . . . . . . . . . 11.2. Teorı́a de perturbaciones independiente del tiempo . . . . . . . . . . . . 11.3. Multiplicidad de conjuntos de variables acción-ángulo en los sistemas degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4. Teorı́a de perturbaciones de sistemas degenerados . . . . . . . . . . . . 11.5. Perturbaciones adiabáticas . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . . 11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . . 11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . . 479 . 480 . 482 . . . . . . 488 494 504 508 513 522 12.Correspondencia con la mecánica cuántica de Heisenberg 549 12.1. Representación matricial de variables dinámicas . . . . . . . . . . . . . . . 550 12.2. Corchetes de Poisson y conmutadores de matrices clásicas . . . . . . . . . 555 12.3. Problemas mecánicos a la manera de Heisenberg . . . . . . . . . . . . . . 558 12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana 561 12.5. Teorı́a de perturbaciones con matrices clásicas . . . . . . . . . . . . . . . 564 13.Correspondencia con la mecánica cuántica de Schrödinger 13.1. Ideas de Hamilton acerca de las transformaciones canónicas . 13.2. Función de distribución de probabilidades . . . . . . . . . . . 13.3. La mecánica ondulatoria . . . . . . . . . . . . . . . . . . . . . 13.4. La función de onda semiclásica según Keller y Maslov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567 567 573 580 585 A Isabel. A Clara. A Eduardo y Andrés. Prefacio No trataré de exponer razones para la aparición de un nuevo texto de mecánica clásica. La acogida que reciba mi trabajo en la comunidad universitaria indicará si en su concepción y realización satisface una necesidad existente en este campo. Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas composiciones. Tampoco se pide a un compositor que diga las necesidades del público que pretende complacer. Tal vez en toda obra que se realice sin interés de lucro, la principal motivación esté en el placer experimentado por el autor al superar paulatinamente el reto que voluntariamente se ha impuesto. Considero que estas reflexiones son válidas respecto al presente trabajo. Aunque la redacción del manuscrito y el trabajo mecanográfico se realizaron fuera de la Universidad, es justo reconocer que el origen y la finalidad del texto, ası́ como su reprodución, están dentro de ella. He dictado el curso de Mecánica Clásica Avanzada en varias ocasiones y el presente trabajo tiene como núcleo los manuscritos de las clases distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positivamente. Algunos colegas me contribuyeron con sugerencias y discusiones útiles, como los señores Fernando Medina, Alberto Sánchez, Augusto Montes, Román Castañeda y Roberto Martı́nez. Debo reconocer que la idea de escribir un libro de mecánica clásica la recibı́ del profesor Fabio Machado. He tratado de hacer una presentación de los temas en forma muy clara, lo cual desafortunadamente ha resultado en contra de la concisión. Especialmente en los ejemplos, no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por tratarse de un texto de estudio y no de una obra divulgativa, no he considerado necesario esforzarme por suprimir algunas fórmulas y frases redundantes. He tratado más bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por las deficiencias estilı́sticas de mi trabajo, y especialmente por los errores que puedan encontrar. El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalambertiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo rı́gido, pequeãs oscilaciones, transformaciones canónicas, el método de Hamilton-Jacobi y la teorı́a clásica de perturbaciones), con la elaboración de ciertos puntos en los que no se profundiza en los textos usuales, y especialmente en buscar ilustraciones concretas. He tratado también algunos problemas de la mecánica clásica que son objeto de investigación en la actualidad. El lector encontrará una presentación más completa que en los textos tradicionales de muchas cuestiones como: el tratamiento de sistemas holónomos, el uso de las coordenadas generalizadas, las transformaciones canónicas, el oscilador isotrópico, el método variacional, la cuerda uniforme, los parámetros de Euler y los parámetros de Cayley-Klein, las funciones elı́pticas de Jacobi, las ecuaciones de Euler en sistemas de referencia rotantes, la brújula de Foucault, la formulación de la mecánica según Poincaré, el teorema de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de Kepler con variables acción-ángulo, la teorı́a canónica de perturbaciones, el teorema de K.A.M, los movimientos caóticos en sistemas hamiltonianos, una formulación de la mecánica clásica con matrices, dos presentaciones de los fundamentos de la mecánica x cuántica, y muchos otros temas que yo no soy el llamado a valorar. El tratamiento de la mecánica basado en la teorı́a matemática de las variedades diferenciales y en el cálculo diferencial e integral de Cartan ha sido excluido por obvias razones. Esto no implica que le reste valor al uso de las matemáticas contemporáneas. El matemático A. N. Kolmogorov decı́a que es mucho más importante obtener resultados correctos que rigurosos. Para un fı́sico lo anterior es profundamente válido: no hay nada menos riguroso desde el punto de vista teórico que un resultado experimental, pero tampoco nada que sea más cierto ni bello. La aplicación de la teorı́a de grupos a las vibraciones moleculares, los campos mecánicos, los sistemas con vı́nculos, los fractales y el caos en sistemas disipativos, son algunos temas importantes de la mecánica clásica contemporánea que no han sido incluidos. Tal vez si es posible una segunda edición? Mis obras de consulta son excelentes textos (ver bibliografı́a) como los de Whittaker, Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lanczos, etc., ası́ como numerosas monografı́as y artı́culos especializados. Mi trabajo se alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo a los lectores la determinación del grado de originalidad del libro que tienen en sus manos. Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y posgrado en fı́sica, y puede servir como texto guı́a mediante una adecuada selección de los temas, complementado con ejercicios. Con los capı́tulos I, II, III, IV, V y VI, y un resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince horas del curso de pregrado, los capı́tulos VIII y IX, y una selección de temas de los capı́tulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensión de este material facilita la solución de problemas de investigación y escuchar sin grandes dificultades conferencias en el campo de la dinámica clásica. JORGE MAHECHA GÓMEZ Medellı́n, Junio de 1987. 1 Fundamentos de la mecánica newtoniana 1.1. Conceptos preliminares Mecánica. Es la ciencia que estudia el comportamiento de la materia a partir del movimiento de las partı́culas constituyentes. En la mecánica la máxima información acerca de un sistema de partı́culas consiste en obtener las posiciones y velocidades de cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado. Para la solución de cualquier problema mecánico es necesario: definir un sistema de referencia, hallar las coordenadas más adecuadas para describir el sistema y plantear las ecuaciones de movimiento de cuya solución se obtendrán las coordenadas y velocidades en función del tiempo. Importancia. El mundo percibido por el hombre directamente a través de sus sentidos se denomina macroscópico. La mecánica clásica brinda la formulación más completa del comportamiento de la mayorı́a de fenómenos macroscópicos, por ello es el instrumento teórico por excelencia en ramas como: arquitectura e ingenierı́a de construcciones, ingenierı́a mecánica que está en la base de la moderna industria de la maquinaria, la aeronáutica y la astronáutica, la geofı́sica, etc. Podemos decir que la ciencia de la mecánica ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a ésta de manera importante. La mecánica clásica no es una ciencia acabada. En primer lugar, hay muchos problemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov, etc. son nombres asociados a desarrollos contemporáneos de la mecánica). En segundo lugar, hay problemas fundamentales de la fı́sica (entendida como la ciencia o conjunto de ciencias que estudian las propiedades elementales de la materia) que utilizan la mecánica clásica como teorı́a básica en el grado de validez de la misma (metrologı́a, fı́sica de los plasmas, estado sólido, astrofı́sica, sistemas atómicos, sistemas nucleares y de partı́culas elementales en estados altamente excitados, etc.). Una revisión de los temas en que trabaja una inmensa mayorı́a de los fı́sicos contemporáneos nos muestra que sus objetos de investigación no son las teorı́as fundamentales sino problemas especı́ficos referentes a las propiedades de sistemas fı́sicos reales (núcleos, sólidos, átomos, gases, lı́quidos, luz, 1 2 / Mecánica clásica avanzada etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la fı́sica se han producido a partir de las investigaciones en problemas especı́ficos que se salen del rango de validez de las teorı́as existentes. O sea que las modernas teorı́as fı́sicas no han invalidado la mecánica clásica sino que simplemente han restringido su rango de validez. Por último, en la mecánica clásica está el germen de las teorı́as más completas como la mecánica cuántica o la relatividad general. Tales teorı́as utilizan los conceptos de la mecánica clásica y los introducen en sus formalismos cambiándoles el contenido. Las nociones de energı́a, momentum, velocidad, posición, etc., tienen su origen en la mecánica clásica, pero mantienen una importancia relevante dentro de las nuevas teorı́as. Podemos concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el estudio cabal de la mecánica cuántica y demás teorı́as contemporáneas. Rango de validez. La mecánica clásica no relativı́stica es aplicable cuando las velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad de la mecánica cuántica a sistemas microscópicos como átomos y moléculas está restringida a los estados en los cuales el producto del momento lineal de las partı́culas por la dimensión caracterı́stica de la región que ocupan sea del orden Hde la constante de Planck (o más exactamente, la mecánica clásica es aplicable cuando pdq ≫ h). No es exacto afirmar que la mecánica clásica es aplicable sólo en el mundo macroscópico. Hay problemas de microfı́sica como: átomos en estados excitados, la dispersión de electrones por una radiación LASER, el movimiento de electrones en algunas moléculas, el movimiento de electrones en campos eléctricos y magnéticos, etc., en los cuales se puede utilizar la mecánica clásica. En fin, sólo un análisis del problema especı́fico que se tenga permite decidir si la mecánica clásica es aplicable, si se puede usar como una aproximación o si es completamente inadecuada. Modelos fundamentales en la mecánica. En las teorı́as mecánicas los cuerpos reales son representados por medio de nociones abstractas como las de ”punto material”(partı́cula), ”sólido rı́gido”, etc. Un punto material es un cuerpo cuyas dimensiones, forma y estructura interna carecen de importancia para la resolución de un determinado problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho más grandes que las de los cuerpos involucrados y cuando la estructura interna dé lugar a efectos secundarios en el contexto en que se trabaja. Un sólido rı́gido es un cuerpo que se considera formado por gran cantidad de partı́culas, de tal modo que la distancia entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian cuando éste se mueve. Usualmente un sólido rı́gido se considera formado de un número muy grande de partı́culas, que con muy buena aproximación se pueden considerar formando una distribución continua de masa. En la interacción de dos cuerpos rı́gidos por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente rugoso. Lo anterior es importante en el análisis de las fuerzas internas llamadas de ligadura. Otro modelo es el de cuerpo deformable, básico en las teorı́as de campos mecánicos. Partes de la mecánica. Tradicionalmente se divide en estática, cinemática y 1 Estamos adoptando el punto de vista que consiste en considerar como clásica a toda teorı́a fı́sica que no dé cuenta de los efectos indeterministas de tipo cuántico y permite una descripción causal en sentido clásico. En particular, consideramos clásicas las teorı́as especial y general de la relatividad. Fundamentos de mecánica newtoniana / 3 dinámica. En el curso se tratan dos clases de temas: 1) Generales. Leyes generales de la estática y la dinámica (formalismos lagrangiano, hamiltoniano, poissoniano y de Hamilton-Jacobi), cinemática y dinámica del movimiento de rotación. 2) Espaciales. Problema de los dos cuerpos, movimiento del sólido rı́gido y vibraciones mecánicas. Las teorı́as, incluyendo la mecánica clásica, adquieren su verdadera relevancia cuando se las aplica a situaciones reales. Las teorı́as tratan de las leyes generales pero el desarrollo de la fı́sica se halla impulsado por el estudio de problemas especı́ficos. Por esto, hacemos especial énfasis en los ejemplos y en la presentación de cálculos detallados. 1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de partı́culas. Variables dinámicas. Problemas separables. Sistema de referencia. Se entiende por tal a un cuerpo rı́gido real o ficticio que sirve de referencia para estudiar el movimiento del sistema mecánico considerado. Se supone que tal sistema de referencia está rı́gidamente unido con un sistema de coordenadas; esto permite ubicar la posición de cada partı́cula del sistema mecánico respecto del sistema de referencia. Además en el sistema de referencia hay un “cronómetro” que permite determinar los instantes en que cada partı́cula del sistema ocupa una posición dada del espacio. El sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mecánico, aunque sı́ es de esperarse que la descripción obtenida dependa del estado del movimiento del sistema de referencia. Ası́ como para especificar la longitud de un objeto se requiere un patrón de longitud con una unidad de medida asociada, la descripción del movimiento de un sistema mecánico requiere de un “patrón”mecánico que no es más que el sistema de referencia. La unidad de medida es análoga al sistema de coordenadas. La elección del sistema de coordenadas en un sistema de referencia es cuestión de comodidad. Hay un número infinito de sistemas de coordenadas posible. Con una elección de sistema de coordenadas se busca que las ecuaciones de movimiento sean fácilmente solubles y que la solución sea lo más simple posible. En cualquier sistema de coordenadas es posible escribir las ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el adecuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un importante problema matemático que llega a involucrar la teorı́a de grupos, la geometrı́a diferencial y otras ramas de las matemáticas. Estado de un sistema mecánico. Es necesario distinguir los conceptos de estado y de descripción de estado. La noción de estado es intuitiva (análoga a las nociones de longitud, duración, etc.), involucra sólo aspectos cualitativos, de carácter objetivo. La descripción del estado implica nociones geométricas a través del sistema de referencia 4 / Mecánica clásica avanzada y el sistema de coordenadas que es necesario elegir (hay analogı́a con las nociones de distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamente para la especificación o descripción completa del estado de un sistema mecánico se requiere, por ejemplo, conocer la posición y velocidad de cada una de las partı́culas en un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema de referencia y un sistema de coordenadas. En cualquier rama de la fı́sica, y en general cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción depende del sistema que se trate: el estado de un sistema de partı́culas en mecánica clásica se describe mediante posiciones y velocidades; en mecánica cuántica se describe mediante la función de onda del sistema. El estado termodinámico de un sistema macroscópico se describe mediante un conjunto de variables termodinámicas como P , V , T , etc. En economı́a, el estado finanaciero de una empresa, por ejemplo, se describe mediante una serie de parámetros que evolucionan con el tiempo; qué parámetros son relevantes, depende del modelo, ası́ como de la ecuación de evolución. El sistema de referencia se denomina a veces espacio fı́sico de representación. El sistema de coordenadas permite representar cada estado del sistema por un punto. La representación de los estados ya forma parte de la teorı́a fı́sica, pero siempre existe el supuesto de que hay una correspondencia que permite asociar a cada estado de movimiento del sistema un punto del espacio de representación, o, para ser más exactos, una trayectoria en dicho espacio. A un sistema de N partı́culas se le asocian 3N coordenadas y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio de representación, llamado espacio de configuración, y sus vectores tangente y velocidades. También los estados se pueden representar por puntos del espacio de fases 6N dimensional. Una descripción puede ser por medio de las 6N cantidades: { x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t); (1.1) ẋ1 (t), ẏ1 (t), ż1 (t); ẋ2 (t), ẏ2 (t), ż2 (t); ...ẋN (t), ẏN (t), żN (t) } También es posible una descripción en términos de las coordenadas en dos tiempos diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya que además se requiere información acerca de cómo cambian con el tiempo para poder predecir cuál será la configuración del sistema en otro tiempo. Para lo anterior desde el punto de vista meramente matemático, se requerirı́a conocer todas las derivadas temporales de las coordenadas y velocidades que en un tiempo determinan los valores de las mismas en cualquier otro instante. En conclusión, el espacio de representación para un sistema de N partı́culas tiene 6N dimensiones. Los distintos formalismos de la mecánica se caracterizan, entre otras cosas, por el tipo de espacio de representación que emplean. La formulación newtoniana utiliza las posiciones y velocidades de las partı́culas. La formulación lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulación de Hamilton-Jacobi utiliza constantes de movimiento. La mecánica cuántica utiliza otro tipo de descrición del estado: los vectores de estado del espacio de Hilbert del sistema. Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las partı́culas del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad, Fundamentos de mecánica newtoniana / 5 se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restricciones, llamadas ligaduras mecánicas. Las ligaduras disminuyen el número de cantidades independientes necesarias para especificar completamente el estado del sistema. Si hay k condiciones de ligadura independientes, el número de cantidades independientes necesarias para especificar la configuración del sistema (llamado el número de grados de libertad) será 3N − k = 1. En lo que sigue supondremos conocidos los conceptos referentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda y tercera ley de Newton, trabajo y energı́a, y teoremas de conservación del momento lineal, la energı́a y el momento angular. Ecuaciones de movimiento para un sistema de partı́culas. Supondremos que las fuerzas que actúan sobre una partı́cula son función de las coordenadas y velocidades de todas las partı́culas del sistema, y que se pueden descomponer a una parte debida a efectos exteriores al sistema y a otra debida a las demás partı́culas del sistema. La fuerza neta sobre la partı́cula i (i = 1, 2, ...N ) será: F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) = F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t + N X ′~ Fij j=1 (1.2) ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t Se supone que las partı́culas del sistema sólo interactúan entre pares; la prima en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo siguiente: (a) Las fuerzas entre las partı́culas i y j dependen sólo de las coordenadas y de las velocidades de éstas; (b) La fuerza externa sobre la partı́cula i sólo depende de sus coordenadas y velocidades: F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t = F~ei (~ri , ~r˙ i ; t) + N X ′~ Fij (~ri , ~rj , ~r˙ i , ~r˙ j ) (1.3) j=1 Las ecuaciones de movimiento serán: N X j=1 ′~ Fij ~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i i = 1, 2, ...N (1.4) Este último es un sistema de N ecuaciones diferenciales, en general no lineales, de segundo orden, acopladas, con N incógnitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuaciones diferenciales escalares con 3N incógnitas. La solución de estas ecuaciones contiene 6N constantes de integración, que pueden tomarse como las 3N coordenadas y las 3N velocidades en el tiempo t = t0 , y proporciona directamente la especificación completa del estado del sistema. 6 / Mecánica clásica avanzada Variables dinámicas. Cualquier función del estado del sistema y del tiempo se denomina una variable dinámica. Las coordenadas o las velocidades mismas son variables dinámicas. También lo son el momento angular, la energı́a, el momento lineal, las coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre sı́) de las coordenadas y las velocidades constituye un conjunto completo de variables dinámicas y sirve para especificar completamente el estado del sistema. Una clase especial de variables dinámicas es constituida por las constantes de movimiento. Un conjunto máximo de constantes de movimiento, 6N , permite describir completamente el estado del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento independientes, exactamente definidas; entonces las otras 3N constantes serán completamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalismo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de principios más generales (variacionales); en este sentido también es más útil la mecánica lagrangiana. Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de movimiento acopladas, es posible mediante algún cambio de variables reducirlo a un sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en cada ecuación hay sólo una incógnita. En principio algunos problemas mecánicos son separables, pero en la mayorı́a de los casos esto es un problema muy difı́cil (o imposible) de resolver matemáticamente. Algunos problemas que han sido resueltos matemáticamente son: el de N partı́culas en un campo externo pero no interactuantes entre sı́; N partı́culas en un campo externo interactuando entre sı́ con fuerzas restauradoras lineales (cadena de osciladores acoplados, molécula lineal poliatómica, etc.); dos partı́culas interactuando entre sı́ a través de un potencial central (problema de dos cuerpos, por ejemplo); sólido rı́gido con un punto fijo en un campo gravitacional homogéneo. Pero la mayor parte de los problemas mecánicos no se han podido resolver analı́ticamente, por ejemplo, el problema de tres partı́culas interactuando entre sı́ a traves de un potencial central de tipo gravitacional (problema de los tres cuerpos), o el problema de una partı́cula cargada en presencia del campo electrostático de una carga fija y un campo magnético homogéneo. Los problemas solubles clásicamente lo son también cuánticamente; en cuanto a la búsqueda de soluciones analı́ticas exactas, la mecánica cuántica no aporta mucho en relación con la mecánica clásica, sin embargo, la mecánica cuántica ha alcanzado una mayor flexibilidad en la búsqueda de soluciones aproximadas al problema de muchas partı́culas interactuantes entre sı́. 2 Ecuaciones generales de la estática y la dinámica 2.1. Las ligaduras Esta noción aparece en fı́sica macroscópica con frecuencia y raras veces en fı́sica microscópica. Es de interés en las aplicaciones técnicas, como el diseño de maquinaria. Por ejemplo, en la definición de sólido rı́gido aparece el concepto de ligadura. Este sistema se define por la condición que la distancia entre cualquier par de partı́culas permanece fija. Para N = 2, el cuerpo rı́gido consiste de dos partı́culas a una distancia fija entre sı́; la condición de ligadura es: (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante (2.1) El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican la orientación respecto al centro de masa. Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden expresarse en forma vectorial como: |r~1 − r~2 | = a |r~2 − r~3 | = b (2.2) |r~3 − r~1 | = c Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse ası́: tres para especificar la posición del centro de masa del sistema total y tres ángulos que especifican la orientación del plano de las partı́culas con el centro de masa fijo. Para un sólido rı́gido en general se requieren 3N coordenadas pero habrá cierto número de condiciones de ligadura independientes. El número total de coordenadas independientes requeridas para especificar la posición de un sólido rı́gido son seis, que pueden 7 8 / Mecánica clásica avanzada tomarse ası́: las tres coordenadas del centro de masa y tres ángulos que especifican la orientación del cuerpo con el centro de masa fijo. Se dice que un sólido rı́gido de N partı́culas tiene seis grados de libertad y 3N − 6 condiciones de ligadura. Otros tipos de ligaduras son las siguientes: (a) Hay alguna condición que obliga a las partı́culas a moverse sobre una superficie o en una lı́nea. En una superficie cada partı́cula posee sólo dos coordenadas independientes, o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un sistema de partı́culas sobre un plano las condiciones de ligadura son las siguientes, si se toma en el plano x − y: zi = 0 ; i = 1, 2, ... N (2.3) Para una esfera de radio a y tomando el centro de la esfera como origen de coordenadas las ligaduras son: x2i + yi2 + zi2 − a2 = 0 ; i = 1, 2, ... N (2.4) (b) Si hay cuerpos rı́gidos en contacto que ruedan sin deslizarse sobre un plano. Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura. zCM = a (2.5) 2 ẋ2CM + ẏCM = a2 φ̇2 ~ CM y R ~˙ CM son la posición y velocidad del centro de masa y φ̇ es la velocidad donde R angular de rotación alrededor del eje del cilindro. Si se escoge el sistema de coordenadas de modo que el eje del cilindro sea paralelo al eje x, la ecuación (2.5) puede integrarse para dar: yCM = aφ (2.6) La ecuación (2.5) puede también integrarse directamente para obtener una relación entre el ángulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se ha escogido a φ de modo que yCM = 0 cuando φ = 0. Las ligaduras de “rodar” relacionan las velocidades entre sı́ y con las coordenadas, y en general son no holónomas, o sea no integrables. Son los casos de un disco o una esfera rodando sobre un plano. Para un disco rodando sobre un plano se requieren dos coordenadas para especificar la posición del centro de masa, una para especificar el giro alrededor del eje y dos para especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan las componentes de la velocidad del centro de masa con la velocidad angular de rotación al rededor del eje (véase la figura 2.1). Una de las coordenadas necesarias para especificar el plano del disco puede tomarse como el ángulo que hace el eje del disco con la dirección x. La otra coordenada la especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y. Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa Ecuaciones generales de la estática y la dinámica / 9 z y a ϕ v α x Figura 2.1 Disco rodando sobre un plano son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ̇, v = aφ̇ (2.7) y que la dirección de la velocidad del centro de masa siempre esté en el plano de rotación del disco, ẋ = v senα ẏ = −v cos α (2.8) De estas tres condiciones de ligadura sólo hay dos independientes: dx − a senα dφ =0 dy + a cos α dφ =0 (2.9) Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren sólo cantidades finitas. Para poder hacer esto serı́a necesario hallar ciertas funciones f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden usarse para expresar una coordenada en términos de las demás; esto implica que las condiciones de ligadura deben considerarse simultáneamente con la solución del problema mecánico, que contendrá sólo tres coordenadas independientes. Los anteriores ejemplos nos muestran que un sistema de N partı́culas y k condiciones de ligadura tendrá 3N − k grados de libertad. Un cuerpo rı́gido tendrá 6 − k grados 10 / Mecánica clásica avanzada de libertad. Las condiciones de ligadura para un sistema de partı́culas pueden siempre expresarse en la forma: fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0; α = 1, 2, ... k (2.10) Ligaduras holonómicas. También se llaman integrables, finitas o geométricas. Su nombre se deriva de las raı́ces griegas nomos (ley) y holo (entero, todo). Estas ligaduras sólo restringen las posiciones posibles del sistema, o sea que se pueden expresar por medio de igualdades que no involucran las velocidades. Para un sistema de N partı́culas son de la forma: fα (~r1 , ~r2 , ... ~rN ; t) = 0 α = 1, 2, ... h (2.11) Para un cuerpo rı́gido son: ~ θ, φ, ψ; t) = 0 fα (R, α = 1, 2, ... h (2.12) ~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican donde R la orientación del cuerpo con el centro de masa fijo y h es el número de condiciones de ligadura holónomas. Un sistema se dice que es holónomo si no tiene ligaduras diferenciales no integrables. Ligaduras no holonómicas. También se llaman no integrables, diferenciales o cinemáticas. Son aquellas que no pueden integrarse. Para un cuerpo rı́gido son de la forma: ~ R, ~˙ θ, φ, ψ, θ̇, φ̇, ψ̇; t) = 0 ; fα (R, α = 1, 2, ... n (2.13) donde n es el número de ligaduras no holónomas. En la mayorı́a de los casos (por ejemplo el de la figura 2.1), se pueden expresar en la forma: ~lα · R ~˙ + mα θ̇ + nα φ̇ + σα ψ̇ + Pα = 0 ; α = 1, 2, ... n (2.14) ~ θ, φ, ψ, t. La generalización de (2.12), donde ~lα , mα , nα , σα , Pα , son funciones de R, (2.13) y (2.14) para sistemas de cuerpos rı́gidos es inmediata. Para un sistema de N partı́culas usualmente son de la forma: N X i=1 ~lα · r~˙i + Dα = 0 ; i α = 1, 2, ... n (2.15) donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t. Ligaduras reonómicas. Del griego reo (flujo). Son las ligaduras, holonómicas o no holonómicas, que dependen del tiempo. Serı́a el caso de dos partı́culas unidas entre sı́ por una varilla cuya longitud varı́a con el tiempo de manera conocida: |~r1 − ~r2 | = l(t) (2.16) Ligaduras escleronómicas. Del griego esclero (duro). Son las ligaduras rı́gidas o que no cambian con el tiempo. Es el caso de dos partı́culas unidas entre sı́ por una Ecuaciones generales de la estática y la dinámica / 11 varilla rı́gida. La noción de ligadura involucra dos aspectos. Por una parte, indica que el número de variables independientes necesarias para especificar el estado del sistema es menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden conocer a priori porque dependen del problema especı́fico, es decir de las fuerzas aplicadas y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas incógnitas en el problema. Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente macroscópica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son el resultado de interacciones. Ası́, en el caso de la partı́cula que se mueve sobre la esfera, deben existir fuerzas que impiden que la partı́cula salga de la superficie, bien sea hacia afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que la partı́cula pudiera ocupar sólo cualquier posición dentro de la esfera se dice que la ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber algún tipo de interacción entre la superficie del disco y la del plano en la zona de contacto. En todos estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de las fuerzas aplicadas y de las condiciones iniciales. Por ejemplo, en el caso de las dos partı́culas unidas por una varilla, no sabemos cuál es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo simplemente que hay una “ligadura”: |~r1 − ~r2 | = l (2.17) Pero podemos, si queremos, modelar dicha fuerza, digamos que considerándola como un caso lı́mite de una interacción del tipo restauradora lineal. Ası́, las fuerzas de la varilla sobre las partı́culas serı́an de la forma: F~1′ = −k ′ (r − l)û F~2′ = k ′ (r − l)û (2.18) donde k ′ serı́a la constante de resorte, l la separación de las partı́culas en la posición de equilibrio y û un vector unitario en la dirección del vector ~r2 − ~r1 = ~r. En el caso de dos partı́culas interactuando a través de una fuerza central es posible separar el movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una partı́cula de masa reducida µ respecto al centro de masa bajo una interacción idéntica a la interacción entre las dos partı́culas originales. Entonces, el movimiento relativo descrito como el movimiento de la partı́cula ficticia de masa µ obedece la ecuación: s r 2E k′ r−l = sen (t − t0 ) (2.19) k′ µ donde E es la energı́a del movimiento, que consideraremos tiene un valor finito dado. Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende a cero, obteniéndose la relación cinemática r = l. Por otra parte, como la energı́a E depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente indeterminada a priori. Sólo un modelo microscópico nos permitirı́a estimar el valor de 12 / Mecánica clásica avanzada k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende de la solución al problema mecánico completo. Es claro que la indeterminación en las fuerzas de ligadura no proviene de la omisión de los detalles microscópicos, pues aun a escala microscópica las interacciones dependerı́an del movimiento completo del sistema. 2.2. Las coordenadas generalizadas Grados de libertad. El número de grados de libertad de un sistema mecánico es igual al número de coordenadas independientes necesarias para especificar completamente cada configuración del sistema. Entendemos por configuración la posición que ocupa cada una de las partı́culas del sistema. Si hay h condiciones de ligadura holónomas y n condiciones de ligadura no holónomas (o sea si hay k = n + h condiciones de ligadura independientes), el número l de grados de libertad será: l = 3N − h − n (2.20) Clasificación de los grados de libertad. Sea un sistema de partı́culas sin ligaduras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales (cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto al centro de masa), y en vibracionales (cuando describen los movimientos relativos de las partı́culas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo, sea un sistema de dos partı́culas –molécula diatómica–, las seis coordenadas se pueden clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y un grado de libertad vibracional; en el caso de tratarse de una molécula de H2 , además hay grados de libertad internos a las dos partı́culas: seis grados de libertad correspondientes a los dos electrones, un grado de libertad interno, el espı́n para cada núcleo y para cada electrón. Las modernas teorı́as de las partı́culas elementales consideran que a su vez el protón y el electrón poseen otros grados de libertad internos. Gran parte de los modelos que se construyen en la fı́sica consisten en hallar cuáles son los grados de libertad que tienen más relevancia para una situación dada. Ası́ por ejemplo, en la mecánica se omiten los grados de libertad microscópicos. Las coordenadas generalizadas. Sea un sistema de N partı́culas con h condiciones de ligadura holónomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten expresar a h coordenadas en términos de 3N − h coordenadas, que sólo serán independientes en el caso en que no haya ligaduras no holónomas. Es conveniente realizar una transformación de coordenadas de modo que se eliminen del problema las h coordenadas superfluas; para ello basta exigir que la transformación anule idénticamente las funciones fα en las ecuaciones (2.11) y (2.12). Es decir, si: xi = xi (q1 , q2 , ... q3N −h , t) yi = yi (q1 , q2 , ... q3N −h , t) zi = zi (q1 , q2 , ... q3N −h , t) ; (2.21) i = 1, 2, ... N Ecuaciones generales de la estática y la dinámica / 13 donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformación dependerá del tiempo si las ligaduras holónomas son además reónomas. La transformación además debe cumplir que se anulen idénticamente las funciones: f~α (q1 , q2 , ... q3N −h , t) ≡ fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t] (2.22) para α = 1, 2, ... h Usaremos la siguiente notación: los subı́ndices latinos se refieren a cantidades que se pueden asociar a las partı́culas. Para nombrar las coordenadas generalizadas reservamos los subı́ndices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas las coordenadas generalizadas usamos la notación (q). Más adelante usaremos también la notación ~q. Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas independientes. Por ejemplo, para una partı́cula que se puede mover sólo sobre una esfera de radio a la condición de ligadura está dada por la ecuación (2.4); o sea que, por ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida, f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t) (2.23) el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas los ángulos θ y φ definidos por: x(θ, φ, t) = a(t) senθ cos φ y(θ, φ, t) = a(t) senθ senφ (2.24) z(θ, φ, t) = a(t) cos θ Vemos que f (θ, φ, t) se anula idénticamente, o sea que la condición de ligadura (2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas pegadas entre sı́ por varillas rı́gidas sin masa y una de ellas unida por una varilla rı́gida sin masa a un punto fijo. Este sistema se denomina péndulo doble (véase figura 2.2). El sistema posee seis coordenadas que no son independientes. Supongamos que sólo hay movimientos permitidos en un plano. Entonces las condiciones de ligadura serán, z1 = 0 z2 = 0 x22 + y22 − l22 = 0 (x1 − x2 )2 + (y1 − y2 )2 + l12 = 0 (2.25) donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas en el extremo fijo de la varilla l2 . El sistema tendrá dos grados de libertad que son las 14 / Mecánica clásica avanzada 0 θ2 l2 m2 θ1 l1 m1 Figura 2.2 Péndulo doble coordenadas θ1 , θ2 definidas por: x1 − x2 = l1 cos θ1 , x2 = l2 cos θ2 , z1 ≡ 0 y1 − y2 = l1 sen θ1 , y2 = l2 sen θ2 , z2 ≡ 0 (2.26) son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad 0 = 0. Las coordenadas generalizadas se refieren al sistema como un todo y no a las partı́culas individuales. Además, no necesitan tener dimensiones de longitud. En general, cualquier conjunto de 3N − h variables dinámicas independientes del sistema puede servir de sistema de coordenadas generalizadas. Velocidades generalizadas. Son las derivadas totales de las coordenadas generalizadas respecto al tiempo: (q̇) = (q˙1 , q˙2 , ... q̇3N −h ) (2.27) En coordenadas cartesianas se cumple que el momento está relacionado con la velocidad mediante la relación ~p = m~v. En coordenadas generalizadas no existe una relación de este tipo en general. Espacio de configuración. Es un espacio definido por las l coordenadas independientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas, una partı́cula se mueve en lı́nea recta); entonces las trayectorias no rectilı́neas inmediatamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con Ecuaciones generales de la estática y la dinámica / 15 ligaduras por medio del espacio de configuración l-dimensional, usamos un espacio no euclidiano; entonces las trayectorias no rectilı́neas se atribuyen no a fuerzas, sino a la curvatura del espacio, como en relatividad general. 2.3. Los desplazamientos virtuales Sea un sistema sujeto a k condiciones de ligadura, h holónomas, dadas por las ecuaciones (2.11) y n no holónomas dadas por las ecuaciones (2.15), o por (2.12) y (2.14) respectivamente si se trata de un cuerpo rı́gido, o sus generalizaciones para un sistema de cuerpos rı́gidos. Para una configuración dada del sistema en un tiempo t, sólo hay ciertas velocidades compatibles con las n condiciones de ligadura no holónomas. O sea que hay n componentes de las velocidades que se pueden expresar en función de las 3N − n componentes restantes. Velocidades posibles. Son las velocidades que para una configuración dada (~r1 , ~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura. Sólo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el problema mecánico completo. Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración dada, d~ri = ~r˙ i dt son los desplazamientos reales. Tanto los desplazamientos reales como los posibles deben ser compatibles con las h condiciones de ligadura holónomas; es decir, estas deben satisfacerse tanto en la configuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ), siendo los d~ri desplazamientos posibles. Se sigue entonces que los desplazamientos posibles deben satisfacer simultáneamente las k = h + n condiciones, N X i=1 ~lα · d~ri + Dα dt = 0 i N X ∂fα i=1 ∂~ri · d~ri + α = 1, 2, ... n ∂fα dt = 0 α = 1, 2, ... h ∂t (2.28) (2.29) que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas de la partı́cula i. Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situación representada por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras serán reónomas; supongamos que se trate sólo de un movimiento del plano en la dirección z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efectúa 16 / Mecánica clásica avanzada el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene movimiento en la dirección z y en el plano x − y; en un desplazamiento virtual el centro de masa sólo se mueve en el plano x − y. Para hallar la condición para que los desplazamientos virtuales sean compatibles con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface, N X i=1 ~lα · d′~ri + Dα dt = 0 ; i N X ∂fα i=1 ∂~ri · d′~ri + ∂fα dt = 0 ; ∂t α = 1, 2, ... n α = 1, 2, ... h (2.30) (2.31) En las ecuaciones (2.30) y (2.31), ~lαi y Dα están evaluadas en ~r1 , ~r2 , ... ~rN , t y análogamente ∂fα /∂~ri y ∂fα /∂t. Definimos los desplazamientos virtuales δ~ri como: δ~ri = d′~ri − d~ri (2.32) y las condiciones de su compatibilidad con las ligaduras son: N X i=1 ~lα · δ~ri = 0 ; i N X ∂fα i=1 ∂~ri · δ~ri = 0 ; α = 1, 2, ... n α = 1, 2, ... h (2.33) (2.34) Ejemplo 2.3.1 Sea una partı́cula sometida a una fuerza externa F~ (x, y, t) y constreñida a moverse solamente sobre una superficie descrita por la ecuación Φ(x, y, z) = 0 (2.35) Como la ligadura es holónoma, vemos que cualquier velocidad es posible si es tangente a la superficie. La única condición sobre los desplazamientos virtuales es que sean compatibles con la ligadura. En este caso es que satisfagan la ecuación (2.34), donde Φ hace las veces de fα , es decir, ∂Φ ∂Φ ∂Φ δx + δy + δz = 0 ∂x ∂y ∂z (2.36) O sea que δx, δy, δz no pueden ser arbitrarios; sólo dos de ellos pueden serlo. En otras palabras, hay dos grados de libertad. La ecuación de movimiento, F~ = m ~¨r, y la ecuación de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones a las velocidades posibles y a las aceleraciones posibles: ∂Φ ˙ · ~r = 0 ∂~r (2.37) Ecuaciones generales de la estática y la dinámica / 17 d ∂Φ ¨ ∂Φ ~r˙ · + ~r · =0 dt ∂~r ∂~r (2.38) la ecuación de movimiento será compatible con (2.38) sólo si: d ∂Φ F~ ∂Φ ~r˙ · + · =0 dt ∂~r m ∂~r (2.39) Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplirı́a (2.39). Por tanto concluimos que la superficie debe reaccionar sobre la partı́cula con una ~ que dependerá de las condiciones iniciales, de la fuerza aplicada fuerza suplementaria R ~ se llama fuerza de reacción de la ligadura y ha de y de la ecuación de la superficie. R ser tal que: ~ m~¨r = F~ + R (2.40) Ahora tenemos seis incógnitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay sólo las cuatro ecuaciones siguientes: mẍ = Fx + Rx mÿ = Fy + Ry (2.41) mz̈ = Fz + Rz Φ(x, y, z) = 0 Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición ~ no realiza trabajo al efectuarse un de que la ligadura sea ideal. Esto quiere decir que R desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente ~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se suave), R ~ y ~r son perpendiculares, sigue que R ~ · δ~r = 0 R (2.42) o también, Rx δx + Ry δy + Rz δz = 0 (2.43) ~ no realiza trabajo en desplazamientos virtuales. Según la ecuación Es decir, R (2.36), δx, δy y δz no son independientes. Podemos expresar a δz en términos de δx y δy. Entonces la ecuación (2.33) puede escribirse en la forma: Rx − Rz ∂Φ/∂x ∂Φ/∂z ∂Φ/∂y δx + Ry − Rz δy = 0 ∂Φ/∂z (2.44) 18 / Mecánica clásica avanzada ~ ha de satisfacer Como δx, δy son diferentes de cero y arbitrarios, se sigue que R además las ecuaciones: ∂Φ/∂x ∂Φ/∂z Rx = Rz Ry = ∂Φ/∂y Rz ∂Φ/∂z (2.45) completándose ası́ las seis ecuaciones requeridas. Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de las ligaduras al efectuar desplazamientos virtuales de todas las partı́culas es cero: N X i=1 ~ i · δ~ri = 0 R (2.46) Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”. “Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a un conjunto de réplicas iguales de un sistema dinámico, donde la única diferencia entre las réplicas es la configuración, que debe ser compatible con las condiciones de ligadura, además, en estas réplicas las ligaduras están en idéntica condición; es decir, entre un sistema y otro, para un tiempo dado, las ligaduras son idénticas. Podemos imaginar las configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de un sistema cuando evoluciona el tiempo; cada fila está caracterizada por un valor del tiempo y cada columna por una configuración. Al cambiar t a un valor vecino t + dt los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una columna pasa a otra). Ejemplo 2.3.2 Sean dos partı́culas de masas m1 y m2 que interactúan entre sı́ a través de una varilla rı́gida sin masa. Están sometidas a una fuerza externa y en un estado de movimiento arbitrario. Se trata de mostrar que la ligadura es ideal. Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla son virtuales. Las fuerzas ejercidas por la varilla sobre las partı́culas son de ligadura y dependerán del estado de movimiento y de las fuerzas aplicadas sobre las partı́culas. Por ejemplo, si rotan al rededor del centro de masa, las fuerzas de ligadura dependerán de la velocidad angular de rotación. ~1 y R ~ 2 las fuerzas ejercidas por la varilla sobre las partı́culas, y G ~1 y G ~2 Sean R las fuerzas ejercidas por las partı́culas sobre la varilla, por la tercera ley de Newton se ~ 1 = −R ~1 y G ~ 2 = −R ~ 2. cumple que G Ecuaciones generales de la estática y la dinámica / 19 ~1 y G ~ 2 podrı́an producir aceleración del centro de masa de la varilla y aceleración G angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia, ~1 + G ~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que se sigue que G ~ ~ R1 = −R2 y como no hay torques, estos vectores estarán a lo largo de la varilla. El trabajo virtual de las fuerzas de ligadura será: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · (δ~r2 − δ~r1 ) R (2.47) Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma, δ~r = δ~r⊥ + δ~rk (2.48) Como la varilla es rı́gida, δ~rk → 0, luego: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · δ~r = R ~ 2 · δ~r⊥ R (2.49) ~ 2 está a lo largo de la varilla, luego R ~ 1 · δ~r2 = 0 concluyéndose por tanto que la pero R ~ 1 · δ~r1 y R ~ 2 · δ~r2 no son cero por separado, pero sı́ su suma. ligadura es ideal. R 2.4. La ecuación general de la estática Sea un sistema de N partı́culas. La fuerza sobre la partı́cula i se puede descomponer (a) ~ i ). Si el en una fuerza aplicada (F~i ) y en una fuerza de reacción de las ligaduras (R sistema está en equilibrio se debe cumplir que: (a) ~ i = ~0 ; F~i = F~i + R i = 1, 2, ...N (2.50) El trabajo virtual de las F~i también será cero, N X i=1 F~i · δ~ri = N X i=1 (a) F~i · δ~ri + N X i=1 ~ i · δ~ri = 0 R (2.51) ~ i no sean nulas, será nulo el Si suponemos que las ligaduras son ideales, ası́ las R (a) trabajo virtual realizado por ellas, ecuación (2.46). Aun en el equilibrio las F~i no serán nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe ser cero: N X i=1 (a) F~i · δ~ri = 0 (2.52) La ecuación (2.52) se llama la ecuación general de la estática o también el principio de los trabajos virtuales. El contenido de la ecuación (2.52) es el siguiente: “para que alguna configuración del sistema, compatible con las ligaduras, sea una posición de equilibrio, es necesario y suficiente que en esa posición la suma de los trabajos virtuales de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mecánica” y fue formulado por J. Bernoulli en 1717. 20 / Mecánica clásica avanzada La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa a través de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la ecuación (2.52) no serán independientes, por lo que se pueden expresar k de ellos en términos de los 3N − k restantes. Las coordenadas generalizadas independientes permiten hallar una expresión a partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los coeficientes. Este procedimiento hace posible hallar la configuración de equilibrio pero no las fuerzas de ligadura. Sistema de ecuaciones de la estática. La solución de un problema de estática consiste en hallar la configuración de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las fuerzas de reacción de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis incógnitas que se obtienen resolviendo simultáneamente las siguientes ecuaciones algebraicas: (a) ~i = 0 ; F~i + R N X i=1 i = 1, 2, ... N (2.53) ~ i · δ~ri = 0 R (2.54) fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.55) (a) ~ i en la posición Como las F~i son funciones conocidas de las coordenadas, las R de equilibrio se hallan con sólo conocer dicha posición, o sea que en (2.53) son 3N ~ i . Para hallar la configuración de equilibrio basta resolver ecuaciones que determinan las R las ecuaciones: N X i=1 (a) F~i · δ~ri = 0 y fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.56) Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 + δ~r2 , ... ~rN + δ~rN , es cierto que: N X ∂fα i=1 ∂~ri · δ~ri = 0 ; α = 1, 2, ... k (2.57) Con lo cual es posible expresar k desplazamientos en términos de 3N − k. Escribamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pueden expresar en términos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como (a) 3N − k coordenadas independientes. Llamaremos análogamente Fs a las componentes (a) Fus . Con estas modificaciones las ecuaciones de la estática pueden escribirse como: 3N X Fs(a) δus = 0 (2.58) s=1 fα (u1 , u2 , ... u3N ) = 0 ; 3N X ∂fα s=1 ∂us δus = 0 ; α = 1, 2, ... k (2.59) Ecuaciones generales de la estática y la dinámica / 21 Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indeterminados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que relacionan los δus por λα y sumamos sobre α para obtener: 3N X k X ∂fα λα δus = 0 ∂us s=1 α=1 (2.60) Ahora sumamos (2.58) y (2.60): ! k 3N X X ∂f α δus = 0 Fs(a) + λα ∂us α=1 s=1 (2.61) Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk , es decir, Fs(a) + k X λα α=1 ∂fα = 0; ∂us s = 1, 2, ... k (2.62) Ahora, con (2.62), quedará (2.61) convertida en una combinación lineal igualada a cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a: Fs(a) + k X λα α=1 ∂fα = 0; ∂us s = 1, 2, ... 3N (2.63) La ecuación general de la estática (2.58) queda convertida en las 3N ecuaciones (2.63). Ahora hay k incógnitas adicionales, o sea 3N + k en total. Pero hay 3N + k ecuaciones que son las (2.55) y las (2.63). La solución nos dará la posición de equilibrio del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones: Rs = −Fs(a) (u1 , u2 , ... u3N ) ; Rs = k X α=1 λα s = 1, 2, ... 3N ∂ fα (u1 , u2 , ... u3N ) ; ∂us (2.64) s = 1, 2, ...k (2.65) Ejemplo 2.4.1 Sean dos partı́culas de masas m1 y m2 , unidas por una varilla rı́gida sin masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras. Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro de la esfera, son: (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 = 0 x21 + y12 + z12 − a2 = 0 x22 + y22 + z22 − a2 = 0 (2.66) 22 / Mecánica clásica avanzada Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje z en la dirección vertical, las fuerzas aplicadas son: (a) F~1 = −m1 g k̂ ; (a) F~2 = −m2 g k̂ (2.67) Ecuación de equilibrio (2.58): −m1 g δz1 − m2 g δz2 = 0 (2.68) k a m 1 0 m l 2 Figura 2.3 Masas m1 y m2 unidas por una varilla rı́gida sin masa y colocadas dentro de un cascarón esférico Compatibilidad de los desplazamientos virtuales con las ligaduras: (x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1 + (y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0 (2.69) x1 δx1 + y1 δy1 + z1 δz1 = 0 x2 δx2 + y2 δy2 + z2 δz2 = 0 Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden darse independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63) se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y Ecuaciones generales de la estática y la dinámica / 23 s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us corresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us son: a −a b c −c −b ∂fα x 0 z y 0 0 = (2.70) 1 1 1 ∂us 0 x2 0 0 y2 z2 donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 . Las ecuaciones (2.63) serán: 0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0 (2.71) 0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0 (2.72) −m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0 (2.73) 0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0 (2.74) 0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0 (2.75) −m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0 (2.76) De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 : λ1 = m1 g x1 ; x2 z1 − x1 z2 λ2 = m1 g x2 − x1 x2 z1 − x1 z2 x1 x1 − x2 λ3 = m1 g x2 x2 z1 − x1 z2 (2.77) Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos: x2 y1 − x1 y2 = 0; x2 z1 − x1 z2 x1 x2 y1 − x1 y2 =0 x2 x2 z1 − x1 z2 x1 x2 z1 − x1 z2 m2 + =0 m1 x2 x2 z1 − x1 z2 (2.78) Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en: x2 y1 − x1 y2 = 0; x2 z1 − x1 z2 = 0 (2.79) La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen las dos relaciones diferentes: x1 m2 x1 y2 = x2 y1 ; =− (2.80) x2 m1 La solución (2.79) no tiene sentido pues implica: ~r1 × r~2 = (y1 z2 − z1 y2 )î − (x1 z2 − z1 x2 )ĵ + (x1 y2 − x2 y1 )k̂ = 0 (2.81) 24 / Mecánica clásica avanzada O sea que los vectores de posición de las partı́culas son paralelos, independientemente de las masas y la longitud de la varilla. Esta solución podrı́a ser aceptable en los casos lı́mites en que l = 0 o l = 2a. La solución (2.80) da:1 y1 m2 =− ; y2 m1 x1 m2 =− x2 m1 (2.82) Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el eje z. Las ecuaciones de ligadura se pueden escribir como: 2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0 (2.83) x21 + y12 + z12 − a2 = 0 (2.84) x22 + y22 + z22 − a2 = 0 (2.85) De reemplazar (2.82) en (2.83) obtenemos: 2a2 + 2 m2 2 m2 2 x +2 y − 2z1 z2 − l2 = 0 m1 2 m1 2 Usando (2.84) y (2.85) podemos escribir a (2.86) como: s 2 m m2 2 2 2 2 2 a − z2 − 2z2 a − (a2 − z22 ) − l2 = 0 2a + 2 m1 m1 Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 : 2 m2 l2 2 1+ a − m1 2 z22 = 2 m2 2 m2 l a2 − 1+ m1 m1 z1 se obtiene de (2.74), (2.84) y (2.85): 2 m2 2 2 a − z1 = a2 − z22 m1 Lo cual conduce a: 2 m2 l 2 m2 2 a − 1+ m1 m1 2 z22 = 2 m1 m1 2 l 1+ a2 − m1 m1 (2.86) (2.87) (2.88) (2.89) (2.90) Se ve fácilmente que al intercambiar las partı́culas, o sea en (2.88) al reemplazar m2 por m1 y viceversa se obtiene (2.90). 1 En (2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas. Ecuaciones generales de la estática y la dinámica / 25 Las ecuaciones (2.82) nos indican que: y1 y2 = x1 x2 (2.91) Observando la proyección de las partı́culas sobre el plano xy, vemos que la varilla debe cortar el eje z, lo cual está de acuerdo con el hecho de que el centro de masa está sobre el eje z en la posición de equilibrio. Lo anterior nos dice que la proyección de la varilla sobre el plano xy es una lı́nea recta que pasa por el origen. Debido a que de las tres ecuaciones (2.78) sólo se obtienen dos relaciones independientes, vemos que habrá una indeterminación en los valores de x1 y y1 (y correspondientemente de x2 , y2 ), lo cual es debido a la simetrı́a del problema bajo rotaciones en el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 : y m 1 ϕ2 ϕ1 x m 2 Figura 2.4 Proyección de las partı́culas m1 y m2 sobre el plano xy x22 + y22 = x21 + y12 = l2 l 2 a2 − 4 2 m2 m2 2 a2 1 + l − m1 m1 m2 m1 2 (2.92) (x22 + y22 ) De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los signos de z1 y z2 : 2 m2 l4 m1 l2 1+ + a2 a2 − 2 m1 m2 4 z1 z2 = 2 m2 m1 a2 1 + − l2 m1 m2 (2.93) 26 / Mecánica clásica avanzada Supongamos que l = 2a, con m1 6= m2 . Entonces, z1 z2 = −a2 (2.94) De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden a la varilla vertical. Si además m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores indeterminados de z1 y z2 : cualquier posición es de equilibrio, lo cual está de acuerdo con que el centro de masa está en O para todas las posiciones de la varilla. Para m1 = m2 , con l arbitrario, se obtiene de (2.88), (2.89) y (2.90): z12 = z22 = a2 − l2 4 (2.95) y de (2.93) se obtiene: z 1 z 2 = a2 − l2 4 (2.96) que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no contienen información acerca de si las partı́culas están dentro del cascarón o pegadas a él (pudiendo moverse sin fricción); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4 o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda solución es la única aceptable cuando las partı́culas están colocadas simplemente dentro del cascarón. La posición del centro de masa en un caso general es: zCM = m1 z 1 + m2 z 2 = m1 + m2 m2 m2 m2 l 2 l2 2 2 ±m1 1 + ± m2 1 + a − a − m1 m 2 m1 2 s1 2 m2 2 m2 l a2 − 1+ (m1 + m2 ) m1 m1 (2.97) Es claro que cuando las partı́culas están dentro del cascarón debe excluirse la solución en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son: Para z1 > 0 , z2 < 0: m2 1− a2 m1 zCM = s (2.98) 2 m m2 2 2 l a2 − 1+ m1 m1 Para z1 < 0 , z2 > 0: m2 − 1 a2 m1 zCM = s 2 m2 m2 2 1+ l a2 − m1 m1 (2.99) Ecuaciones generales de la estática y la dinámica / 27 Para z1 < 0 , z2 > 0: zCM m1 =− m1 + m2 s m2 1+ m1 2 a2 − m2 2 l m1 (2.100) Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM dependiendo del signo de z1 z2 en la ecuación (2.93). Estas ecuaciones pueden también escribirse como: zCM = zCM = m1 − m2 r m1 + m2 a2 − m2 − m1 r m1 + m2 a2 − zCM = − r a2 − a2 (2.101) 1 m1 m2 2 l m1 + m2 m1 + m2 a2 (2.102) 1 m1 m2 2 l m1 + m2 m1 + m2 1 m1 m2 2 l m1 + m2 m1 + m2 (2.103) Cuando p m1 = m2 sólo es válida (2.103). En ese caso, como es de esperarse zCM = z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) sólo serán válidas cuando se cumple una de las desigualdades siguientes: m1 m2 a2 o l 2 > 2 1 + a2 (2.104) l2 > 2 1 + m1 m2 Para el cálculo de las fuerzas de reacción de las ligaduras se requiere evaluar los λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80): x2 m1 −z2 + z1 (2.105) = −zCM 1 + x1 m2 Con lo cual las ecuaciones (2.77) nos dan: λ1 = − m1 m2 g ; m1 + m2 zCM λ2 = m2 g ; zCM λ3 = m2 g zCM (2.106) De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribución de cada ligadura a las fuerzas de reacción de las ligaduras. λ1 está asociada a la fuerza ejercida por la varilla sobre las partı́culas, λ2 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m1 y λ3 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m2 . Estas fuerzas, en forma vectorial, son respectivamente: λ1 (~r1 − ~r2 ); λ1 (~r2 − ~r1 ); λ2~r1 ; λ3~r2 (2.107) La fuerza total, de la varilla y el cascarón, sobre la partı́cula de masa m1 y sobre la de masa m2 respectivamente es: (λ1 + λ2 )~r1 − λ1~r; (λ1 + λ3 )~r2 − λ1~r1 (2.108) 28 / Mecánica clásica avanzada Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la varilla y el cascarón sobre las partı́culas de masas m1 y m2 respectivamente, son: m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM m1 g ~r1 ; zCM m2 g ~r2 zCM (2.109) Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 : x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak̂, r~2 = ak̂, ~r1 − ~r2 = −2ak̂ y zCM será: m1 − m2 zCM = − a (2.110) m1 + m2 Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son: −2aλ1 k̂ = − 2m1 m2 g k̂ m1 − m2 y − aλ2 k̂ = m1 (m1 + m2 ) g k̂ m1 − m2 (2.111) Las fuerzas sobre la partı́cula de masa m2 son: 2aλ1 k̂ = 2m1 m2 g k̂ m1 − m2 y aλ3 k̂ = m2 (m1 + m2 ) g k̂ m1 − m2 (2.112) Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las partı́culas están “colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener nos dice que las partı́culas están “agarradas” del cascarón de alguna manera. Esto nos ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea de las ligaduras holónomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón, ecuación (2.112), éste ejerce sobre la partı́cula de masa m2 una fuerza en la dirección z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones (2.100) y (2.106), son respectivamente: m1 g ~ CM R ; zCM m2 g ~ CM R zCM (2.113) Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g k̂ y sobre m2 es m2 g k̂. Es decir, las ligaduras ejercen sobre cada partı́cula una fuerza que contrarresta su peso, como debe ser cuando las partı́culas están “agarradas” al cascarón. El estudio del caso en que las partı́culas están simplemente “colocadas” en el cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a, r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son bilaterales. 2.5. Las ecuaciones de la estática en coordenadas generalizadas Las ligaduras hacen que los desplazamientos virtuales de las partı́culas (δx1 , δy1 , δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuación general de Ecuaciones generales de la estática y la dinámica / 29 la estática, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario que el sistema sea holónomo, mediante las ecuaciones de transformación (2.21), podemos expresar los δ~ri en términos de los δqν : δ~ri = l X ∂~ri δqν ∂q ν ν=1 (2.114) donde l es el número de grados de libertad; l = 3N − k, con k = h, puesto que en estática no hay ligaduras no holónomas. Entonces la ecuación (2.52) toma la forma: ! l N N l X X X X ∂~ r ∂~ r i i (a) (a) F~i · F~i · δqν = 0 (2.115) δqν = ∂qν ∂qν ν=1 ν=1 i=1 i=1 En la ecuación (2.115) se tiene una combinación lineal de los desplazamientos virtuales independientes δqν igualada a cero. Por esto se debe cumplir que: Q(a) ν ≡ (a) N X ri (a) ∂~ = 0; F~i · ∂q ν i=1 ν = 1, 2, ... l (2.116) Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor(a) denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que proporciona un sistema de l ecuaciones algebraicas simultáneas con las l incógnitas q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuanto a las fuerzas de ligadura, de la ecuación (2.50) se sigue que la fuerza de reacción de las ligaduras asociada al grado de libertad qν también es cero: Eν = N X N X ∂~ri ~ i . ∂~ri = − R F~i (a) · ∂qν ∂qν i=1 i=1 ν = 1, 2, ... l (2.117) Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las 3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad geométrica de “curvatura del espacio”. Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener a partir de una función V (~ rl , r~2 , ... ~rN , t) en la forma: ∂V (a) ; F~i = − ∂~ri i = 1, 2, ... N (2.118) Las condiciones de equilibrio en coordenadas generalizadas son, para este caso: Q(a) ν =− N X ∂V i=1 ∂~ri · ∂~ri ∂V =− ; ∂qν ∂qν i = 1, 2, ... l (2.119) 30 / Mecánica clásica avanzada Las ecuaciones (2.119) dicen que la posición de equilibrio estática es aquella para la cual la función de energı́a potencial tiene un mı́nimo o un máximo respecto a todas las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema, podemos decir que un mı́nimo en V corresponde a equilibrio estable, y un máximo a equilibrio inestable; las condiciones rigurosas de estabilidad están dadas por el teorema de Lagrange y los teoremas de Liapunov y Chetayev (véase el capı́tulo 5 del libro Lectures in analytical mechanics de Gantmacher). A manera de ilustración, consideraremos una partı́cula colocada sobre una esfera de radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse como θ, φ, de acuerdo con la ecuación (2.24). A las fuerzas aplicadas se les pueden asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la partı́cula se moverá sobre la superficie de la esfera sin aceleración o permanecerá en reposo respecto a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura en la dirección radial. Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1 en coordenadas generalizadas. La figura 2.5 muestra una configuración general del sistema. Se requiere hallar tres parámetros independientes compatibles con las ligaduras y expresar en términos de ellos las coordenadas de las partı́culas. Luego, hallar las fuerzas generalizadas asociadas a esos parámetros. La configuración de equilibrio estará dada por los valores de los parámetros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán tres parámetros que ubican la posición del triángulo rı́gido: 012. Como el vector de posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos parámetros podrı́an ser φCM , θCM y el tercer parámetro serı́a un ángulo de rotación del triángulo alrededor de ~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto al sistema de coordenadas espacial x, y, z. Los ángulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un ángulo θ, con lo cual z pasará a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por un ángulo ψ, con lo cual se obtendrá la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6 muestra estas tres rotaciones. La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler φ, θ, ψ. Se escoge el eje z ′ a lo largo de la lı́nea que une a O con el centro de masa, y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del triángulo. Las coordenadas de las partı́culas respecto a los ejes x′ , y ′ , z ′ son: x′1 = 0 y1′ = −a sen z1′ = a cos β −α 2 β −α 2 x′2 = 0 y2′ = a sen z2′ = a cos β +α 2 β +α 2 (2.120) Ecuaciones generales de la estática y la dinámica / 31 z 2 l 1 θ2 θ1 r1 r2 y ϕ2 ϕ1 x Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla rı́gida (del ejemplo 2.4.1) ζ′ z,ζ z θ z zi ′ θ yi′ η′ η x ϕ x ζ y y y x ϕ ϕ ψ xi′ ζ′ Figura 2.6 Los ángulos de Euler φ, θ y ψ Llamando ~rm la posición del punto medio de la varilla, obtenemos la siguiente expresión que relaciona a cos α con cos β: ~rCM · ~rm = a2 (1 + cos β) = rCM rm cos α 2 (2.121) 32 / Mecánica clásica avanzada z zi ′ 2 z i′ 1 y i′ × CM 2 × CM 1 α θ a y β 0 a xi′ ϕ y i′ ψ 0 x Figura 2.7 Ubicación del triángulo mediante los ángulos de Euler De la definición de ~rCM y de la geometrı́a se sigue que: s l2 m1 m2 rCM = a 1 − 2 (m1 + m2 ) a2 rm = a r 1− l2 4a2 l2 cos β = 1 − 2 ; 2a (2.122) (2.123) β l sen = ; 2 2a β cos = 2 r 1− l2 4a2 (2.124) Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones para senα y cos α: sen α = l m1 − m2 s 2a m1 + m2 1− v u u u cos α = u u t 1 m1 m2 l2 (m1 + m2 )2 a2 l2 1− 2 4a m1 m2 l2 1− 2 (m1 + m2 ) a2 (2.125) De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coordenadas de las partı́culas respecto a los ejes x′ , y ′ y z ′ : x′1 = x′2 = 0 (2.126) Ecuaciones generales de la estática y la dinámica / 33 v u u m2 u u ′ y1 = −l u m1 + m2 t l2 4a2 m1 m2 l2 1− 2 (m1 + m2 ) a2 1− l2 m2 1− 2 2a m1 + m2 ′ z1 = a s m1 m2 l2 1− (m1 + m2 )2 a2 v u l2 u u 1− 2 m 1 u 4a y2′ = l u m1 + m2 t m1 m2 l2 1− 2 (m1 + m2 ) a2 m1 l2 1− 2 4a m1 + m2 ′ z2 = a s l2 m1 m2 1− (m1 + m2 )2 a2 (2.127) (2.128) (2.129) (2.130) Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y s = senθ. Las ecuaciones de transformación del sistema de coordenadas x′ , y ′ , z ′ al sistema de coordenadas x, y, z son las siguientes [ver (2.118)]: x y = z (2.131) ′ c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′ x c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′ y ′ s′′ s s′′ c c′′ z′ ′′ Como las componentes del vector de posición del centro de masa en los ejes x′ , y ′ , z son: ′ ′ x′CM = yCM = 0; ′ = rCM , zCM (2.132) se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa son: xCM = rCM senθ senφ yCM = −rCM senθ cos φ zCN = rCM cos θ (2.133) 34 / Mecánica clásica avanzada Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116): Qν = −m1 g ∂z1 ∂z2 ∂zCM − m2 g = −g(m1 + m2 ) ∂qν ∂qν ∂qν (2.134) donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue inmediatamente que: Qφ ≡0 Qψ ≡0 Qθ = (m1 + m2 )grCM senθ (2.135) Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones: 0 = 0, 0 = 0, senθ = 0 (2.136) Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π, φ y ψ están en el mismo plano, realmente sólo hay un ángulo arbitrario: todas las configuraciones que se obtienen por rotar alrededor del vector de posición del centro de masa son de equilibrio, donde el centro de masa está sobre el eje z. Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131) con ψ y φ arbitrarios: ′ x cos(ψ ± φ) −sen(ψ ± φ) 0 x ′ y = sen(φ ± ψ) cos(φ ± ψ) 0 y (2.137) z 0 0 ±1 z′ Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π. Explı́citamente (2.137) da: x = x′ cos(ψ ± φ) − y ′ sen(ψ ± φ) y = x′ sen(φ ± ψ) + y ′ cos(φ ± ψ) z = ±z ′ (2.138) en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable, θ = π, las coordenadas de las partı́culas, de acuerdo con (2.138) y (2.126) a (2.130), son: m2 l2 1− 2 2a m1 + m2 ; z1 = −a s m1 m2 l2 1− (m1 + m2 )2 a2 m1 l2 1− 2 2a m1 + m2 z2 = −a s m1 m2 l2 1− (m1 + m2 )2 a2 (2.139) de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los resultados (2.80) también se obtienen directamente de (2.138). Ecuaciones generales de la estática y la dinámica / 35 2.6. La ecuación general de la dinámica Si un sistema no está en equilibrio, la fuerza neta sobre cada una de las partı́culas no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su masa por su aceleración: (a) ~ i = mi~¨ri ; F~i = F~i + R i = 1, 2, ...N (2.140) Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el sistema como un todo al desplazar virtualmente todas las partı́culas, se sigue que: n X i=1 (a) F~i − mi~¨r i · δ~ri = 0 (2.141) (a) La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma sı́ lo es. La fórmula (2.141) se llama la ecuación general de la dinámica o también el principio de D’alembert. Esta ecuación establece lo siguiente: “en todo instante en un sistema dinámico la suma de (a) las fuerzas efectivas F~i y de las fuerzas de inercia −mi~r¨i no realiza trabajo al efectuar desplazamientos virtuales del sistema”, o más en general establece que: “la ecuación general de la dinámica expresa una condición necesaria y suficiente para que un movimiento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”. Esta ecuación es aplicable a cualquier sistema ideal, holónomo o no holónomo. Como hay 3N − k desplazamientos virtuales independientes, la ecuación general de la dinámica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura constituye un sistema de 3N ecuaciones con 3N incógnitas. Esta vez, a diferencia del caso estático, las ecuaciones no serán algebraicas sino diferenciales. (a) (a+f ) = F~i − mi~r¨i la ecuación (2.141) queda ası́: Si llamamos F~i N X i=1 (a+f ) · δ~ri = 0 F~i (2.142) o sea que la ecuación general de la dinámica toma la misma forma de la ecuación general de la estática. Esta ecuación puede interpretarse como una ecuación para caracterizar en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas (a) efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . Más precisamente, el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede considerarse como una posición de equilibrio instantáneo si a las fuerzas aplicadas que actúan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial de D’alembert. En el problema estático asociado, las fuerzas de reacción de las ligaduras coinciden con las del problema original, dinámico. Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleración ~a perpendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la superficie del agua. 36 / Mecánica clásica avanzada Cuando ~a = 0, la única fuerza aplicada sobre cada elemento de volumen es la de gravedad; las fuerzas ejercidas por el resto del lı́quido pueden asumirse como de reacción. La forma de la superficie en el caso estático es plana y horizontal, perpendicular a la fuerza aplicada. dm –dma a ϕ ϕ F ( a) = –dmgk Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm En el caso dinámico, a cada elemento de masa dm se le aplica adicionalmente una fuerza ficticia −dm ~a. La superficie del agua será ahora un plano perpendicular a la fuerza F~ (a+f ) . La inclinación de la superficie estará dada por: tan φ = a g (2.143) Ejemplo 2.6.2 Sean dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el problema dinámico. Las ligaduras son: z1 = 0 z2 = 0 y1 = x1 tan α1 y2 = −x2 tan α2 (2.144) p p x21 + y12 + x22 + y22 = l Ecuaciones generales de la estática y la dinámica / 37 y α2 z α1 m m1 2 α2 α1 Figura 2.9 Dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible sin masa. Hay sólo un grado de libertad. Los desplazamientos virtuales son a lo largo de los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos conduce a: −m1 g ĵ · δ~r1 − m2 g ĵ · δ~r2 = 0 (2.145) −m1 tan α δx1 + m2 tan α2 δx2 = 0 (2.146) es decir: De la condición de ligadura impuesta por la cuerda se obtiene: δx1 = cos α1 δx2 cos α2 (2.147) Con lo cual la ecuación de equilibrio queda ası́: cos α1 −m1 tan α1 + tan α2 δx2 = 0 cos α2 (2.148) Como δx2 es arbitrario, se obtiene que: m1 senα1 = m2 senα2 (2.149) O sea que cuando los ángulos y las masas sean tales que se cumple la anterior condición, el sistema estará en equilibrio en cualquier posición. Para el caso dinámico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuación general de la dinámica: (m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0 (2.150) Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen las siguientes relaciones: a1x = a2x cos α1 ; cos α2 a1y = a1x tan α1 ; a2y = −a2x tan α2 (2.151) 38 / Mecánica clásica avanzada Además, entre los desplazamientos virtuales hay estas tres relaciones: cos α2 senα2 δy1 = δx1 tan α1 ; δx2 = δx1 ; δy2 = −δx1 cos α1 cos α1 (2.152) Al expresar en la ecuación general de la dinámica todas las componentes de las aceleraciones en términos de a1x y todos los desplazamientos virtuales en términos de δx1 , obtenemos: " senα2 − m1 g tan α1 + m2 g senα1 (2.153) # −(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0 Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será: a1 = |m1 g senα1 − m2 g senα2 | m1 + m2 (2.154) La aceleración a2 tiene igual magnitud. Las componentes x de las aceleraciones son iguales y de signos contrarios. Sistema de ecuaciones de la dinámica. Para sistemas holónomos, el principio de D’alembert permite usar los resultados obtenidos en el caso estático. Las ecuaciones (a) (2.63) nos permiten obtener las ecuaciones de movimiento con sólo reemplazar a F~i (a) por F~i − mi~¨r i : (a) F~i − mi~¨r i + N X λα α=1 ∂fα =0 ∂~ri (2.155) Para un sistema no holónomo, además de lo anterior, los desplazamientos virtuales deben satisfacer las relaciones (2.33): N X i=1 ~lα · δ~ri = 0 ; i α = 1, 2, ... n (2.156) Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 , ...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α: N X n X i=1 α=1 µα ~lαi · δ~ri = 0 (2.157) Claramente se ve que en este caso las ecuaciones de movimiento tomarán la siguiente expresión: (a) mi~r¨i = F~i + h X α=1 n λα ∂fα X ~ + µα lαi ; ∂~ri α=1 i = 1, 2, ... N (2.158) Ecuaciones generales de la estática y la dinámica / 39 Estas 3N ecuaciones contienen las 3N + n + h incógnitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 , ...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos dan 3N + n + h ecuaciones con 3N + n + h incógnitas. Esta vez las ecuaciones serán diferenciales acopladas. Las fuerzas de ligadura estarán dadas por: ~i = R h X α=1 n λα ∂fα X ~ + µα lαi ; ∂~ri α=1 i = 1, 2, ... N (2.159) Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y fueron dadas por Lagrange en el año de 1788. La ecuación (2.159) nos permite obtener la contribución de cada ligadura a las fuerzas de reacción de las ligaduras. Este formalismo es aplicable a cualquier sistema mecánico con ligaduras ideales, holónomo o no holónomo, sometido a fuerzas conservativas o no conservativas. Ejemplo 2.6.3 Sea un alambre largo, rı́gido, que gira uniformemente alrededor de un eje perpendicular a él. Una bolita se desliza en el alambre sin fricción. No hay fuerzas aplicadas (véase figura 2.10). Hallar la trayectoria de la partı́cula y las fuerzas de reacción de la ligadura. Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La ecuación de ligadura es: tan ωt x − y = 0 (2.160) y m ωt 0 x Figura 2.10 Alambre largo y rı́gido que gira uniformemente alrededor de un eje perpendicular a él. La masa m se desliza sobre él sin fricción. Las ecuaciones (2.158) y (2.159) para este caso son: mẍ = λ tan ωt (2.161) mÿ = −λ (2.162) Rx = λ tan ωt ; R − y = −λ (2.163) 40 / Mecánica clásica avanzada La ecuación de ligadura nos proporciona la siguiente ecuación diferencial, que junto con (2.161) y (2.162) nos permite obtener a x, y, λ: ÿ = ẍ tan ωt + 2ẋω sec2 ωt + 2ω 2 x sec2 ωt tan ωt (2.164) La ecuación diferencial para x es: ẍ + 2ω ẋ tan ωt + 2ω 2 x tan2 ωt = 0 (2.165) Haciendo la sustitución x = u cos ωt obtenemos la siguiente ecuación diferencial para u: ü − ω 2 u = 0 (2.166) Con lo cual la solución para x, y, λ es: x = A cosh ωt cos ωt (2.167) y = A cosh ωt senωt (2.168) λ = −2Amω 2 senhωt cos ωt (2.169) Las componentes de la fuerza de reacción de la ligadura son: Rx = −2Amω 2 senhωt senωt ; Ry = 2Amω 2 senhωt cos ωt (2.170) ~ con el eje x está dado por: El ángulo de R Ry = cot ωt Rx (2.171) ~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt. o sea que R 2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas holónomos Al introducir las coordenadas generalizadas independientes las ecuaciones de ligadura se satisfacen idénticamente. El paso a coordenadas generalizadas de la ecuación general de la dinámica se puede realizar en forma análoga al caso de la estática en virtud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las ecuaciones de movimiento en coordenadas generalizadas son: ) Q(a+f = ν N X ri (a+f ) ∂~ = 0; · F~i ∂qν i=1 ν = 1, 2, ... l (2.172) o, más explı́citamente, N ∂~r X i (a) = 0; F~i − mi~¨r i · ∂q ν i=1 ν = 1, 2, ... l (2.173) Ecuaciones generales de la estática y la dinámica / 41 Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por: Q(a) ν = N X ri (a) ∂~ F~i · ∂qν i=1 (2.174) La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede relacionar con la energı́a cinética de la siguiente manera: ) Q(f ν = = N X d~r˙i ∂~ri · dt ∂qν i=1 N X d ˙ ∂~ri d ∂~ri ˙ − mi ~ri · − mi~ri · dt ∂qν dt ∂qν − mi (2.175) i=1 Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en términos de derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresión para ~r˙ i : ~r˙ i = l X ∂~ri ∂~ri q̇µ + ∂q ∂t µ µ=1 (2.176) mediante la cual obtenemos: ∂~ri ∂~r˙i = ; ∂ q̇ν ∂qν l X ∂ 2~ri d ∂~ri ∂ 2~ri = q̇µ + dt ∂qν ∂qµ ∂qν ∂t∂qν µ=1 (2.177) Por otra parte tenemos que: l X ∂~r˙ i ∂ d~ri ∂ 2~ri ∂ 2~ri = q̇µ + = ∂qν ∂qν dt ∂qν ∂qµ ∂qν ∂t µ=1 (2.178) De (2.177) y (2.178) se sigue entonces que: ∂~r˙i ∂~ri = ; ∂ q̇ν ∂qν d ∂~ri ∂~r˙i = dt ∂qν ∂qν (2.179) Mediante (2.179) el lado derecho de (2.175) se transforma en: ! # " N ˙i X ∂ ~ r d ˙ ∂~r˙ i − mi~r˙ i · = ~ri · mi − dt ∂q ∂qν ν i=1 (2.180) N N d X1 ∂ ˙2 X 1 ∂ ˙2 − mi ~ri + ~r mi dt i=1 2 ∂ q̇ν 2 ∂qν i i=1 Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma: Q(a) ν − ∂T d ∂T + = 0; dt ∂ q̇ν ∂qν ν = 1, 2, ... l (2.181) 42 / Mecánica clásica avanzada Igual que en el caso estático las fuerzas generalizadas de ligadura se anulan, según una ecuación análoga a la (2.117). Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda clase. En esas ecuaciones T es la energı́a cinética del sistema. Una vez resueltas las ecuaciones (2.181) mediante las fórmulas de transformación (2.21) y (2.23) se hallan los ~ri (t) (a) con los cuales se pueden hallar F~i (t) y ~¨ri que permiten obtener de (2.140) las fuerzas de reacción de las ligaduras. Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pueden obtener de una función V mediante las fórmulas (2.118), las fuerzas generalizadas tomarán la forma: Q(a) ν =− ∂ V (q, t) ; ∂qν ν = 1, 2, ... l Como ∂V /∂ q̇ν = 0, (2.181) se pueden escribir: ∂ d ∂(T − V ) − (T − V ) = 0 ν = 1, 2, ... l dt ∂ q̇ν ∂qν (2.182) (2.183) T en coordenadas generalizadas depende de (q), (q̇) y de t en el caso en que las ligaduras sean reónomas. Se define la función lagrangiana, o simplemente “el lagrangiano” L ası́: L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t) (2.184) Entonces las ecuaciones de movimiento para un sistema holónomo con fuerzas derivables de un potencial que no depende de las velocidades son: d ∂L ∂L − = 0; dt ∂ q̇ν ∂qν ν = 1, 2, ... l (2.185) Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay una por cada grado de libertad del sistema. Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de coordenadas generalizadas (q) y (q) relacionadas mediante la transformación: qν = qν (q, t) ; q ν = q ν (q, t) ; ν = 1, 2, ... l (2.186) Esta transformación que no mezcla coordenadas con velocidades se denomina puntual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la forma de (2.185) en las coordenadas (q). Mediante la transformación (2.186) tenemos que: l l X X ∂L ∂L ∂ q̇α ∂L ∂qα = = ∂ q̇ ∂ q̇α ∂qν ∂ q̇ν α ∂ q̇ ν α=1 α=1 (2.187) Ecuaciones generales de la estática y la dinámica / 43 donde L es la función de (q), (q̇) y t, que se obtiene de L(q, q̇, t) al realizar la transformación: L(q, q,˙ t) ≡ L q(q, t), q̇(q, q̇, t), t . Por otra parte: " l X d ∂L ∂qα d ∂L = dt ∂ q̇ν dt ∂ q̇α ∂qα α=1 !# l ∂L X ∂ 2 qα ∂ 2 qα (2.188) + + ∂ q̇α µ=1 ∂qµ ∂q ν ∂t∂q ν l X ∂L ∂qα ∂L ∂ q̇α ∂L = + ∂q µ ∂qα ∂q ν ∂ q̇α ∂qν α=1 (2.189) Entonces se sigue de (2.188), (2.189) y (2.185) que: l X d ∂L d ∂L ∂L ∂ q̇α ∂L − = =0 − dt ∂ q̇ν ∂q ν dt ∂ q̇α ∂qα ∂q ν α=1 (2.190) Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sistema de coordenadas generalizadas. Es interesante la siguiente relación que se obtiene directamente usando la transformación puntual (2.186): l l X X ∂L ∂L q̇ ν q̇ν = ∂ q̇ ∂ q̇ν ν α=1 ν=1 (2.191) Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange contienen la misma información que la segunda ley de Newton con la ventaja adicional de ser ecuaciones completamente covariantes. En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi , Qzi . Qxj = T = N X N X (a) ri (a) (a) ∂~ F~i · µ̂x δij = Fix = F~i · ∂x j i=1 i=1 N X 1 i=1 2 mi ẋ2i + ẏi2 + żi2 (2.192) (2.193) Con lo cual las ecuaciones (2.181) nos dan: (a) mi ẍi = Fix es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton. (2.194) 44 / Mecánica clásica avanzada Comparación de los formalismos newtoniano y lagrangiano. Llamaremos newtoniano al formalismo basado en la ecuación general de la dinámica directamente. Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas holónomos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir de una sola función escalar, la lagrangiana L, en tanto que en el formalismo newtoniano se trabaja con las fuerzas que actúan sobre las partı́culas. El uso de coordenadas generalizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l parametros independientes que no se refieren a las partı́culas sino al sistema como un todo, en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de las partı́culas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente una ventaja del formalismo lagrangiano. Ejemplo 2.7.1 Sea un alambre largo y rı́gido que rota uniformemente alrededor de un punto O como se muestra en la figura 2.11. Una partı́cula de masa m está sometida a la ligadura de permanecer sobre el alambre. No hay fricción y actúa la fuerza de gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas generalizadas y las ecuaciones de Lagrange. y A c ωt h m β ωt O B x –mgj Figura 2.11 Alambre largo y rı́gido que gira uniformemente alrededor de un punto O Suponer que en t = 0 la partı́cula parte del punto C con velocidad cero a lo largo del alambre. La ligadura es holónoma y reónoma, dada por la ecuación de la linea del alambre: y = x tan β + OA (2.195) Ecuaciones generales de la estática y la dinámica / 45 De la geometrı́a se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuación de ligadura toma la forma: x cos ωt + y senωt − h = 0 (2.196) Es una ligadura dependiente explı́citamente del tiempo. El sistema tiene sólo un grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de partı́cula sobre el alambre respecto el punto C. Las ecuaciones de transformación son: x(q, t) = q senωt + h cos ωt y(q, t) = −q cos ωt + h senωt (2.197) Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del problema es: L= 1 m(ẋ2 + ẏ 2 ) − mgy 2 (2.198) L expresado en términos de la coordenada generalizada q y la velocidad generalizada q̇ es: L(q, q̇, t) = 21 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω) (2.199) −mg(h senωt − q cos ωt) Para escribir la ecuación de Lagrange se requiere conocer: ∂L = mqω 2 + mg cos α ; ∂q ∂L = m(q̇ − hω) ∂ q̇ (2.200) Con lo cual la ecuación de movimiento para la coordenada generalizada q (ecuación de Lagrange) es: q̈ − qω 2 = g cos ωt (2.201) Claramente la solución de (2.201) es de la forma: q = Aeωt + Be−ωt + C cos ωt (2.202) que satisface las condiciones iniciales q(0) = 0, q̇(0) = 0 sólo si A = B = −(1/2)C. C se determina reemplazando (2.202) en (2.201), obteniéndose finalmente para q(t): q(t) = g (cosh ωt − cos ωt) 2ω 2 (2.203) Las fuerzas de reacción de las ligaduras se determinan a partir de la ecuación (2.140): Rx = mẍ Ry = mg + mÿ (2.204) 46 / Mecánica clásica avanzada Las ecuaciones (2.197) y (2.203) permiten calcular a ẍ y ÿ: ẍ = q̈ senωt + 2q̇ω cos ωt − qω 2 senωt − hω 2 cos ωt ÿ = −q cos ωt + 2q̇ω senωt + qω 2 cos ωt − hω 2 senωt (2.205) Con lo cual se obtiene para Rx y Ry: Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt Ry (2.206) = mg(senhωt + 2senωt)senωt − mhω 2 senωt El vector ~l está dirigido a lo largo del alambre: ~l = îsenωt − ĵ cos ωt (2.207) ~ es cero: ~l· R ~ = 0 o sea que R ~ es siempre perpendicular El producto escalar de ~l con R al alambre. Su magnitud es: R = mg(senhωt + 2senωt) − mhω 2 2.8. (2.208) Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas no holónomos. Uso de coordenadas no independientes Con sistemas no holónomos no es posible, mediante la introducción de coordenadas generalizadas independientes, eliminar las condiciones de ligadura. Por alguna razón serı́a deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N , que no serán independientes. Incluso serı́a posible trabajar con un conjunto de 3N − h coordenadas generalizadas no independientes definido de tal manera que se eliminen del problema las ligaduras holónomas. En cualquiera de estos dos casos debemos trabajar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159): ! h N n X X X ∂f ∂~ri α (a) λα F~i + Qν = + µα~lαi · ∂~ r ∂q i ν α=1 α=1 i=1 ν = 1, 2, ... 3N (2.209) definimos las cantidades dα y aαν de la siguiente manera: ∂fα ; dα = ∂t aαν = N X ∂fα i=1 ∂~ri · ∂~ri ∂fα = ∂qν ∂qν para α = 1, 2, ... h (2.210) Ecuaciones generales de la estática y la dinámica / 47 dα = Dα ; aαν = N X ~lα · ∂~r1 ∂qν i=1 para α = h + 1, h + 2, ... h + n = k (2.211) Con lo cual podemos escribir a (2.209) como: Qν = Q(a) ν + k X λα aαν (2.212) α=1 donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la forma: k X ∂T d ∂T − = Qν(a) + λα aαν ; dt ∂ q̇ν ∂qν α=1 ν = 1, 2, ... 3N (2.213) En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de ligadura se pueden escribir en la forma: 3N X aαν q̇α + dα = 0 ; α = 1, 2, ... h, h + 1, h + 2, ... h + n = k (2.214) α=1 que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con las 3N + k incógnitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas de Pkreacción de las ligaduras en estas coordenadas no independientes estarán dadas por α=1 λα aαν , o más explı́citamente: h X n ∂fα X + µα aαν Rν = λα ∂qα α=1 α=1 (2.215) Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagrange y coordenadas no independientes. Tomaremos a q y h como coordenadas generalizadas no independientes. En la ecuación de ligadura escribiremos a la distancia OC como h0 : f (x, y, t) = x cos ωt + y senωt − h0 (2.216) Haciendo la transformación de las coordenadas x, y a las coordenadas q, h, ecuación (2.197), obtenemos para ~r y f : f (q, h, t) = h − h0 (2.217) ~r(q, h, t) = q(î senωt − ĵ cos ωt) + h(î cos ωt + ĵ senωt) (2.218) 48 / Mecánica clásica avanzada con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, según (2.210): aq = ∂f =0 ∂q ah = ∂f =1 ∂h (2.219) ∂f =0 ∂t Las fuerzas aplicadas generalizadas serán: d= Qν = −mg î · ∂~r ∂qν (2.220) con lo cual: Qh = −mg senωt ; Qq = mg cos ωt (2.221) La energı́a cinética será: T (q, q̇, h, ḣ, t) = 1 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω + 2q ḣω + ḣ2 ) 2 (2.222) Entonces las ecuaciones (2.213) serán: m(q̈ − ḣω) − m(qω 2 + ḣω) = mg cos ωt (2.223) m(ḧ + q̇ω) − m(hω 2 − q̇ω) = −mg sen ωt + λ La ecuación (2.214) será: ḣ = 0 ⇒ h = h0 (2.224) Reemplazando (2.224) en (2.223) obtenemos: q̈ − qω 2 = g cos ωt (2.225) λ = 2q̇ω − hω 2 + g senωt m La solución de las ecuaciones (2.225) de acuerdo con (2.224) será: g (cosh ωt − cos ωt) q = 2ω 2 λ = mg(senhωt + 2senωt) − mhω (2.226) 2 Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215): Rh = mg(senhωt + 2senωt) − mhω 2 ; Rq = 0 en completo acuerdo con los resultados de (2.208). (2.227) Ecuaciones generales de la estática y la dinámica / 49 Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano del disco perpendicular al plano inclinado (podrı́a ser una de las ruedas de un carro). Hallar y resolver las ecuaciones de movimiento. Tomaremos el plano xy en el plano inclinado, con lo cual se tendrá una configuración como en la figura 2.1. Las coordenadas del sistema serán: xCM , yCM , α, φ, que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de ligadura, no holónomas dadas por las ecuaciones (2.9): ẋ − R senα φ̇ = 0 (2.228) ẏ + R cos α φ̇ = 0 obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214): a1x = 1 a1y = 0 a1α = 0 a1φ = −R senα a2x = 0 a2y = 1 a2α = 0 a2φ = R cos α (2.229) Los momentos de inercia de un disco alrededor de su eje y alrededor de un diámetro son respectivamente: 1 1 mR2 ; Iα = mR2 (2.230) 2 4 La energı́a cinética contendrá una parte debida al movimiento del centro de masa y otra debida al movimiento respecto al centro de masa:2 Iφ = 1 1 1 m(ẋ2 + ẏ 2 ) + mR2 φ̇2 + mR2 α̇2 (2.231) 2 4 8 Tomaremos los ejes xy de modo que el eje x esté horizontal y el eje y haciendo un ángulo β con la horizontal. Las fuerzas generalizadas serán entonces: T = (a) Q(a) α = Qφ = 0 ; Q(a) x = 0; Q(a) y = mg senβ (2.232) Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se transforman en: mẍ = µ1 mÿ = mg senβ + µ2 1 2 R mα̈ = 0 4 (2.233) 1 2 R mφ̈ = −µ1 R senα + µ2 R cos α 2 La tercera de las ecuaciones (2.233) nos da: α = ωα t + α0 2 Para una justificación rigurosa de (2.231) ver sección 8.3. (2.234) 50 / Mecánica clásica avanzada Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes expresiones para µ1 y µ2 en términos de φ: µ1 = mRωα cos(ωα t + α0 ) φ̇ + mR cos(ωα t + α0 ) φ̈ (2.235) µ2 = mRωα sen(ωα t + α0 ) φ̇ − mR cos(ωα t + α0 )φ̈ − mg sen β Ahora, reemplazando a µ1 y µ2 en la última de las (2.233) obtenemos: 2 g φ̈ = − senβ cos(ωα t + α0 ) 3 R que al ser integrada nos da: 2g senβ cos(ωα t + α0 ) + At + B φ= 3Rωα2 Tomando la condición inicial φ(0) = 0 y φ̇(0) = 0, (2.237) será: 2g senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] φ= 3Rωα2 (2.236) (2.237) (2.238) Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos: α = ωα t φ =− µ1 µ2 2gsenβ ωt sen2 3Rωα2 2 2 = − mg senβsen2ωα t 3 2 = −mgβ 1 − cos 2ωα t 3 x g senβ =− 3ωα2 y = (2.239) 1 ωα t − sen2ωα t 2 gsenβ sen2 ωα t 3ωα2 Donde hemos tomado que x = 0, y = 0, ẋ = 0, ẏ = 0 en t = 0. Las fuerzas de reacción de las ligaduras serán, usando (2.215): Rx = µ1 Ry = µ2 Rα = 0 Rφ = −µ1 R senωα t + µ2 R cos ωα t 1 = − mgR senβ cos ωα t 3 (2.240) Ecuaciones generales de la estática y la dinámica / 51 Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo cual: α= 0 φ= − x= 0 y= 1 gsenβ t2 3 g senβ 2 t 3R Rx = 0 Ry = 1 − mg senβ 3 Rα = 0 (2.241) 1 − mgR senβ 3 R= Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje y, la fuerza a lo largo del plano serı́a mg senβ. En este caso se tiene que el plano ejerce sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo en la dirección de y positiva. Rφ es el torque que produce la rotación. La aceleración del centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R. Ejemplo 2.8.3 Sean dos partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida de longitud l, sin masa. El sistema de alguna manera está constreñido a moverse en un plano vertical, de modo que la velocidad del centro de masa siempre está en la dirección de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento. x r1 r r2 1 · α g 2 y Figura 2.12 Partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida y constreñidas a moverse en un plano vertical 52 / Mecánica clásica avanzada La ligadura holónoma es: |~r1 − ~r2 | = l (2.242) La ligadura no holónoma es: ẋ = tan α ẏ (2.243) Escogemos como coordenadas generalizadas no independientes a x, y y α. Definimos el vector ~l como: ~l = ~r1 − ~r2 (2.244) con magnitud l y dirección α. Las ecuaciones de transformación de coordenadas son: ~r1 = ~r + ~l 2 (2.245) ~l ~r2 = ~r − 2 La energı́a cinética se puede escribir como: 1 T = ẋ2 + ẏ 2 + l2 α̇2 4 (2.246) Los coeficientes en la ecuación de ligadura no holónoma son: ax = − tan α ; ay = 1 ; aα = 0 (2.247) La fuerza aplicada generalizada es: Qx = 0 ; Qy = 2g ; Qα = 0 (2.248) Las ecuaciones de Lagrange, (2.213), serán: 2ẍ = −µ tan α 2ÿ − 2g = µ 1 2 l α̈ = 2 0 (2.249) Para α se halla: α = ωt + δ (2.250) x, y y µ se hallan de las ecuaciones: 2ẍ = −µ tan(ωt + δ) 2ÿ = 2g + µ ẏ − ẋ tan(ωt + δ) = 0 (2.251) Ecuaciones generales de la estática y la dinámica / 53 ẋ obedece la ecuación diferencial: 2ẍ + 2ẋω tan α = g sen2α (2.252) Esta es una ecuación diferencial lineal de primer orden en ẋ cuya solución general está dada por una fórmula estándar. La solución para ẋ es: ẋ = − g (1 + cos 2α) + A cos α 2ω (2.253) Su integral nos da directamente: x=− A g (2ωt + sen2α) + senα + B Aω 2 ω (2.254) donde A y B son constantes de integración. Para y y µ se halla: y= A g cos 2α − cos α + C 2 4ω ω µ = −2g(1 + cos 2α) + 2Aω cos α (2.255) (2.256) Las fuerzas de reacción de las ligaduras serán: Rx = 2g sen2α − 2Aω senα Ry = −4g cos 2α + 2Aω cos α Rα = 0 (2.257) Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integración que dependen de las condiciones iniciales. 54 / Mecánica clásica avanzada 3 El principio de Hamilton y las ecuaciones de Lagrange 3.1. Forma integral de la ecuación general de la dinámica para un sistema holónomo Trayectorias variadas. La ecuación general de la dinámica, ecuación (2.141), es válida en cada instante t, ya que por definición los δ~ri se realizan instantáneamente alrededor de la posición real del sistema. La ecuación general de la dinámica es un “principio diferencial” que expresa la anulación del trabajo virtual de las fuerzas de ligadura en cada instante t, o equivalentemente en cada configuración del sistema. Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un desplazamiento virtual en las coordenadas de cada partı́cula, δ~ri (t), y se impone la condición δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendrá que la secuencia de desplazamientos virtuales define una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria variada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (véase figura 3.1 ). La función del tiempo ~ri (t) determina la trayectoria real y la función ~ri (t) + δ~ri (t) determina la trayectoria variada. A la función δ~ri (t) se le denomina la “variación” de la función ~ri (t). También se suele llamar “trayectoria recta” a la real y “trayectoria circuitosa” a la variada (véase figura 3.1). ~ri (t) es una representación paramétrica de la trayectoria con parámetro t. De acuerdo con los comentarios de la sección 2.3, el conjunto de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy grande de sistemas. Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la sección 2.3; una trayectoria será “recta”; todas las demás serán “circuitosas”. Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t: N X i=1 ~ i (t) · δ~ri (t) = 0, R (3.1) también será cero el promedio de los trabajos virtuales realizados por las fuerzas de 55 56 / Mecánica clásica avanzada z Trayectoria variada 2 δri mi 1 Trayectoria real ri y x Figura 3.1 Representación de trayectorias en desplazamientos virtuales ligadura entre t1 y t2 : 1 t2 − t1 Z N t2 X t1 i=1 ~ i (t) · δ~ri (t)dt = 0 R (3.2) Como consecuencia de lo anterior, la ecuación general de la dinámica toma la forma: Z N h t2 X t1 i=1 i (a) F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0 (3.3) Esta es una expresión integral, en términos ya no de desplazamientos virtuales sino de variaciones globales de las trayectorias de las partı́culas. Transformando la ecuación (3.3) llegaremos a una expresión completamente equivalente a la ecuación general de la dinámica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda clase, para sistema holónomos. Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria real, para cada una de las partı́culas, por medio de un desplazamiento virtual. Como consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles con las condiciones de ligadura. En cada instante t podemos escribir los δ~ri como: δ~ri (t) = ~ri v (t) − ~ri r (t) (3.4) donde v denota “variada” y r “real”. Se impone la condición de que las variaciones se anulen en t1 y en t2 para cada partı́cula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2 para i = 1, 2, ...N . El principio de Hamilton y las ecuaciones de Lagrange / 57 La integral de acción. Es la integral (3.3) haciendo algunas transformaciones. En la ecuación (3.3) hacemos la siguiente transformación: d ˙ d mi~¨r i · δ~ri = mi~ri · δ~ri − mi~r˙ i · (δ~ri ) (3.5) dt dt Notando que las operaciones δ y d/dt conmutan: d d (δ~ri ) = [~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i dt dt (3.6) podemos escribir a (3.5) en la forma: 1 2 d ˙ mi~ri · δ~ri − mi δ~r˙ i mi~¨r i · δ~ri = dt 2 (3.7) Con lo cual se tiene que: N X N X d mi~¨r i · δ~ri = dt i=1 i=1 mi~r˙ i · δ~ri ! −δ N X 1 i=1 2 2 mi~r˙ i Por tanto la ecuación (3.3) tomará la forma: # ! Z t2 "X N N N X 2 d X ˙ (a) ˙ ~ mi~ri dt = 0 Fi · δ~ri − mi~ri · δ~ri + δ dt i=1 t1 i=1 i=1 (3.8) (3.9) Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la energı́a cinética:1 δA = N X i=1 N (a) F~i · δ~ri ; T = 1 X ˙2 mi~ri 2 i=1 (3.10) O sea que (3.9) se puede escribir como: Z t2 t1 (δA + δT )dt − N X i=1 t2 mi~r˙ i · δ r~i =0 (3.11) t1 En virtud de la condición impuesta a los desplazamientos virtuales en t = t1 y t = t2 , el término integrado se anula con lo cual (3.11) queda finalmente: Z t2 (δA + δT )dt = 0 (3.12) t1 Podrı́a pensarse que la presencia de condiciones de ligadura harı́a que δ~ri (t1 ) = δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las independientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes. 1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energı́a en cada trayectoria variada i i es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como el de “mı́nima acción” (véase sección 9.3). 58 / Mecánica clásica avanzada Sin embargo este no es el caso, pues de una transformación a coordenadas generalizadas independientes q1 , q2 , ...ql se sigue que: δ~ri = l X ∂~ri δqν ∂qν ν=1 (3.13) Basta pues que se imponga la condición siguiente sobre los desplazamientos virtuales de las coordenadas generalizadas: δqν (t1 ) = δqν (t2 ) = 0 ; ν = 1, 2, ...l (3.14) para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri . En el caso particular en que las fuerzas aplicadas se pueden obtener como el gradiente de una función de las coordenadas y del tiempo, V (~r, t) vemos que: δV (~r, t) = N X ∂V i=1 ∂~ri .δ~ri = − N X i=1 (a) F~i .δ~ri = −δA (3.15) Para este caso la ecuación (3.12) toma la forma: Z t2 Z t2 Z t2 L dt = 0 δL dt = δ δ(T − V )dt = t1 t1 (3.16) t1 donde el segundo signo igual en (3.16) está justificado por lo siguiente: Z t2 Z t2 Z t2 Z t2 Z t2 r v v r L dt L dt = δ L dt − (L − L )dt = δL dt = t1 t1 t1 t1 (3.17) t1 Por medio de las transformaciones a coordenadas independientes se ve que T es función de (q), (q̇), t, y V es función de (q) y t, con lo cual (3.16) se puede escribir como: Z t2 L(q, q̇, t)dt = 0 (3.18) δS = δ t1 Esta ecuación es equivalente a la ecuación general de la dinámica y de ella se pueden obtener también las ecuaciones de Lagrange usando el cálculo variacional. A la integral S se la denomina integral de acción 3.2. El principio de Hamilton Es posible el desarrollo formal de la mecánica tomando la ecuación (3.12) como postulado fundamental en vez de partir del principio de D’Alembert, ecuación (2.141). En este formalismo se denomina al contenido de la ecuación (3.18), el principio de Hamilton. El principio de Hamilton para sistemas con fuerzas aplicadas derivables de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas qν (t), es tal que entre dos instantes t1 y t2 se satisface: Z t2 L(q1 , q2 , ...ql ; q̇1 , q̇2 , ...q̇l ; t)dt = 0 (3.19) δ t1 El principio de Hamilton y las ecuaciones de Lagrange / 59 Este es un principio variacional, formulado por W. Hamilton en 1835. Matemáticamente (3.19) es la condición para que la acción S sea una extremal. S es una funcional de la trayectoria q(t). En análisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una función de muchas variables, F tendrá un valor extremal, máximo o mı́nimo, si al realizar un cambio infinitesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales. Es decir si: F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn ) (3.20) = δF (x1 , x2 , ...xn ) entonces: δF (x1 , x2 , ...xn ) = N X ∂F δxi + 0(δx2i ) = 0 ∂x i i=1 (3.21) Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que hacen que se anulen todas las derivadas parciales de primer orden de F : ∂F =0 ∂xi i = 1, 2, ...n (3.22) En el análisis de funciones F (x1 , x2 , ...xn ) es un número que se asocia al conjunto de números x1 , x2 , ...xn . Al cambiar los números x1 , x2 , ...xn cambia el número F . Se dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian por xi + δxi . 2 En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un número que se asocia al conjunto de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia el número I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina variación de la función fi (x). Toda función continua en un punto x0 puede expandirse en serie de Taylor alrededor de x0 : fi (x) = ∞ X 1 (k) f (x0 )(x − x0 )k k! i (3.23) k=0 (k) donde fi (x0 ) denota el valor de la derivada k-ésima de la función fi (x) en x = x0 y (n) (0) fi (x0 ) ≡ fi (x0 ). Variando los parámetros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una función diferente. S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le corresponde un valor definido a la integral de acción S. El principio de Hamilton dice que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que describen la evolución del sistema por hallar qué conjunto es el que hace que S sea una extremal. Para la mayorı́a de las situaciones fı́sicas se encuentra que S es mı́nima para 2 El máximo o mı́nimo de una función se halla resolviendo el sistema de ecuaciones algebraicas (3.22), como en la estática. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones diferenciales, como en la dinámica. 60 / Mecánica clásica avanzada la solución correcta. En otras palabras, S tiene un valor mı́nimo cuando las funciones qν (t) describen las trayectorias reales.3 El número S asignado a cualquier trayectoria variada es mayor que el número S asociado a la trayectoria real. Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en presencia del campo gravitacional (véase figura 3.2). Sabemos que la trayectoria real está descrita por: 1 2 gt 2 Eliminando el parámetro t se obtiene que la trayectoria es parabólica: g 2 x y= 2Vx2 x(t) = Vx t ; y(t) = (3.24) (3.25) Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 = gx22 /(2Vx2 )) en t = t2 (véase figura 3.2). La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real en t = t1 = 0 y t = t2 : x = Vx t y = y2 (3.26) ex/x2 − 1 e−1 Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria real que para esta trayectoria variada. El lagrangiano del problema es: 1 m(ẋ2 + ẏ 2 ) + mgy 2 Sobre la trayectoria real L es: L= 1 m(Vx2 + g 2 t2 ) + 2 La integral de acción es: Z t2 1 L dt = mVx2 t2 + 2 0 L= (3.27) 1 1 mg 2 t2 = mVx2 + mg 2 t2 2 2 (3.28) 1 1 x2y2 mg 2 t32 = mVx x2 + 0, 666 mg 3 2 Vx (3.29) Sobre la trayectoria variada: ẋ = Vx ; ẏ y2 Vx eVx t/x x2 (e − 1) Con lo cual L es: 1 mgy2 Vx t/x2 y22 Vx2 2Vx t/x2 L = m Vx2 + + e − 1) (e 2 2 2 (e − 1) x2 e−1 3 De (3.30) (3.31) acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son de “equilibrio” estable. El principio de Hamilton y las ecuaciones de Lagrange / 61 P1 x P2 (x2,y2) g y Figura 3.2 Trayectoria parabólica en presencia de un campo gravitacional. Trayectoria variada. La integral de acción es: Z t2 L dt = 0 1 81e − 60 mgx2 y2 mVx x2 + 2 72(e − 1) Vx (3.32) mgx2 y2 1 = mVx x2 + 0,689 2 Vx Vemos que la acción en la trayectoria real es menor que la acción en la trayectoria variada. Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema, el principio de Hamilton directamente no proporciona un método práctico: se requiere un método de ensayo y error; suponer una solución y evaluar S; obtener una “tabla” de soluciones posibles en función de la acción. La solución correcta serı́a aquella para la cual S es mı́nima. Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 : x(0) = 0 , x(t1 ) = x1 , ẋ(0) = v0 (3.33) 62 / Mecánica clásica avanzada Las posibles funciones de t las asumiremos de la forma: ∞ X x(t) = a n tn (3.34) n=0 O sea que a cada conjunto de parámetros a0 , a1 , a2 , ...a∞ le corresponderá una solución.4 El conjunto de parámetros que determina la solución real es aquel para el cual δS = 0. De la condición x(0) = 0 se sigue que a0 = 0, con lo cual: ∞ X a n tn (3.35) x(t) = n=1 El lagrangiano para el oscilador armónico unidimensional es: 1 1 L = µẋ2 − kx2 2 2 Reemplazando (3.35) en (3.36) obtenemos: ∞ ∞ ∞ ∞ 1 XX 1 XX L= µ nman am tn+m−2 − k an am tn+m 2 n=1 m=1 2 n=1 m=1 Con lo cual la integral de acción será: Z t1 L dt = S= (3.36) (3.37) 0 ∞ ∞ nm 1 1XX n+m−1 n+m+1 t t −k an am µ 2 n=1 m=1 n+m−1 1 n+m+1 1 La condición δS = 0 nos da: "∞ # ∞ X X nm 1 am µ tn+m−1 − k tn+m+1 δan = 0 n+m−1 1 n+m+1 1 n=1 m=1 (3.38) (3.39) En la ecuación (3.39) los δan son los cambios de los coeficientes an que darán lugar a la variación δx(t). Los δan no son independientes, pues se debe además cumplir la condición δx(t1 ) = 0: n X δx(t1 ) = δan tn1 = 0 (3.40) n=1 En virtud de (3.40) un δan puede expresarse en términos de los demás. Vamos a introducir un multiplicador indeterminado λ multiplicando la ecuación (3.40) por λ y el resultado lo sumamos a la ecuación (3.39) para obtener: " ∞ ∞ X X mn µ t1n+m−1 n + m − 1 n=1 m=1 (3.41) 1 tn+m+1 am + λtn1 δan = 0 −k n+m+1 1 4 La ecuación (3.34) constituye una representación multiparamétrica de la trayectoria en el espacio de configuración. El principio de Hamilton y las ecuaciones de Lagrange / 63 Ahora escogemos a λ de modo que se anule el coeficiente de δa1 : ∞ X 1 m+2 µtm − k am + λt1 = 0 t 1 m+2 1 m=1 (3.42) En la ecuación (3.41) quedará una combinación lineal de los δa2 , δa3 , ...δa∞ , igualada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reemplazando el valor de λ que se obtiene de (3.42), llegamos a: ∞ X m−1 m 1 m+2 µ am = 0 (3.43) t +k t m+n−1 1 (m + 2)(m + n + 1) 1 m=1 De (3.43) se obtiene la siguiente relación de recurrencia para coeficientes, por igualar a cero los coeficientes de las tm 1 : am = − k 1 am−2 ; µ m(m − 1) m = 2, 4, ... (3.44) Como a0 = 0, se sigue que: a0 = a2 = a4 = ... = 0 (3.45) Los coeficientes impares se pueden expresar en términos de a1 , que se determina de la condición ẋ(0) = v0 : a1 = v0 (3.46) Con lo cual se obtiene que: (m−1)/2 k (m−1)/2 1 v0 ; am = (−1) m! µ m = 1, 3, ... (3.47) o también en la forma: a2n+1 = (−1)n n k 1 v0 ; µ (2n + 1)! n = 0, 1, 2, ... (3.48) Con lo cual x(t) será: x(t) = v0 r ∞ 1 µX (−1)n k n=0 (2n + 1)! Llamando ω = x(t) = s !2n+1 k µ p k/m llegamos a: v0 sen(ωt) ω Claramente el método es engorroso en problemas más complicados. (3.49) (3.50) 64 / Mecánica clásica avanzada Deducción de las ecuaciones de Lagrange a partir del principio de Hamilton generalizado. La ecuación (3.12) se denomina el principio de Hamilton generalizado. Es aplicable a cualquier sistema holónomo independientemente de la naturaleza de las fuerzas aplicadas. Como T es una función de (q), (q̇), t, δT (q, q̇, t) = l X ∂T ν=1 ∂T δqν + δ q̇ν ∂qν ∂ q̇ (3.51) En tanto que δA puede escribirse en términos de las fuerzas generalizadas Qν : δA = N X i=1 (a) F~i · δ~ri = l X Qν δqν (3.52) ν=1 En δT podemos hacer la transformación siguiente: ∂T d ∂T ∂T d d ∂T δqν δ q̇ν = δqν − δqν = ∂ q̇ν ∂ q̇ dt dt ∂ q̇ν dt ∂ q̇ν (3.53) Reemplazando (3.51), (3.52) y (3.53) en la ecuación (3.12): Z t2 (δA + δT )dt = t1 l t1 X Z Qν δqν + t1 ν=1 + l X ∂T ν=1 ∂ q̇ν d ∂T − ∂qν dt ∂T ∂ q̇ν δqν dt (3.54) t2 δqν =0 t1 La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y t = t2 , con lo cual se llega a: ) Z t1 (X l ∂T d ∂T (3.55) Qν + δqν dt = 0 − ∂qν dt ∂ q̇ν t1 ν=1 Como las δqν son arbitrarias, el integrando es una función arbitraria del tiempo; si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una combinación lineal de las cantidades independientes δqν igualada a cero, l X ν=1 ∂T d Qν + − ∂qν dt ∂T ∂ q̇ν δqν = 0 Como las δqν son independientes, se debe cumplir también que: d ∂T ∂T = 0 ; ν = 1, 2, ...l − Qν + ∂qν dt ∂ q̇ν (3.56) (3.57) El principio de Hamilton y las ecuaciones de Lagrange / 65 A estas ecuaciones no podrı́amos haber llegado cuando el sistema es no holónomo. Estas ecuaciones son las correspondientes ecuaciones en cálculo funcional a las ecuaciones (3.22) del cálculo de funciones, a las cuales se reducen en el caso estático cuando las fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de la segunda clase a partir del principio de Hamilton. Supongamos que las fuerzas aplicadas se pueden descomponer en una parte derivable de un potencial monogénico y otra no derivable de tal potencial. Se entiende por potencial monogénico o potencial generalizado a una función de las coordenadas, las velocidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monogénicas del sistema, mediante las fórmulas: ∂V d ∂V (a) F~i = − + + F~i′ ; ∂~ri dt ∂~r˙ i i = 1, 2, ...N (3.58) Las fuerzas generalizadas correspondientes serán: Qν = − d ∂V ∂V + + fν ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (3.59) donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este tipo de fuerzas definir una función lagrangiana asociada a las fuerzas derivables del potencial generalizado. fν contiene las fuerzas no incluidas en L. Las ecuaciones de Lagrange toman la forma: d ∂L ∂L − + fν = 0 ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (3.60) donde L está definido como: L(q, q̇, t) = T (q, q̇, t) − V (q, q̇, t) (3.61) El lagrangiano para N partı́culas en un campo electromagnético. Sea un sistema de partı́culas cargadas en presencia de un campo electromagnético descrito por ~ r , t) y B(~ ~ r , t). La fuerza de interacción con la partı́cula i es: los campos E(~ ~ ri , t) + qi ~ri × B(~ ~ ri , t) F~i ~ri , ~r˙ i , t = qi E(~ (3.62) c Los campos eléctrico y magnético se pueden derivar de los potenciales escalar y ~ vectorial φ, A: ~ r , t) ∂φ(~r, t) 1 ∂ A(~ − ∂~r c ∂t ~ r , t) = E(~ − ~ r , t) = B(~ ∂ ~ r , t) × A(~ ∂~r Entonces F~i se puede escribir como: ∂φ(~ri , t) 1 ∂A(ri~, t) 1 ∂ ~ ri , t) F~i (~ri , ~r˙ i , t) = qi − − + r~i × × A(~ ∂~ri c ∂t c ∂~ri (3.63) (3.64) 66 / Mecánica clásica avanzada Algunas manipulaciones con el rotacional nos llevan a:5 ~ ~ ∂ ~ ri , t) = ∂ ~r˙ i · A ~ i − dAi + ∂ Ai ~r˙ i × × A(~ ∂~ri ∂~ri dt ∂t (3.65) Con lo cual (3.63) se puede escribir como: F~i ~ri , ~r˙ i , t = (3.66) Como φ no depende de ~r˙ i : F~i ~ri , ~r˙ i , t = (3.67) ∂ ∂ ˙ ~ 1 ~ ri , t) − 1 d qi − ~ri · A(~ri , t) φ(~ri , t) − ~r˙ i · A(~ ∂~ri c c dt ∂~r˙ i qi ∂ − ∂~ri 1˙ 1 d ∂ 1˙ ~ φi − ~ri · Ai φi − ~ri · Ai + c c dt ∂~r˙ i c Si se define la función V : " # N X ˙i ~ r ~ ri , t) , qi φ(~ri , t) − · A(~ V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t = c i=1 (3.68) las fuerzas de interacción con el campo electromagnético se pueden derivar del potencial monogenico V : ∂V d ∂V F~i = − + ∂~ri dt ∂~r˙ i (3.69) Entonces el lagrangiano de un sistema de partı́culas en un campo electromagnético puede escribirse como: " !# N X 1 ˙2 ~r˙ i ~ ˙ ˙ ˙ L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) = (3.70) mi~ri − qi φi − · Ai 2 c i=1 En este lagrangiano no están incluidas las fuerzas de interacción de las partı́culas entre sı́. Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial. Para muchos casos de interés se pueden escribir en la forma: F~i′ = −~k.~r˙ i (3.71) Se define la función de disipación de Rayleigh como: N 5 Ver 1X F= kx ẋ2i + ky ẏi2 + kz żi2 2 i=1 el texto Mecánica clásica de Goldstein, 1a ed, sección 1.5. ¯ (3.72) El principio de Hamilton y las ecuaciones de Lagrange / 67 Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de F: ∂F F~i = − ∂~r˙ i (3.73) La fuerza generalizada correspondiente será: Fν = N X i=1 Fi′ · N X ∂~ri ∂F ∂~r˙ i ∂F · =− =− ˙ i ∂ q̇ν ∂qν ∂ q̇ν ∂ ~ r i=1 (3.74) Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones de Lagrange toman la forma: ∂L ∂F d ∂L − + = 0; dt ∂ q̇ν ∂qν ∂ q̇ν ν = 1, 2, ...l (3.75) de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas. 3.3. Algunas propiedades de la función lagrangiana Aditividad de L. Si el sistema consta de dos partes, A y B, que no interactúan, entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde LA contiene sólo las coordenadas y velocidades de la parte A y similarmente LB . Es el caso de dos partı́culas que se mueven en presencia de un campo externo sin interactuar entre sı́. También en el caso de un sistema de partı́culas que interactúan entre sı́ pero no con un campo externo, L se puede descomponer en una parte que contiene sólo las coordenadas y velocidades del centro de masa y otra que sólo contiene las coordenadas y velocidades de las partı́culas respecto al centro de masa: no hay interacción del movimiento del centro de masa con el movimiento respecto al centro de masa. Adición a L de una derivada total respecto al tiempo de una función arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo: L′ (q, q̇, t) = L(q, q̇, t) + d f (g, t) dt (3.76) Las integrales de acción de L y de L′ tienen valores extremales simultáneamente: S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ] (3.77) Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′ dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de manera más convincente transformando las ecuaciones de Lagrange mismas.6 que eiS/h̄ es el lı́mite clásico de la función de onda Ψ. Entonces la arbitrariedad de f implica una arbitrariedad en la fase de Ψ. 6 Veremos 68 / Mecánica clásica avanzada Ejemplo 3.3.1 Sea una partı́cula libre, descrita en un sistema de referencia inercial O mediante el lagrangiano. L= 1 ˙2 m~r 2 (3.78) Si se realiza una transformación de Galileo, a un nuevo sistema de referencia inercial O′ que se mueve respecto a O con velocidad constante V~ : ~ ~υ = ~υ ′ + V (3.79) Entonces el lagrangiano en el nuevo sistema de referencia inercial será: 1 2 1 1 ~ +V ~2 (3.80) L′ = m~r˙ ′2 = m~r˙ + m −2~r · V 2 2 2 Los dos lagrangianos están relacionados ası́: d m ~ 2t L′ = L + −2~r · V~ + V (3.81) dt 2 A la función: m ~ +V ~ 2t −2~r · V (3.82) f (r, t) = 2 por razones que se verán más adelante, se le denomina “función generadora de la transformación de Galileo”. Vemos que: m ~ − 2~r2 · V ~ +V ~ 2 t2 − ~υ 2 t1 S′ = S + (3.83) 2~r1 · V 2 y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 . 3.4. Simetrı́as de la lagrangiana y teoremas de conservación Simetrı́a. Se dice que L posee una simetrı́a cuando no cambia bajo una transformación de las coordenadas y del tiempo. Por ejemplo, sea una partı́cula libre, cuyo lagrangiano esté dado por (3.78). Se le realiza un desplazamiento de la partı́cula por una cantidad arbitraria ~a, ~r → ~r + ~a (3.84) como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es simétrico bajo translaciones. Veremos que esta simetrı́a está asociada a la conservación del momento lineal. Si se realiza una rotación arbitraria de la partı́cula, digamos alrededor del eje z por un ángulo α, x → x cos α + y senα y → −x senα + y cos α z → z (3.85) El principio de Hamilton y las ecuaciones de Lagrange / 69 y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias. Veremos que esta simetrı́a está asociada con la conservación del momento angular. Si se realiza una inversión de las coordenadas, x, y, z → −x, −y, −z (3.86) y L no cambia, esto implica la conservación de la paridad: L es siempre par o impar en el transcurso del movimiento. Al aplicar un campo externo las simetrı́as de L dependerán de las simetrı́as del campo. Si el campo tiene menor simetrı́a que el lagrangiano libre, el nuevo lagrangiano tendrá la simetrı́a del campo. Supongamos que se coloca una fuerza constante y uniforme en la dirección z. L ahora será: L= 1 ˙2 m~r + Fz z 2 (3.87) Las simetrı́as de L son alteradas. Bajo la transformación de translación espacial, (3.84): L → L + Fz az (3.88) L se altera a no ser que az sea cero. Ya no habrá simetrı́a de translación a lo largo del eje z. Veremos que esto implica que sólo son constantes las componentes x y y del momento lineal. L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual actúa la fuerza), pero obviamente no tendrá simetrı́a de rotación alrededor de ningún otro eje. Antes de aplicar la fuerza, L tenı́a simetrı́a de rotación alrededor de cualquier eje (simetrı́a esférica), ahora sólo tiene simetrı́a de rotación en el eje z (simetrı́a cilı́ndrica). Esta simetrı́a implica que sólo se conserva la componente z del momento angular, en tanto que en ausencia del campo se conservan las tres componentes. En general, hay una relación entre las simetrı́as de L y las variables dinámicas que se conservan. Variables dinámicas. A cualquier función del estado del sistema y del tiempo se le llama una variable dinámica. Para un sistema con l grados de libertad las variables dinámicas son de la forma Dα (q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , t). Ejemplos de variables dinámicas son: ~ri ; P~ = mi~r˙ i ; N X i=1 mi~r˙ i ; ~li = mi~ri × ~r˙ i ; ~ = L N X i=1 mi~ri × ~r˙ i ; (3.89) T = N X 1 i=1 2 2 mi~r˙ i (3.90) Obviamente es posible definir un número infinito de variables dinámicas para un sistema dado, pero sólo hay un número de variables dinámicas independientes igual al doble del número de grados de libertad. En efecto, sólo es posible formar conjuntos de 2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q̇l , pero pueden definirse muchos conjuntos diferentes. En general las 2l variables dinámicas independientes de un sistema no son constantes de movimiento, aunque en principio siempre es posible encontrar un 70 / Mecánica clásica avanzada conjunto de 2l constantes de movimiento, si el sistema es integrable. Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema de l ecuaciones diferenciales acopladas de segundo orden con 2l incógnitas, q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , independientes entre sı́. La solución a las ecuaciones de movimiento contendrá 2l constantes de integración arbitrarias que determinan los valores iniciales de (q) y (q̇). En el capı́tulo 1 se definió la especificación del estado del sistema mecánico en un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante. Ahora vemos que las constantes de integración determinan no sólo el estado en el tiempo inicial, sino además todos los estados subsiguientes. Con sólo dar valores a t, para unos valores dados de las constantes de integración, se obtienen los valores correspondientes de las variables de estado. Las constantes de integración suministran una noción global de estado: se dice que a cada conjunto de valores de las constantes de integración le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo del movimiento, siempre puede tomarse como una de las constantes de integración. La integración de las ecuaciones de movimiento dará lugar a 2l funciones de la forma: qν = qν (c1 , c2 , ...c2l−1 , t + t0 ) (3.91) q̇ν = q̇ν (c1 , c2 , ...c2l−1 , t + t0 ) ; ν = 1, 2, ...l Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de integración en función de (q), (q̇), t: t0 = −t + θ(q, q̇) ; cα = cα (q, q̇) ; α = 1, 2, ..,2l − 1 (3.92) Por otra parte, con las 2l constantes de integración se puede obtener cualquier otro conjunto de 2l constantes independientes. En conclusión, a cualquier sistema dinámico integrable se le pueden asociar 2l funciones de (q), (q̇) y t cuya derivada total respecto a t sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico integrable siempre es posible hallar 2l constantes de movimiento independientes, o en otras palabras 2l variables dinámicas que se conservan, si es integrable. En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que pueden tomar simultáneamente valores constantes. Se dice que para un sistema cuántico de l grados de libertad hay sólo l operadores hermı́ticos independientes que conmutan entre sı́ y que tienen estados propios con valores definidos de las correspondientes variables dinámicas. Conservación de la energı́a. Se trata de mostrar que para aquellos sistemas en que L sea simétrica bajo el cambio del origen del tiempo hay una constante de movimiento que es la energı́a.7 Sea un sistema que cumple estas tres condiciones: (a) puede ser descrito completamente a partir de L, es decir, se puede definir una función V de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q̇) ni de t; (c) el sistema es tal que L no dependerá explı́citamente de t al introducir las coordenadas generalizadas y además es esclerónomo. Mediante la condición (c) se garantiza que las 7 Veremos que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E son dos cantidades canónicamente conjugadas. El principio de Hamilton y las ecuaciones de Lagrange / 71 ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que L es simétrica bajo el cambio de origen del tiempo: ∂L ∂L =0 ⇒ =0 ∂t0 ∂t (3.93) La derivada total de L respecto al tiempo es: l ∂L ∂L dL X ∂L q̇ν + q̈ν + = dt ∂qν ∂ q̇ν ∂t i=1 (3.94) De las ecuaciones de Lagrange se tiene que: ∂L d ∂L = − fν ∂qν dt ∂ q̇ν (3.95) Con lo cual (3.94) toma la forma: l ∂L dL X d ∂L q̇ν − fν q̇ν + = dt dt ∂ q̇ν ∂t ν=1 (3.96) O sea que se cumple: dL dt l X ∂L q̇ν − L ∂ q̇ν ν=1 ! = l X ν=1 fν q̇ν − ∂L ∂t (3.97) La cantidad entre paréntesis se llama la función energı́a, denotada h(q, q̇, t) con lo cual: ḣ(q, q̇, t) = l X ν=1 fν q̇ν − ∂L ∂t (3.98) De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que fν = 0 y ∂L/∂t = 0, con lo cual: h(q, q̇, t) = constante (3.99) Esta constante se llama “energı́a” o “constante de Jacobi”. La función h es igual al hamiltoniano H. La diferencia es que éste se define como una función de (q), (p), t y aquella es función de (q), (q̇) y t. Veremos que si además se cumple que V no depende de las (q̇), h coincide con la energı́a total T +V . (a) implica que el sistema es holónomo. Teorema de Euler acerca de las funciones homogéneas. Sea una función f de n variables: f (x1 , x2 , ...xn ) tal que: F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn ) (3.100) Se dice que F es una función homógenea de grado r. El teorema dice que: N X i=1 xi ∂F = rF ∂xi (3.101) 72 / Mecánica clásica avanzada La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ, d F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn ) dλ (3.102) la derivada del lado izquierdo es: n X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi ) d F (λx1 , λx2 , ...λxN ) = dλ ∂(λxi ) ∂λ i=1 (3.103) Se sigue entonces que: n X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi ) i=1 xi = λn−1 rF (x1 , x2 , ...xn ) (3.104) Haciendo ahora λ = 1 se obtiene la igualdad (3.101). Teorema acerca de la energı́a cinética de un sistema esclerónomo. Si el sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuación (2.176) la energı́a cinética puede escribirse como: N T = 1 X ˙2 mi~ri = 2 i=1 " l l 2 # l N X X ∂~ri ∂~ri X ∂~ri ∂~ri ∂~ri 1X mi · q˙ν q˙µ + 2 · q̇ν + 2 i=1 ∂qν ∂qµ ∂qν ∂t ∂t ν=1 µ=1 ν=1 (3.105) Como ~ri es función (q) y t, se sigue que T en coordenadas generalizadas toma la forma: T (q, q̇, t) = l X l X Aνµ (q, t)q̇ν q̇µ + ν=1 µ=1 l X Aν (q, t)q̇ν + A(q, t) (3.106) ν=1 O sea que T se puede escribir como la suma de tres funciones homogéneas de las velocidades generalizadas de grados 2, 1 y 0: T = T2 + T1 + T0 (3.107) Se sigue que para un sistema esclerónomo (∂~ri /∂t = 0) T (q, q̇, t) = T2 (q, q̇, t) = l X l X Aνµ (q, t)q̇ν q̇µ (3.108) ν=1 µ=1 Es decir, que la energı́a cinética es una función homogénea cuadrática en las velocidades. La función Aνµ (q, t) es simétrica: Aνµ (q, t) = Aµν (q, t) (3.109) El principio de Hamilton y las ecuaciones de Lagrange / 73 En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que para un sistema esclerónomo: l X ∂T q̇ν = 2T ∂ q̇ν ν=1 (3.110) Conservación de la energı́a total T + V. Si se cumple (b), como L = T − V se sigue que: ∂L ∂T = ∂ q̇ν ∂ q̇ν (3.111) Entonces h tomará la forma, en virtud de (3.110) y (3.111): h(q, q̇, t) = l X ∂T q̇ν − T + V = T + V ∂ q̇ν ν=1 (3.112) En este caso h coincide con la energı́a total. Las fuerzas que son derivables de un potencial que no depende de las velocidades ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q̇) cumpliéndose las otras condiciones, h es una constante de movimiento pero no es la energı́a total. Si se cumple (c) y que V no dependa de las (q̇), será cierto que h = T + V , pero h no será una constante de movimiento. En este caso: l X dE ∂L dh = = fν q̇ν − dt dt ∂t ν=1 (3.113) donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo. Si las fuerzas fν son viscosas y se pueden obtener de la función de disipación de Rayleigh, que es una función homogénea cuadrática de las velocidades, en virtud de las ecuaciones (3.72), (3.74) y (3.101), se sigue que: l X ν=1 fν q̇ν = − l X ∂F q̇ν = −2F ∂ q̇ν ν=1 (3.114) En este caso (3.113) será: ∂L dh = −2F − dt ∂t o ∂E ∂V = −2F + ∂t ∂t (3.115) En (3.115) resulta claro que la rata de cambio de la energı́a total consta de la rata de disipación de energı́a 2F y de la rata de suministro de energı́a debida a la variación temporal de V . Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energı́a total para una partı́cula cargada en presencia de un campo electromagnético. 74 / Mecánica clásica avanzada De acuerdo con la ecuación (3.70): L= 1 ˙2 q ~ m~r − qφ + ~r˙ · A 2 c (3.116) La función energı́a será: h= ∂L ˙ 1 2 · ~r − L = m~r˙ + qφ 2 ∂~r˙ (3.117) Se ve que h no es la energı́a total E = T + V , lo cual es consecuencia de que V dependa de la velocidad, h incluye sólo la energı́a potencial eléctrica. En virtud de (3.98) h será: ḣ = − ~ ∂L ∂V ∂φ q ˙ ∂ A = =q − ~r · ∂t ∂t ∂t c ∂t (3.118) O sea que en general h será constante de movimiento sólo si los campos no dependen ~ tengan una forma tal que h sea del tiempo, además del caso particular en que φ y A cero, como: q ~ E = h − ~r˙ · A c Se sigue que para un campo electromagnético estático: d q ˙ ~ − ~r · A Ė = dt c (3.119) (3.120) Es decir, E no se conserva porque el potencial magnético no es constante. Si se ~ sea uniforme, A ~ se puede aplica el campo electromagnético constante de modo que B escribir en la forma: ~ = 1B ~ × ~r A 2 (3.121) ~ es uniforme. En este caso el potencial magnético será: que satisface a (3.63) si B q ~ · (~r × ~r˙ ) = − q B ~ · ~l ~ = − q ~r˙ · (B ~ × ~r) = − q B − ~r˙ · A c 2c 2c 2mc (3.122) donde ~l es el momento angular de la partı́cula. Entonces (3.120) y (3.122) nos dan: Ė = − qB ˙ q ~ ~˙ B·l = − lB 2mc 2mc (3.123) ~ lo lB se conserva si L es simétrico bajo rotaciones alrededor del eje determinado por B, cual en general no se cumplirá; para ello basta que φ tenga simetrı́a cilı́ndrica alrededor ~ de B. Ejemplo 3.4.2 Una partı́cula está sometida al efecto de la gravedad y a la condición de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del alambre que pasa por el centro. Calcular h y Ė y analizar su significado. El principio de Hamilton y las ecuaciones de Lagrange / 75 El problema tiene un grado de libertad. Tomemos el eje z en la dirección de la fuerza de gravedad, coincidiendo con el eje de rotación. Definamos un sistema de ejes que rotan solidariamente con el alambre ası́: el eje z ′ en la dirección de la fuerza de gravedad, coincidiendo con el eje de rotación; el eje y ′ en el plano del alambre; y el eje x′ perpendicular al alambre en el centro. Las fórmulas que expresan a x, y y z en términos de x′ , y ′ y z ′ son: x = x′ cos ωt − y ′ senωt ; y = x′ senωt + y ′ cos ωt ; z = z′ (3.124) Tomemos como coordenada generalizada el ángulo que hace el vector de posición de la partı́cula con el eje z ′ y en términos del cual podemos expresar a x′ , y ′ y z ′ , puesto que x′ = 0. Entonces, mediante (3.124) obtenemos: x = −a senq senωt ; y = a senq cos ωt ; z = a cos q (3.125) El lagrangiano del problema es en consecuencia: L(q, q̇, t) = 1 ma2 (q̇ 2 + ω 2 senq) + mga cos q 2 (3.126) El lector puede verificar fácilmente que si ω 2 < g/a, la posición q = 0 es de equilibrio estable con frecuencia de pequeñas oscilaciones dada por Ω = ω 2 − g/a. Si ω 2 > g/a, la posición de equilibrio estable no es q = 0 sino algún valor de q entre 0 y π/2 con frecuencia de pequeñas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente, si ω 2 ≫ g/a, la posición de equilibrio estable será q = π/2, siendo ω la frecuencia de pequeñas oscilaciones. Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es decir, si las ligaduras son reónomas, lo cual es el caso para este problema, entonces h no será la energı́a total. De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones homogéneas, que: h = 2T2 + T1 − L = T + V − T1 − 2T0 (3.127) De (3.98) se sigue que cuando fν = 0, ∂L = Ė − Ṫ1 − 2Ṫ0 (3.128) ∂t Por tanto, si como en este ejemplo las ligaduras reónomas no dan lugar a que t aparezca en L, h será constante de movimiento pero E no lo será. En efecto, en este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos virtuales son tangentes al alambre (o sea que éste no realiza trabajo virtual), pero como un desplazamiento real de la partı́cula no coincide con una virtual, la ligadura realiza trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q̇ 2 ; T1 = 0 ; T0 = 1 2 2 2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que: ḣ = − 1 ma2 (q̇ 2 − ω 2 senq) − mga cos q (3.129) 2 la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es la energı́a total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energı́a cinética h = T2 − T0 + V = 76 / Mecánica clásica avanzada es T ′ = (1/2)ma2 q̇ 2 y la energı́a potencial consta de dos partes, la energı́a potencial gravitacional y la energı́a potencial centrı́fuga que resulta debido a que el sistema de referencia x′ , y ′ y z ′ es no inercial, es decir: T′ = 1 ma2 q̇ 2 ; 2 1 V ′ = − ma2 ω 2 senq − mga cos q 2 (3.130) En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de él se deriva la fuerza siguiente: 1 ∂V ′ F~ ′ = − ′ = maω 2 î′ + mg k̂ ′ ∂~r 2 (3.131) O sea que (1/2)maω 2 es la fuerza centrı́fuga; es como si existiera un campo gravitacional homogéneo en la dirección x′ . La energı́a total respecto a los ejes x, y y z será E y constará de dos términos: h y el trabajo realizado por el alambre. Como ḣ = 0, de (3.128) se sigue que: Ė = Ṫ1 + 2Ṫ0 = ma2 ω 2 cos q q̇ (3.132) Para pequeñas oscilaciones alrededor de q = 0, Ė es de la forma Ė= ma2 ω 3 q0 senΩt, o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energı́a total tendrá fluctuaciones periódicas. Conservación del momento lineal. Sea un sistema que cumple las siguientes condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende de alguna de las coordenadas generalizadas. Entonces se cumple: ∂L =0 ∂qν0 (3.133) donde la coordenada qν0 que no aparece en L se llama cı́clica o ignorable. La ecuación de Lagrange para la coordenada qν0 implica que: d ∂L = f0 (3.134) dt ∂ q̇ν0 O sea que si fν0 = 0 la siguiente cantidad se conserva: Pν0 ≡ ∂L = constante ∂ q̇ν0 (3.135) Se define el momento canónico conjugado a la coordenada qν ası́:8 Pν = ∂L ; ∂ q̇ν ν = 1, 2, ...l (3.136) luego, el momento canónico conjugado a una coordenada cı́clica es una constante de movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo cualquier cambio en la coordenada qν0 . 8 La palabra “canónico” viene desde de época de Hamilton; significa “de acuerdo con el canon”. Se usa ampliamente en fı́sica para designar diversos aspectos del formulismo hamiltoniano, que describe los sistemas mecánicos mediante las variables (q, p). El principio de Hamilton y las ecuaciones de Lagrange / 77 Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que px = mẋ y py = mẏ son constantes de movimiento. Como L depende de z, pz = mż no se conserva. Si qν0 es una coordenada lineal, pν0 será un momento lineal. Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cambie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las partı́culas por la misma cantidad sin cambiarles su movimiento: ~r˙ i → ~r˙ i ~ri → ~ri + ~ǫ ; (3.137) Entonces el cambio experimentado por L será: δL = N N X X ∂L ∂L · δ~ri = ~ǫ · ∂~ r ∂~ qi i i=1 i=1 (3.138) Por hipótesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan: δL = ~ǫ · N N X d X d ∂L dP~ = ~ǫ · p~i = ~ǫ · , dt ∂~r˙ i dt i=1 dt i=1 (3.139) donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial, δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario, se sigue que P~ es una constante. Si sólo hay simetrı́a de translación en determinada dirección ~ǫ se sigue que sólo se conserva la componente de P~ en la dirección de ~ǫ. Como L = T − V y T sólo depende de las velocidades de las partı́culas, ∂V ∂L =− = F~i ∂~ri ∂~ri (3.140) Entonces en (3.138) se tiene: δL = ~ǫ · N X F~i (3.141) i=1 δL será cero si el sistema no está sometido a una fuerza neta externa, es decir si el sistema está aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el centro de masa: ∂V F~CM = − =0 (3.142) ~ CM ∂R luego V no depende de RCM y ésta será cı́clica. El momento canónico conjugado de ~ CM será el momento lineal total y será una constante de movimiento: R P~CM = N X ∂L ∂L ∂~r˙ i = · ~ CM ~˙ CM r˙ i ∂ R ∂R i=1 ∂ ~ (3.143) ~ CM está dado por Como R N 1X ˙ ˙ ~ CM R = mi~ri 2 i=1 (3.144) 78 / Mecánica clásica avanzada Se sigue que: ∂~r˙ i ~ = ~1 ˙ ~ ∂ RCM (3.145) ~1 es el diádico unidad, que se representa por una matriz unidad de dimensión donde ~ 3 × 3 (véase sección 7.4). Por tanto: N N X X ∂L ∂L mi~r˙ i = P~CM = = ˙ ˙~ ∂ ~ r i ∂ RCM i=1 i=1 (3.146) Conservación del momento angular. Sea un sistema que se describe completamente a partir de un lagrangiano y además tal que no depende de alguna coordenada angular qν0 , entonces su momento canónico conjugado será un momento angular que se conserva. Por ejemplo, sea una partı́cula cuyo lagrangiano es: 1 ˙2 m~r − V (~r) (3.147) 2 Sea n̂ un eje arbitrario y δφ una rotación alrededor de ese eje (véase figura 3.3). L= n δϕ δr r r + δr θ Figura 3.3 Rotación por ángulo δφ alrededor de n̂ Supongamos que φ es una de las coordenadas generalizadas del sistema. En una rotación alrededor de n̂ bajo un ángulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector perpendicular a ~r y a n̂ y cuya magnitud es r senθ δφ. Por tanto se cumple que: δ~r = n̂ × ~rδφ (3.148) El principio de Hamilton y las ecuaciones de Lagrange / 79 y que: ∂~r = n̂ × ~r ∂φ (3.149) El momento canónico conjugado de φ será: pφ = ∂~r˙ ∂~r = m~r˙ · (n̂ × ~r) = n̂ · m~r × ~r˙ = m~r˙ · = m~r˙ · ∂φ ∂ φ̇ ∂ φ̇ ∂L (3.150) Se sigue que pφ es la componente del momento angular a lo largo de n̂. Si L no depende de φ, pφ es una constante de movimiento. Isotropı́a espacial. Sea un sistema tal que no cambia L cuando se rota como un todo alrededor de un eje n̂. Esto es, si para cada partı́cula: ~ri → ~ri + n̂ × ~ri δφ ; ~r˙ i → ~r˙ i + n̂ × ~r˙ i δφ el cambio en L será: X N N X ∂L ˙ ∂L p~˙ i · δ~ri + p~i · δ~r˙ i · δ~ri = · δ~ri + δL = ∂~ri ∂~r˙ i i=1 i=1 (3.151) (3.152) Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación cı́clica de los factores: δL = N X d n̂ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n̂δφ · ~ri × p~i dt i=1 i=1 N X (3.153) Con lo cual ~˙ δL = δφn̂ · L (3.154) ~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de donde L Lagrange: δL = N X i=1 F~i · δ~ri + p~i · δ~ri = (3.155) N N X X ~ki = δφn̂ · K ~ ~ri × F~i + ~r˙ i × p ~i = δφn̂ · δφn̂ · i=1 i=1 ~ es el torque total, por tanto: donde K ∂L ~˙ = n̂ · K ~ = n̂ · L ∂φ (3.156) Si no hay torque neto sobre el sistema entonces éste será isótropo y en consecuencia se conserva el momento angular total. Si simplemente se anula el torque en cierta dirección, L será simétrico bajo rotaciones alrededor de esa dirección y se conservará la 80 / Mecánica clásica avanzada ~ en esa dirección. componente de L Integrales de movimiento aditivas. Para un sistema aislado la energı́a total ~ y el momento lineal P~ se conservan: hay siete constantes de E, el momento angular L movimiento. Quedan aún otras 6N − 7 constantes de movimiento. Estas siete constantes de movimiento tienen la caracterı́stica de ser aditivas. Es decir, si el sistema consta de varias partes que no interactúan, cada parte tendrá valores determinados de la energı́a, el momento angular y el momento lineal totales. Las correspondientes cantidades del sistema total se pueden obtener adicionando las respectivas constantes de movimiento de las partes. 3.5. El teorema del virial Es un teorema de naturaleza estadı́stica porque se refiere a promedios temporales. Sea un sistema que: (a) la energı́a potencial es función homogénea de las coordenadas; (b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones homogéneas se sigue: N X ∂T ˙ · ~ri = 2T ∂~r˙ i (3.157) i=1 Entonces se cumple, dado que V no depende de las velocidades: N N X d X ˙ ~p˙ i · ~ri p~i · ~ri − pi · ~ri = ~ 2T = dt i=1 i=1 i=1 N X 2T = N N X d X F~i · ~ri pi · ~ri − ~ dt i=1 i=1 (3.159) si tomamos en (3.159) la media temporal a ambos lados, ası́: Z 1 τ lı́m 2T dt = τ →∞ τ 0 1 lı́m τ →∞ τ N X i=1 p~i · ~ri ! τ 0 1 − lı́m τ →∞ τ (3.158) Z 0 N τ X i=1 (3.160) F~i · ~ri dt La condición (b) conduce a la anulación del primer miembro del lado derecho, con lo cual llegamos a: 2T = − N X i=1 F~i · ~ri , (3.161) El principio de Hamilton y las ecuaciones de Lagrange / 81 donde la barra indica promedio temporal. La ecuación (3.161) se denomina el teorema del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius. Si V es función homogénea de las coordenadas, se cumple: − N X i=1 F~i · ~ri = N X ∂V i=1 ∂~ri · ~ri = kV = 2T (3.162) donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue que T + V = E. Por lo tanto se cumple que: 2T + 2V = 2E ; kT + kV = kE (3.163) De (3.162) y (3.163) se sigue que: V = 2 E; 2+k T = k E; 2+k T = k V 2 (3.164) Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1 hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un potencial del tipo r2 sólo hay movimientos acotados para E > 0. Ley de Boyle. Sea un sistema constituido por un gas de moléculas en un recipiente. En este caso N es muy grande. Si la energı́a cinética media por partı́cula es t, entonces: T = Nt (3.165) La energı́a por partı́cula está relacionada con la temperatura θ a través de la relación: 3 t = kB θ (3.166) 2 donde kB es la constante de Boltzmann. La ecuación (3.166) se obtiene del teorema de la equipartición de la energı́a, según el cual por cada grado de libertad hay una energı́a de (1/2)kθ. La fuerza sobre la partı́cula i depende de la ligadura impuesta por el recipiente: ~i F~i = F~ig + R (3.167) F~ig donde es la fuerza ejercida por todas las otras partı́culas del gas sobre la partı́cula i ~ y Ri es la fuerza ejercida por las paredes del recipiente sobre la partı́cula i. Si llamamos I a: I= N X F~ig .~ri (3.168) i=1 El virial de Clausius se descompone en dos partes: N X i=1 F~i .~ri = I + N X i=1 ~ i .~ri R (3.169) 82 / Mecánica clásica avanzada ~ i actúan sólo cuando la partı́cula i choca con las paredes del recipiente. Las fuerzas R Estas fuerzas representan la reacción del muro a la colisión ejercida por los átomos sobre la pared. Esto es lo que se denomina la reacción a la presión P que ejerce el gas sobre el recipiente. PN ~ En un tiempo t dado, en i=1 R ri sólo contribuyen los términos correspondientes i ·~ a las partı́ulas que en ese instante chocan con las paredes del recipiente. Podemos dividir el área de las paredes en elementos infinitesimales de área dA. Todas las dN partı́culas que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que llamaremos ~r. La contribución de las dN partı́culas a la sumatoria será aproximadamente ~ dN · ~r, donde R ~ es la fuerza que ejerce el elemento de área sobre cada una de las dN R ~ dN = dR, ~ entonces tenemos que: partı́culas que inciden sobre ella. Si llamamos R N X i=1 ~ i · ~ri = R Z ~ ~r · dR (3.170) ~ en términos de la Si n̂ es un vector normal a la superficie, podemos escribir a dR presión de la siguiente manera: ~ = −n̂P dA dR (3.171) Como la presión es constante escribimos: N X i=1 ~ i · ~ri = −P R Z n̂ · ~r dA (3.172) Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de superficie a una integral de volumen: Z Z ~ ∇ · ~rdV = 3V (3.173) ~r · dS = V S Entonces: N X i=1 ~ i · ~ri = −3P V R (3.174) Como esta cantidad no depende del tiempo se sigue que: N X i=1 F~i · ~ri = I − 3P V (3.175) En virtud del teorema del virial, que es válido en este caso porque el movimiento es acotado, y usando (3.162) y (3.166) se sigue que: 3N KB θ = −I + 3P V (3.176) Llegándose a la ecuación de estado para un gas real: 1 P V = N KB θ + I 3 (3.177) El principio de Hamilton y las ecuaciones de Lagrange / 83 El término (1/3)I es una medida de la separación de la ecuación de estado del gas real respecto al ideal en el cual no se consideran los efectos de interacción entre las moléculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el recipiente. 84 / Mecánica clásica avanzada 4 La formulación hamiltoniana 4.1. Las variables hamiltonianas de estado En el formalismo lagrangiano el estado de un sistema mecánico holónomo con l grados de libertad se describe por medio de las qν y q̇ν . Por medio de la función L(q, q̇, t) se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las variables (q, q̇, t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados canónicamente conjugados a las coordenadas generalizadas qν definidos por: pν = ∂L(q, q̇, t) ; ∂ q̇ν ν = 1, 2, ...l (4.1) Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) constituyen las fórmulas de transformación de las variables (q, q̇, t) a las variables (q, p, t). En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q̇ν . En principio se pueden expresar las (q̇) en términos de las (p) por la transformación inversa: q̇ν = Φν (q, p, t) ; ν = 1, 2, ...l (4.2) Es claro que el estado del sistema puede ser descrito indistintamente por las variables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformación (q, q̇, t) → (q, p, t). Según (3.106) y (3.107) T se puede escribir como: T = T2 + T1 + T0 (4.3) Si V no depende de las (q̇), pν = l X ∂T ∂L = = Aνµ q̇µ + Aν ; ∂ q̇ν ∂ q̇ν µ=1 ν = 1, 2, ...l (4.4) Mediante este sistema de ecuaciones lineales podemos expresar a (q̇) en términos de (p): q̇ν = l X bνµ pµ + bν ; ν = 1, 2, ...l µ=1 85 (4.5) 86 / Mecánica clásica avanzada Si V depende de las (q), (q̇) en la forma: V (q, q̇, t) = l X Πν (q, t)q̇ν + Π(q, t) (4.6) ν=1 que serı́a por ejemplo la forma que tomarı́a el potencial electromagnético (3.68) al ser expresado en coordenadas generalizadas, entonces pν será: pν = l X µ=1 Aνµ q̇µ + Aν − Πν ; ν = 1, 2, ...l (4.7) Notación. Usaremos L para denotar a T −V , expresada en función de las variables lagrangianas. Es claro que al expresarla en términos de las variables hamiltonianas la función es diferente, aunque a veces, sin mucho rigor, se le escribe también como L. Lo correcto es: L(q, q̇, t) = L [q, q̇(q, p, t), t] = L(q, p, t) (4.8) Ejemplo 4.1.1 Sea el lagrangiano: 1 2 ~ r , t) − Π(~r, t) L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~ 2 (4.9) El momento canónico será: p= ~ ~ ∂L ~ ⇒ ~r˙ = p~ + Π = m~r˙ − Π ˙ m ∂~r (4.10) Con lo cual: L(~r, p~, t) = ~2 ~2 − Π p −Π 2m (4.11) La función hamiltoniana. Se definió en (3.97) la función energı́a como: h(q, q̇, t) = l X ∂L(q, q̇, t) q̇ν − L(q, q̇, t) ∂ q̇ν ν=1 (4.12) A la función energı́a expresada en términos de las variables hamiltonianas se le llama la función hamiltoniana: H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] = l X ν=1 pν q̇ ν − L(q, p, t) (4.13) Los generadores de la transformación de Legendre. Sea X(x1 , x2 , ...xn ; α1 , α2 , ... αm ) una función que “genera” la siguiente transformación de variables (x1 , x2 , ...xn ) → (y1 , y2 , ...yn ): yi = ∂X ; ∂xi i = 1, 2, ...n (4.14) La formulación hamiltoniana / 87 entonces existe una transformación de las variables y1 , y2 , ...yn a las variables x1 , x2 , ...xn , la transformación inversa, “generada” por cierta función Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ): xi = ∂Y ; ∂yi i = 1, 2, ...n (4.15) Demostremos que las funciones X y Y están relacionadas por la fórmula: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X i=1 (4.16) xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm ) En efecto, es posible expresar las variables xi en términos de las yi : xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ; i = 1, 2, ...n (4.17) Con lo cual escribimos (4.16) como: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X k=1 (4.18) yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm ) Entonces: n X ∂Y = ∂yi k=1 ∂fk yk + fk δik ∂yi n X ∂fk k=1 ∂fk yk − yk ∂yi ∂yi − n X ∂X ∂fk = ∂fk ∂yi k=1 (4.19) + fi = xi Demostremos el siguiente teorema: ∂X ∂Y =− ; ∂αi ∂αi i = 1, 2, ...m (4.20) Para evaluar ∂y/∂αi usemos la ecuación (4.18): n n k=1 k=1 X ∂fk X ∂X ∂fk ∂X ∂Y = yk − − ∂αi ∂αi ∂fk ∂αi ∂αi (4.21) En virtud de (4.14), los términos de la sumatoria se cancelan, con lo cual queda demostrado el teorema. Una transformación de este tipo es llamada transfomación de Legendre (1752-1833). En sı́ntesis, las fórmulas caracterı́sticas de una transformación de Legendre son: X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm ) (4.22) 88 / Mecánica clásica avanzada Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) yi = ∂X ; ∂xi Y = X k xi = ∂Y ; ∂yi xk yk − X ; (4.23) i = 1, 2, ...n ∂X ∂Y =− ; ∂αi ∂αi (4.24) i = 1, 2, ...m (4.25) Las ecuaciones de movimiento hamiltonianas. La transformación de las variables lagrangianas a las hamiltonianas es una transformación de Legendre generada por la función L. Aquı́ las q̇ν hacen el papel de las xi , el conjunto (q), t, hace el papel de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos que H es Y : H(q, p, t) = l X ν=1 pν q̇ν − L(q, q̇, t) (4.26) Es decir, L genera la transformación (q̇) → (p) y H genera la transformación inversa (p) → (q̇): q̇ν = ∂H(q, p, t) ∂pν (4.27) De las ecuaciones (4.20) se sigue inmediatamente que: ∂H ∂L =− ; ∂qν ∂qν ν = 1, 2, ...l (4.28) ∂H ∂L =− ∂t ∂t (4.29) teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de Lagrange se sigue que: ∂L d ∂L = − fν = ṗ − fν ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (4.30) Las ecuaciones (4.27) a (4.30) nos dan: q̇ν = ∂H ; ∂pν p˙ν = − ∂H + fν ; ∂qν ν = 1, 2, ...l (4.31) Las ecuaciones (4.31) se denominan las ecuaciones canónicas de Hamilton y constituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues el primer conjunto sólo proporciona la transformación inversa a pν = ∂L/∂ q̇ν . La formulación hamiltoniana / 89 La función hamiltoniana. H no sólo permite escribir las ecuaciones de movimiento sino que tiene significado fı́sico directo. Veamos qué es Ḣ: l X ∂H ∂H ∂H Ḣ = q̇ν + ṗν + ∂q ∂p ∂t ν ν ν=1 = l X [(fν − ṗν ) q̇ν + q̇ν ṗν ] + l X fν q̇ν + ν=1 = ν=1 ∂H ∂t (4.32) ∂H ∂t Si las ligaduras reónomas no dan lugar a que t aparezca en H y el potencial no depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial, se sigue que Ḣ = 0, o sea que H es una constante de movimiento. Si además las fuerzas son derivables de un potencial que no depende de las velocidades, sabemos de (3.112) que H = T + V . O sea que bajo estas condiciones la energı́a total E = T + V se conserva, de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no depende de (q̇) ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se cumple que ∂H/∂t = 0 y que H = T + V . En este caso: l d(T + V ) X dE = = fν q̇ν dt dt ν=1 (4.33) Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan trabajo sobre el sistema. Si estas son nulas, la energı́a total se conserva. Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas dan lugar a que t aparezcan en H, dH ∂H = dt ∂t (4.34) Ejemplo 4.1.2 Usando la transformación de Legendre inversa, derivar las ecuaciones de movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas. Supongamos que fν = 0. Las ecuaciones de movimiento serán: q̇ν = ∂H ; ∂pν ṗ = − ∂H ; ∂qν ν = 1, 2, ...l (4.35) La transformación de Legendre inversa es (p) → (q̇) y está generada por H: q̇ν = ∂H(q, p, t) ; ∂pν ν = 1, 2, ...l (4.36) El generador de la transformación (q̇) → (p) es L: L(q, q̇, t) = l X ν=1 q̇ν pν − H(q, p, t) (4.37) 90 / Mecánica clásica avanzada En virtud del teorema dado por (4.20): ∂L ∂H =− ; ∂qν ∂qν ν = 1, 2, ...l ; ∂L ∂H =− ∂t ∂t (4.38) O sea: ∂L = ṗν ; ∂qν ν = 1, 2, ...l (4.39) Como L genera la transformación (q̇) → (p) pν = ∂L ; ∂ q̇ν ν = 1, 2, ...l (4.40) Con lo cual llegamos a las ecuaciones de Lagrange: d ∂L ∂L = ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (4.41) Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p), (ṗ) y t obtenidas mediante una transformación de Legendre. El generador de la transformación (q) → (−ṗ) es H: −ṗν = ∂H ; ∂qν ν = 1, 2, ...l (4.42) Entonces el generador de la transformación (−ṗ) → (q) será cierta función L′ (p, ṗ, t) dada por: L′ (p, ṗ, t) = l X (−ṗν )qν − H(q, p, t) (4.43) ν=1 En virtud del teorema (4.20): ∂L′ ∂H =− ; ∂pν ∂pν ν = 1, 2, ...l; ∂L′ ∂H =− ∂t ∂t (4.44) Como en virtud de las ecuaciones de Hamilton: ∂H = q̇ν ; ∂pν ν = 1, 2, ...l (4.45) y debido a que L′ genera la transformación (−ṗ) → (q) −qν = ∂L′ ; ∂ ṗν ν = 1, 2, ...l (4.46) Se sigue de (4.44), (4.45) y (4.46) que: d ∂L′ ∂L′ = −q̇ν = ; ∂pν dt ∂ ṗν ν = 1, 2, ...l (4.47) La formulación hamiltoniana / 91 Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (ṗ) son: ∂L′ (p, ṗ, t) d ∂L′ (p, ṗ, t) − = 0; ∂pν dt ∂ ṗν ν = 1, 2, ...l (4.48) Esta es la representación de momentos, que nos dice que mediante las variables (p), (ṗ) es posible describir completamente el sistema. Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para una partı́cula de masa m en el potencial V = −k/r (r distancia del origen a la partı́cula). L=T −V = 1 2 k mṙ + 2 r (4.49) L es esféricamente simétrico, luego se conserva el momento angular ~l = m~r × ~r˙ : ~l es constante en magnitud y dirección. Entonces ~r y ~r˙ son perpendiculares a ~l y en consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares en el plano del movimiento, con lo cual: L= k 1 m(ṙ2 + r2 φ̇2 ) + 2 r (4.50) El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos ecuaciones de Lagrange: mr̈ − mrφ̇ + k =0 y r2 mr2 φ̇ = constante (4.51) Como ~l vale: ~l = m~r × ~r˙ = mr2 φ̇k̂ (4.52) donde k̂ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52) que: mr̈ − k l2 + 2 =0 mr3 r (4.53) La anterior es una ecuación que permite hallar a r(t) para l dado. Una vez conocido r(t), tenemos que φ(t) se determina al integrar: φ̇ = l mr2 (4.54) Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformación: pr = ∂L = mṙ ; ∂ ṙ pφ = ∂L = mr2 φ̇ = l = constante ∂ φ̇ (4.55) 92 / Mecánica clásica avanzada El hamiltoniano será: H(r, φ, pr , pφ ) = pr ṙ + pφ φ̇ − L = p2φ p2r 1 + 2 − m m r 2 p2φ p2r 2 + r m2 m2 r 4 ! − k r (4.56) Con lo cual: H= p2φ p2r k − =T +V + 2m 2mr2 r (4.57) Las ecuaciones de Hamilton serán: ṙ = − φ̇ = ∂H pr = ; ∂pr m pφ ∂H = ; ∂pφ mr2 ṗr = − p2φ k ∂H =− 3 + 2 ∂r mr r (4.58) ∂H ṗφ = − =0 ∂φ Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la transformación inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha, se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamiltoniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere. Notamos que φ es cı́clica tanto en L como en H. En consecuencia pφ se conserva. H presenta las mismas simetrı́as que L y por tanto tiene los mismos teoremas de conservación. Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una partı́cula en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω . En el sistema de ejes espaciales: 1 L ~r, ~r˙ = m~r˙2 − V (~r) 2 (4.59) Si instantáneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que: ~r = ~r ~r˙ = ~r˙ + ~ ω × ~r (4.60) donde ~r es el vector de posición de la partı́cula respecto a los ejes rotantes y ~r˙ su velocidad en esos ejes. Entonces usando la transformación (4.60), (4.59) tomará la forma: 1 2 2 ˙ ˙ ˙ ~ ~ ~ ~ ~ ~ − V ~r L r, r = m r + 2r · ~ω × r + ~ω × r (4.61) 2 Las componentes del momento canónico son: px = ∂L ... ∂ ẋ (4.62) La formulación hamiltoniana / 93 O vectorialmente: ~p = ∂L = m ~r˙ + ~ ω × ~r ∂~r˙ (4.63) La velocidad expresada en términos del momento es: ~ ~r˙ = p − ~ ω × ~r m (4.64) El lagrangiano (4.61) en términos de las variables hamiltonianas es: 1 p2 L ~r, ~p = − V ~r 2m (4.65) El hamiltoniano será: H ~r, ~p = X ν pν q̇ ν − L = ~p · ~p − ~ω × ~r m Con lo cual: H= 1 p2 ~ ω × ~r + V ~r −p· ~ 2m ! − 1 p2 + V ~r 2m (4.66) (4.67) ˙ H es: En términos de ~r y ~r, h= 2 1 ~˙ 2 1 mr − m ~ ω × ~r + V ~r 2 2 (4.68) Nótese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término m(~ω × ~r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De acuerdo con (3.124), h es T + V sólo si T es función cuadrática de las velocidades, en tanto que en este caso hay en T términos de las formas T1 y T0 . T2 = 1 2 mṙ 2 T1 = m~r˙ · (~ ω × ~r ) T0 = (4.69) 1 m(~ ω × ~r)2 2 h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126): Ė = Ṫ1 + 2Ṫ0 (4.70) Vemos que T1 + 2T0 actúan como un trabajo sobre el sistema que hace que E no sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en este caso la transformación ~r → ~r depende del tiempo debido a la rotación, con lo cual la transformación es de tipo reónomo. T1 + 2T0 es un potencial “ficticio” inercial. T1 94 / Mecánica clásica avanzada está asociada con la fuerza de Coriolis y T0 con la fuerza centrı́fuga. H puede escribirse como: H= p2 −~ ω · ~r × ~p + V ~r 2m (4.71) en términos de ~l = ~r × ~p se escribe como: H= p2 −~ ω · ~l + V ~r 2m (4.72) como ~r depende explı́citamente del tiempo, es de esperarse que ~l no se conserve. Las ecuaciones de movimiento son: ∂H ~ ∂V = p × ~ω − ∂~r ∂~r ~p˙ = − ~r˙ = ~p ∂H = − ~ω × ~r m ∂~p (4.73) Como suponemos a ~ω constante, ~p × ~ω ~˙ 1 ∂V ~¨r = p − ~ − ~ω × ~r ω × ~r˙ = − m m m ∂~r (4.74) Expresando en (4.74) a ~p en términos de ~r˙ obtenemos: 1 ∂V ~¨r + 2~ ω × ~r˙ + ~ ω × ~ω × ~r = − m ∂~r (4.75) Vemos que la fuerza en el sistema rotante no es masa por aceleración, sino que tiene dos términos adicionales, el centrı́fugo y el de Coriolis, que caracterizan el movimiento de una partı́cula descrito desde un sistema de referencia no inercial. 4.2. Simetrı́as y el teorema de conservación Una coordenada cı́clica en L también es cı́clica en H. En efecto, de las ecuaciones de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que: ∂L ∂qν ṗν = fν + ṗν = ∂H ; fν − ∂qν (4.76) ν = 1, 2, ...l Con lo cual siempre se cumple: ∂L ∂H =− ; ∂qν ∂qν ν = 1, 2, ...l (4.77) La formulación hamiltoniana / 95 que en realidad es una propiedad general de la transformación de Legendre (q̇) → (p) según (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relación entre simetrı́as y teoremas de conservación se aplican directamente en el formalismo hamiltoniano. De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo explı́citamente (o, de (4.29), cuando L no contiene el tiempo explı́citamente): dH ∂H =− =0 dt ∂t (4.78) Además, si la transformación a coordenadas generalizadas no contiene el tiempo explı́citamente y V no depende de las velocidades, H = T + V = E, o sea que la energı́a se conserva. Si H no depende de t pero hay fuerzas disipativas: l X dA dH = fν q̇ν = dt dt ν=1 (4.79) Si además H = T + V = E, se sigue: dA dE = dt dt (4.80) Si la transformación de coordenadas depende del tiempo explı́citamente, V no depende de (q̇) y fν = 0, T = T0 + T1 + T2 (4.81) entonces se sigue que: pν = 2 l X Aµν q̇µ + Aν ; ν = 1, 2, ...l (4.82) µ=1 con lo cual H = T2 − T0 + V = E − T1 − 2T0 (4.83) la H anterior en general no se conserva. Simetrı́as de cambio de escala. Supongamos que el sistema es conservativo, de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas independientes. La simetrı́a de cambio de escala se da en una clase restringida de sistemas: aquellos en los cuales la energı́a potencial V es una función homogénea de grado k: V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN ) (4.84) En coordenadas cartesianas T no depende de las coordenadas y es una función homogénea cuadrática de las velocidades: ˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N ) T (λ~r˙1 , λ~r˙2 , ...λ~rN (4.85) 96 / Mecánica clásica avanzada Supongamos la siguiente transformación de cambio de escala en las longitudes y tiempos: ~ri t → α~ri ; i = 1, 2, ...N (4.86) → βt Entonces: V → αk V ; T → 2 α T β (4.87) El cambio en H será: 2 α T + αk V H→ β (4.88) H será función homogénea de grado k bajo la transformación (4.86) si: α2 = αk ; β2 H → αk H (4.89) Esta transformación no cambia la forma de las ecuaciones de Hamilton: α2 1 β 2 ∂H α 1 ∂H → ~r˙ i = ; ~r˙ i = m ∂~r˙ i β m α ∂~r˙ i β i = 1, 2, ...N α2 α ∂H β 2 ∂H → m 2 ~¨r i = m~¨ri = − ∂~ri β α ∂~ri (4.90) (4.91) Esta transformación pertenece a la clase de las transformaciones canónicas, o sea a las transformaciones que no cambian la forma de las ecuaciones canónicas. La ecuación (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos t por t′ = βt, el sistema tendrá simetrı́a de cambio de escala si α y β son tales que se cumple (4.89), β = α1−k/2 , o sea si la transformación en longitudes y tiempos cumple: ′ 1−k/2 t′ l (4.92) = t l La ecuación (4.92) permite obtener algunas simples relaciones entre los perı́odos de oscilación de sistemas periódicos que sólo difieren entre sı́ por sus dimensiones caracterı́sticas y para los cuales V sea función homogénea. Para el péndulo simple, donde el potencial mgz es función homogénea de grado 1: r t′ l′ = , (4.93) t l como se ve, es general; vale no sólo para pequeñas oscilaciones. La formulación hamiltoniana / 97 Para el oscilador armónico simple V es función homogénea de grado k = 2. En este caso: t′ =1 t (4.94) Nos dice que el perı́odo del movimiento no depende de la amplitud. Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces: t′ = t ′ 3/2 l l (4.95) En este caso la longitud caracterı́stica es la distancia media al sol. La ecuación (4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente. Una transformación canónica se refiere sólo a transformaciones de las coordenadas y momentos, pero no del tiempo. Sin embargo, la transformación (4.86), cuando las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transformación canónica ~ri → α~ri ; ~ pi → (α/β)~ pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse transfomación de semejanza mecánica. 4.3. La segunda forma del principio de Hamilton La segunda forma del principio de Hamilton es simplemente el principio variacional del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras palabras, se busca hallar qué principio variacional conduce a las ecuaciones de Hamilton como ecuaciones de Euler-Lagrange, en el espacio de fases: Z x2 ∂f d ∂f − =0 (4.96) f (y, y ′ , x)dx = 0 implica que δ ′ dx ∂y ∂y x1 Sea la función: L̃(q, p, q̇, ṗ, t) = l X ν=1 pν q̇ν − H(p, q, t) (4.97) L̃ es función de las variables señaladas tomadas independientemente. En particular (p) y (q̇) toman todos los valores compatibles con las ligaduras, independientemente de que se puedan relacionar mediante una transfomación de Legendre. Sea ahora el siguiente principio variacional en el espacio de fases: δ Z t2 L̃(q, p, q̇, ṗ, t) dt = 0 (4.98) t1 Con las condiciones en los extremos: δpν = 0 , δqν = 0 en t = t1 y t = t2 ; ν = 1, 2, ...l (4.99) 98 / Mecánica clásica avanzada Las ecuaciones correspondientes de Euler-Lagrange son: d ∂ L̃ ∂ L̃ − = 0; dt ∂ q̇ν ∂qν ν = 1, 2, ...l d ∂ L̃ ∂ L̃ − = 0; dt ∂ ṗν ∂pν ν = 1, 2, ...l (4.100) Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones canónicas de Hamilton. L̃ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe cumplir que: pν = ∂L ∂ q̇ν ν = 1, 2, ...l (4.101) El espacio de fases. La formulación lagrangiana está definida en el espacio de configuración l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql . Matemáticamente, el espacio de configuración puede considerarse como una variedad diferenciable de l dimensiones. El espacio de los momentos generalizados también es l dimensional y está constituido por los p1 , p2 , ...pl y se llama espacio de los momentos, que también es una variedad diferenciable de l dimensiones. Como sabemos, el estado del sistema puede describirse igualmente por (q, q̇) o por (p, ṗ), o por dos puntos del espacio de configuración o el de momentos respectivamente. q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable 2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y cada trayectoria de fases representa un estado de movimiento del sistema. En efecto, las variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema. Ejemplo 4.3.1 Sea una partı́cula de masa m sometida a la condición de ligadura de moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases. Tomando el eje z a lo largo del eje del cilindro, la condición de ligadura se puede expresar por: x2 + y 2 = R2 (4.102) Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ángulo en el plano perpendicular al eje del cilindro. Entonces L(θ, θ̇, z, ż) será: 1 1 m(R2 θ̇2 + ż 2 ) − k(R2 + z 2 ) 2 2 Los momentos canónicos son: L=T −V = pθ = mR2 θ̇ ; pz = mż (4.103) (4.104) El hamiltoniano será: H =T +V = 1 p2θ p2z + kz 2 + 2 2m 2mR 2 (4.105) La formulación hamiltoniana / 99 donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton e integrándolas se llega a la solución: θ = θ0 + at z = z0 sen (4.106) r k t+δ m ! (4.107) donde θ0 , a, z0 y δ son constantes de integración. Las ecuaciones (4.106) y (4.107) permiten hallar la ecuación de la trayectoria en el espacio de configuración: ! r 1 k θ+φ , (4.108) z = z0 sen a m p gráficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω = k/m obtenemos: ω (4.109) θ = at ; z = z0 sen ωt ; z = z0 sen θ a x R –R m z –z0 z0 R y –R w=a Figura 4.1 Partı́cula constreñida a moverse sobre la superficie de un cilindro La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de configuración siempre será cerrada cuando ω/a sea un número racional. La proyección del movimiento sobre el eje z es armónica simple y sobre el plano x − y es circular uniforme. Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz . Como pθ es constante, pθ = mR2 a, basta representar la proyección del espacio 4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyección de la trayectoria de fases sobre pθ es un punto. El movimiento en z es armónico simple. El diagrama de fases ż, z, es una elipse. Igualmente la proyección de la trayectoria de fases sobre el plano z, pz será una elipse. El 100 / Mecánica clásica avanzada diagrama de fases θ̇, θ, es una lı́nea recta, como también la proyección de la trayectoria de fases sobre el plano θ, pθ . La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es una hélice elı́ptica. Esto es representado en la figura 4.2. pz Ez = cte pθ pθ = cte θ z pθ = mR2a pz2 1 Ez = + kz 2 zm i2 pθ pz pθ = cte θ z Superficie Ez = cte Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo: Proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz . Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el espacio de configuración es aquella para la cual la integral de acción es extremal: # Z t2 "X Z t2 l ∂L L(q, q̇, t) dt = δ δ q̇ν − h(q, q̇, t) dt = 0 ∂ q̇ν t1 t1 ν=1 (4.110) {δqν (t1 ) = δqν (t2 ) = 0} En tanto que el principio de Hamilton en el espacio de fases (segunda forma del principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella para la cual es extremal la integral sobre dt de L̃ (véase figura 4.2): δ Z t2 L̃(q, q̇, p, ṗ, t) dt = δ Z l t2 X t1 ν=1 t1 [pν q̇ν − H(q, p, t)] dt = 0 δqν (t1 ) = δqν (t2 ) = 0 δpν (t1 ) = δpν (t2 ) = 0 (4.111) La formulación hamiltoniana / 101 4.4. Las transformaciones puntuales. Las transformaciones en el espacio de fases Puntuales son las transformaciones de un sistema de coordenadas generalizadas a otro: qν → q ν = q ν (q, t) ; ν = 1, 2, ...l (4.112) Las velocidades generalizadas se transforman como: q̇ µ = l X ∂q ν ∂q q̇µ + ν = q̇ ν (q, q̇, t) ; ∂qµ ∂t ν=1 ν = 1, 2, ...l (4.113) Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamilton son covariantes. Transformaciones en el espacio de fases. Son transformaciones más generales que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente para describir el estado. Un cambio de variables en el espacio de fases involucra no sólo las coordenadas generalizadas sino también los momentos: qν , pν → q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (4.114) Ejemplo 4.4.1 Un oscilador armónico unidimensional. El espacio de fases es bidimensional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases una transformación a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton en esas variables (véase figura 4.3). Nota: es irrelevante reemplazar a px por px /mω. La transformación a coordenadas polares está dada por: p2x = r2 m2 ω 2 px tan φ = mωx x+ (4.115) (4.116) Entonces H se transforma ası́: H= p2x 1 p2 1 1 + mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2 2m 2 2 m ω 2 (4.117) Es decir, el nuevo hamiltoniano es: 1 mω 2 r2 2 Las ecuaciones de Hamilton se transforman ası́: ∂H ∂r ∂H ∂φ ∂H = + ẋ = ∂px ∂r ∂px ∂φ ∂px H= ∂H px 1 ∂H = + ∂r m2 ω 2 r ∂φ mωx sec2 φ (4.118) (4.119) 102 / Mecánica clásica avanzada px / mω r ϕ x Figura 4.3 Espacio de fases para el oscilador armónico unidimensional ṗx = − ∂H ∂x =− =− ∂H ∂φ ∂H ∂r + ∂r ∂x ∂φ ∂x −px ∂H x ∂H + ∂r r ∂φ mωx2 sec2 φ (4.120) Se obtiene entonces para ∂H/∂px y ∂H/∂x: ∂H ∂H senφ ∂H cos φ = + ∂px ∂r mω ∂φ mωr (4.121) ∂H ∂H ∂H sen φ = cos φ − ∂x ∂r ∂φ r Por otra parte se tiene para ẋ y ṗx : ẋ = ∂x ∂x φ̇ = cos φ ṙ − r senφ φ̇ ṙ + ∂r ∂φ (4.122) ṗx = ∂px ∂px φ̇ = mω senφ ṙ + mωr cos φ φ̇ ṙ + ∂r ∂φ o sea que las ecuaciones de Hamilton se transforman en: cos φ ṙ − r senφ φ̇ = ∂H senφ ∂H cos φ + ∂r mω ∂φ mωr (4.123) La formulación hamiltoniana / 103 mω senφ ṙ + mωr cos φ φ̇ = − ∂H ∂H senφ cos φ + ∂r ∂φ r (4.124) Podemos resolver simultáneamente a (4.123) y (4.124) para ṙ y φ̇. El resultado se obtiene fácilmente con notación matricial: ṙ cos φ −senφ = senφ cos φ rφ̇ ∂H senφ cos φ ∂r 1 1 ∂H mω − cos φ senφ r ∂φ (4.125) Esto se puede escribir también como: ṙ cos φ senφ cos φ −senφ = −senφ cos φ senφ cos φ rφ̇ ∂H cos φ +senφ senφ cos φ ∂r 1 mω 1 ∂H −senφ cos φ − cos φ senφ r ∂φ De donde: ∂H ṙ 0 1 ∂r = 1 mω 1 ∂H −1 0 rφ̇ r ∂φ (4.126) 1 ∂H 1 r ∂φ = mω ∂H − ∂r (4.127) Con lo cual las ecuaciones de movimiento en las nuevas variables son: r= 1 ∂H ; mωr ∂φ φ̇ = − 1 ∂H mωr ∂r (4.128) Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma forma que las ecuaciones canónicas (no son r = ∂H/∂φ; φ̇ = −∂H/∂r, por ejemplo). En general, una transformación de variables en el espacio fásico cambia la forma de las ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay una transformación canónica en términos de (r, φ). Hagamos ahora el nuevo cambio de variables: (r, φ) → (r2 , φ) (4.129) 104 / Mecánica clásica avanzada Si llamamos ρ = r2 , tenemos que: ∂H ∂H = 2r ; ∂r ∂ρ ρ̇ = 2r ṙ (4.130) O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de (4.128) y (4.130), son: mω ∂H ρ̇ = ; 2 ∂φ φ̇ = − 2 ∂H mω ∂ρ Notemos finalmente que si llamamos q, p, a: mω q = −φ ; p = ρ 2 (4.131) (4.132) las ecuaciones (4.131) se convierten en: ṗ = − ∂H ; ∂q q̇ = ∂H ∂p (4.133) O sea que la transformación en el espacio fásico bidimensional definida por: r √ 2p cos q ; x= px = − 2ωp senq mω (4.134) 2 mω p p x p= x2 + 2x 2 ; q = −tan−1 2 m ω mωx deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del anterior simplemente expresando a x y px en función de q y p mediante las fórmulas (4.134): H = (q, p) = H [x(q, p), px (q, p)] (4.135) Se dice entonces que la transformación (4.134) es canónica. La referencia hecha en el enunciado al oscilador armónico no es importante, pues la covariancia de las ecuaciones de Hamilton bajo la transformación (4.134) no depende de la forma de H, siendo aplicable a cualquier sistema de un grado de libertad. En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton bajo una transformación arbitraria en el espacio de fases, (q, p) → (q, p), se responde que no necesariamente son covariantes. Pero existe una clase de transformaciones para las cuales esto se cumple; tales transformaciones se llaman canónicas o de contacto. La transformación empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de transformaciones canónicas. Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio de fases bidimensional. Mostrar que tal transformación es canónica sólo si al nuevo hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformación y el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta función F (q, q, t). Mostrar que F satisface una ecuación diferencial parcial si se anula el nuevo hamiltoniano, lo cual es posible para un oscilador armónico. La formulación hamiltoniana / 105 Las fórmulas de la transformación y su inversa son: p q = q cos at + sen at ; p = −cq sen at + p cos at c q q = q cos at − sen at ; p = cq sen at + p cos at c donde a y c son parámetros de la transformación que permanecen constantes. Es simple probar que: q̇ q̇ cos at −sen at = ṗ ṗ sen at cos at c c q −sen at − cos at +a p cos at −sen at c y que: ∂H ∂H cos at −sen at ∂p ∂p = 1 ∂H 1 ∂H sen at cos at − − c ∂q c ∂q Igualando los lados derechos de (4.137) y (4.138) obtenemos: ∂H q q̇ 0 −1 ∂p = + a p 1 ∂H q̇ 1 0 − c c c ∂q (4.136) (4.137) (4.138) (4.139) Las ecuaciones de movimiento para las variables q y p son: a ∂H = q̇ − p ; ∂q c ∂H = −ṗ − acq ∂q (4.140) Estas ecuaciones serán de forma canónica solamente si se cambia el nuevo hamiltoniano:1 2 p 1 (4.141) H(q, p) = H [q(q, p), p(q, p)] + a + cq 2 2 c Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en términos de q, q: q − q cos at p = ; c sen at 1 En p −q + q cos at = c sen at (4.142) general una transformación dependiente del tiempo es canónica si H es igual a H más ciertos términos adicionales. 106 / Mecánica clásica avanzada Si F es la función de q, q y t siguiente: F (q, q, t) = c 2qq − (q 2 + q 2 ) cos at 2 sen at (4.143) Comparando a (4.142) y (4.143) vemos que: p= ∂F (q, q, t) ; ∂q p=− ∂F (q, q, t) ∂q (4.144) Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de transformación (4.136), se dice que F es la función generatriz de la transformación, que será canónica solamente si el nuevo hamiltoniano es: H =H+ ∂F ∂t (4.145) puesto que, ∂F (q, q, t) −2qq cos at + q 2 + q 2 ca = ca = 2 ∂t 2 sen at 2 p2 2 q + 2 c (4.146) Los anteriores resultados valen para cualquier sistema de un grado de libertad. Para un oscilador armónico encontramos que: k 2 1 c2 p2 H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at 2m 2 2 m (4.147) p2 k c 1 k q p sen at cos at + sen2 at + − − m c 2 c2 m Si escogemos el valor de c tal que: c2 = km (4.148) Obtenemos que: H(q, p) = k q2 a p2 + q 2 + ( + cq 2 ) 2m 2 2 c (4.149) H será cero solamente si a y c cumplen: 1 a + = 0; m c k + ac = 0 (4.150) Es decir, si a =√ −c/m = −k/c, valor que es compatible con el valor de c dado por (4.148). Como c = ± km, a debe valer: r k (4.151) a=± m Tomamos negativo el valor de c para que a sea positiva y coincida con la frecuencia p del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea que las fórmulas (4.136) nos dan directamente la solución en términos de q y p que se La formulación hamiltoniana / 107 determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la ecuación diferencial llamada de Hamilton-Jacobi para el oscilador armónico: 2 ∂F 1 ∂F 1 + kq 2 + =0 (4.152) 2m ∂q 2 ∂t F es una solución de (4.152) que no posee la propiedad de ser la suma de una función de t y una función de q. Posteriormente veremos que (4.152) posee otra solución por el método de separación de variables (llamada solución completa) que genera otra trasformación canónica que anula el hamiltoniano para un oscilador armónico. 4.5. Las transformaciones canónicas o de contacto Estas transformaciones en el espacio de fases son importantes, entre otras cosas, porque conservan el formalismo canónico y permiten reemplazar el hamiltoniano H por una H que tenga una forma mucho más simple. Ası́ por ejemplo, es posible mediante una transformación canónica hacer que todas las coordenadas sean cı́clicas; con ello la solución de un problema mecánico se reduce a un problema de geometrı́a en el espacio de fases: hallar la transformación canónica adecuada. Ejemplo 4.5.1 Mostrar que la transformación de cambio de escala es canónica independientemente de las propiedades de homogeneidad del potencial. Tal transformación es: q ν = αqν ; pν = βpν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.153) Mediante esta transformación se tiene: ∂H ∂H =α ; ∂qν ∂q ν 1 q̇ν = q˙ν ; α ∂H ∂H =β ∂pν ∂pν 1 ṗν = ṗν ; β (4.154) ν = 1, 2, ...l con lo cual las ecuaciones de Hamilton se convierten en: q̇ ν = αβ ∂H ; ∂pν ṗν = −αβ ∂H ; ∂q ν ν = 1, 2, ...l (4.155) En las nuevas variables (q, p) las ecuaciones de movimiento serán de la forma canónica solamente si se cambia el hamiltoniano. H(q, p, t) = αβH(q, p, t) (4.156) 2 También H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador en el espacio fásico (véase figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω, con las coordenadas q y q se verá el punto estacionario. H describe pues, un problema de equilibrio. 108 / Mecánica clásica avanzada Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el carácter canónico de una transformación es algo inherente a la transformación misma, independientemente de la forma del hamiltoniano, en particular, independientemente de sus propiedades de simetrı́a. Por esto cualquier sistema de l grados de libertad posee ecuaciones de movimiento covariantes bajo la transformación (4.153), aunque solamente si el potencial es función homogénea de las coordenadas el sistema posee simetrı́a de semejanza mecánica, ecuación (4.92). Ası́ mismo las transformaciones (4.115) y (4.116), no canónicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamiltoniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformación canónica permite obtener un nuevo hamiltoniano de forma simple. Ası́, para un oscilador armónico lineal la transformación canónica (4.134) conduce a que H = ωp, o sea a que φ sea cı́clica en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De forma similar (4.136) conduce a H = 0 para el oscilador. Ejemplo 4.5.2 Mostrar que es canónica la transformación: q ν = αpν ; pν = βqν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.157) En este caso: H = −αβH (4.158) En particular, la transformación con α = 1, β = −1: q ν = pν ; pν = −qν ; ν = 1, 2, ...l, (4.159) es canónica con H = H. Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su sentido inicial, pues mediante una transformación canónica (T.C.) es posible hacer que los momentos pasen a hacer el papel de coordenadas y viceversa. Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para poder especificar la posición del sistema en el espacio de configuración. (q) y (p) no son pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades canónicamente conjugadas. En conclusión, en el espacio de fases el estado del sistema se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente conjugadas. 4.6. La función generatriz de una transformación canónica Las ecuaciones canónicas pueden deducirse de un principio variacional en el espacio de fases (segunda forma del principio de Hamilton) y viceversa: ! Z t2 X l ∂H δ pν q̇ν − H dt = 0 ↔ q̇ν = ∂pν t1 ν=1 (4.160) ∂H ; ν = 1, 2, ...l ṗν = − ∂qν La formulación hamiltoniana / 109 que: Si la transformación (q, p) ↔ (q, p) es canónica, entonces debe también cumplirse δ Z l X t2 t1 ! pν q̇ ν − H ν=1 ṗν = − ∂H ; ∂qν dt = 0 ↔ q̇ ν = ∂H ; ∂pν (4.161) ν = 1, 2, ...l Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enunciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo por la derivada total respecto al tiempo de una función arbitraria de las “coordenadas” de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t): l X ν=1 pν q̇ν − H = l X ν=1 pν q̇ ν − H + d F (q, p, t) dt (4.162) Debido a que (q, p) y (q, p) están relacionadas mediante la transformación canónica, F (q, p, t) puede expresarse en función de cualquier subconjunto de 2l cantidades independientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuación (4.162) puede escribirse como: dF = l X ν=1 pν dqν − l X ν=1 pν dq ν + H − H dt (4.163) En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a F en función de (q, q, t). En ese caso la T.C. se llama “transformación canónica libre de la primera clase”. Matemáticamente, la independencia de las 2l cantidades (q, q) se expresa mediante la condición de que el jacobiano de las (q) respecto a las (p) sea diferente de cero, lo cual garantiza que las (p) se puedan expresar en términos de las (q): ∂qµ q 1 , q 2 , ...q l J ≡ det 6= 0 (4.164) p1 , p2 , ...pl ∂pν Si se cumple (4.164) entonces es posible expresar los pν en función de (q, q, t) y por lo tanto representar cualquier función de (q, p, t) en términos de (q, q, t). En este caso es posible escribir: F (q, p, t) = F1 (q, q, t) (4.165) Esto permite escribir: dF = dF1 = l l X X ∂F1 ∂F1 ∂F1 dqν + dq ν + dt ∂qν ∂qν ∂t ν=1 ν=1 (4.166) Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una transfomación canónica libre de la primera clase, de (4.163) y (4.166) se sigue que: pν = ∂F1 (q, q, t) ; ∂qν pν = − ∂F1 (q, q, t) ; ∂qν ν = 1, 2, ...l (4.167) 110 / Mecánica clásica avanzada Además se sigue que: ∂F1 (q, q, t) (4.168) dt La ecuación (4.167) dice que a cada transformación canónica libre de la primera clase le corresponde una función F1 y viceversa. F1 se llama la función generatriz de la transformación canónica.3 H(q, p, t) − H(q, p, t) = Ejemplo 4.6.1 Hallar la transformación canónica generada por la función: F1 (q, q, t) = − l X qν q ν (4.169) ν=1 En (4.169) está implı́cito que (q) y (q) son independientes. Por lo tanto las fórmulas de la transformación canónica serán: ∂F1 (4.170) pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l ∂qν pν = − ∂F1 = qν ⇒ pν = qν ; ∂qν ν = 1, 2, ...l (4.171) Es esencialmente la misma transformación (4.159), que intercambia coordenadas y momentos. Este ejemplo muestra que cada función de (q, q, t) define una transformación canónica Ejemplo 4.6.2 Probar que la transformación canónica (4.134) es libre de la primera clase. Hallar la correspondiente función F1 . Sea q = x y p = px . Las fórmulas de transformación serán entonces: r p 2p q= cos q ; p = − 2mωp sen q mω p2 1 p p = mω x2 + 2 2 ; q = −tan−1 2 m ω mωq El jacobiano (4.164) es trivial y diferente de cero: ∂q q J 6= 0 = p ∂p (4.172) (4.173) (4.174) O sea que la transformación es libre de la primera clase y puede ser generada por cierta función de las variables independientes q y q. La transformación no depende del tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transformación canónica no puntual es libre de primera clase para sistemas de un grado de libertad. F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163): p2 1 dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175) 2 m ω 3 La función del ejemplo 4.4.2, (4.143), es la función generatriz de la transformación canónica (4.136). La formulación hamiltoniana / 111 Debemos expresar a p en términos de q y q lo cual se obtiene directamente de (4.173): p = −mωq tan q (4.176) Reemplazando a (4.176) en (4.175) obtenemos: 1 = −mωq tan q dq − mωq 2 sec2 q dq 2 1 2 q tan q = −mωd 2 dF1 (4.177) Se sigue entonces que, salvo una constante aditiva: 1 F1 (q, q) = − mωq 2 tan q 2 (4.178) Podemos probar directamente, usando las fórmulas (4.167), que F1 dada por (4.178) efectivamente genera la transformación dada por (4.172) y (4.173): ∂F1 = −mωq tan q ; ∂q ∂F1 1 = − mωq 2 sec2 q ∂q 2 (4.179) O sea que: p = −mωq tan q ; p= 1 mωq 2 sec2 q 2 (4.180) Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuación de HamiltonJacobi (4.152). Ejemplo 4.6.3 Sea una partı́cula descrita por el hamiltoniano: H= p2 − aq 2m (4.181) donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano: H=0 (4.182) En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la solución trivial: p = constante ; q = constante (4.183) La transformación ha de ser tal que se cumpla para F1 , según (4.167) y (4.168): ∂F1 = p; ∂q ∂F1 = −p ; ∂q −H = ∂F1 ∂t (4.184) 112 / Mecánica clásica avanzada Se sigue de (4.181) y (4.184) que F1 debe ser solución a la ecuación diferencial de Hamilton-Jacobi: 2 1 ∂ ∂ F1 (q, q, t) − aq = − F (q, q, t) (4.185) 2m ∂q ∂t La ecuación diferencial es de primer orden e involucra derivadas respecto a q y respecto a t. La solución debe contener constantes de integración arbitrarias; una de ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integración. La ecuación (4.185) tiene una solución de la forma: F1 (q, q, t) = −qt + f (q, q) (4.186) La ecuación (4.186) equivale a tomar la constante q igual a la energı́a, puesto que H en (4.181) es constante, H = E: q=E (4.187) Con esta solución, (4.184) se reduce a: 2 1 df (q, q) − aq = q 2m dq Integrando (4.188) obtenemos: √ 2 2m (q + aq)3/2 + constante f (q, q) = ± 3 a Con lo cual, omitiendo la constante aditiva: √ 2 2m F1 (q, q, t) = −qt ± (q + aq)3/2 3 a (4.188) (4.189) (4.190) La ecuación (4.190) genera la siguiente transformación canónica, de acuerdo con las fórmulas (4.167): √ p 2m p −p = −t ± q + aq (4.191) p = ± 2m(q + aq) ; a Explı́citamente la transformación es: a q (t − p)2 q(q, p, t) = − + a 2m p(q, p, t) = (t − p)a ; p(q, p, t) = t − p ; a q(q, p, t) = p2 − aq 2m (4.192) (4.193) Como q y p son constantes, (4.192) proporciona la solución al problema del movimiento descrito por (4.181). En particular describe el problema del movimiento de una partı́cula en presencia de la gravedad (a = −mg , q = z , p = mż). z= 1 E − g(t − p) ; mg 2 mż − mg(t − p) (4.194) La formulación hamiltoniana / 113 Las constantes E y p tienen las siguientes expresiones en función de los valores de z y ż en t = 0: E= 1 mv 2 + mgz0 ; 2 0 p= v0 g (4.195) Entonces para z(t) y ż(t) obtenemos: 1 z = z0 + v0 t − gt2 ; ż = v0 − gt (4.196) 2 de acuerdo con el resultado obtenido usando métodos elementales. Es claro que la transformación dada por (4.192) y (4.193) es canónica independientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad; sin embargo, sólo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por tanto que q y p sean constantes. Este problema ilustra el método de resolver un problema mecánico mediante una transformación canónica sin integrar las ecuaciones de Hamilton. 4.7. La evolución temporal de un sistema considerada como una transformación canónica Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores determinarán todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos escribir: qν (t) = qν (q 0 , p0 , t − t0 ) ; ν = 1, 2, ...l (4.197) pν (t) = pν (q 0 , p0 , t − t0 ) La ecuación (4.197) puede considerarse como una cierta transformación en el espacio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transformación es canónica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton. La función generatriz de esta transformación satisface: dF = l X ν=1 p0ν dqν0 − l X ν=1 pν dqν + (H 0 − H) dt (4.198) Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas generalizadas no dependen del tiempo, H se conserva, H = H 0 , luego: dF = l X ν=1 p0ν dqν0 − l X ν=1 pν dqν = − l X ν=1 t pν dqν (4.199) t0 Por otra parte, escribamos la integral de acción entre t0 y t: Z t L dt S= t0 (4.200) 114 / Mecánica clásica avanzada Una variación de las (q) nos conduce a: Z tX l ∂L ∂L δS = δqν + δ q̇ν dt ∂ q̇ν t0 ν=1 ∂qν Z tX l d ∂L d ∂L ∂L δqν dt δqν + δqν − = dt ∂ q̇ν dt ∂ q̇ν t0 ν=1 ∂qν = Xl ν=1 ∂L δqν ∂ q̇ν t t0 (4.201) # Z t "X l ∂L d ∂L δqν dt + − dt ∂ q˙ν t0 ν=1 ∂qν Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de Lagrange, luego: l X ∂L δqν δS = ∂ q̇ν ν=1 t = t0 l X ν=1 t (4.202) pν δqν t0 Comparando a (4.199) y (4.202) vemos que: F = −S (4.203) En conclusión, la acción es la función generatriz de la transformación canónica de evolución temporal del sistema. Ésta es una transformación del espacio de fases en sı́ mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases (q, p). En el ejemplo del oscilador armónico lineal, la figura 4.3 es una circunferencia. La evolución temporal consiste simplemente en una rotación del vector de posición del punto del espacio fásico que representa al sistema, lo cual también puede verse en las fórmulas (4.172), y más claramente aún mediante el ejemplo 4.4.2. 4.8. El teorema de Liouville El teorema de Liouville es un teorema básico para la mecánica estadı́stica, o sea la mecánica de sistemas tales que: (a) El número de grados de libertad es muy grande. (b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el estado del sistema en sentido clásico. Solamente se conoce el hamiltoniano del sistema, las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las ~ P~ ). aditivas: H, L, (c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio de fases, sólo se pueden hacer suposiciones estadı́sticas. En particular se puede asumir que todas las trayectorias de fase compatibles con las ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente probables (distribución uniforme). En general, habrá una región del espacio de fases que es accesible al sistema y se puede postular alguna distribución de probabilidades de las distintas trayectorias de fase dentro de la región accesible (las trayectorias externas a la región accesible tienen probabilidad cero). La formulación hamiltoniana / 115 Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente su energı́a. Mediante la transformación canónica (4.172), la dinámica del oscilador está descrita por: q= r 2p cos q ; mω p=− p 2mωp senq ; H = ωp = E (4.204) Las ecuaciones canónicas en las variables (q, p) tienen la solución: E = constante (4.205) ω donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados E y δ queda determinado completamente el estado de movimiento: r 2E cos (ωt + δ) q(E, δ, t) = mω 2 (4.206) √ p(E, δ, T ) = − 2mE sen(ωt + δ) q = ωt + δ ; p= p / mω r t>0 δ q (2E / mω 2 ) 1/2 t=0 Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida E define el radio de la trayectoria y δ el tiempo inicial de la misma (véase figura 4.4). p La región accesible la constituyen todos los puntos de una circunferencia de radio 2E/(mω 2 ). Las diferentes trayectorias están definidas por los valores de δ. Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse únicamente sobre la superficie de un cilindro, cuando sólo se conoce exactamente la energı́a y el momento angular en la dirección z (ver ejemplo 4.3.1). 116 / Mecánica clásica avanzada La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio de fases. La energı́a total es, de acuerdo con la ecuación (4.105): L2z (4.207) 2mR2 Parte de la energı́a está asociada al movimiento en z y parte a la rotación, siendo ambas constantes por separado. Para Lz arbitrario, la región accesible del espacio fásico está definida por el “cilindro” E = constante. Todos los puntos interiores a este cilindro son accesibles. Para Lz y Ez dados, habrá un conjunto infinito de trayectorias de fase en “espiral”, caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribución uniforme para este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad. En general cuando sólo se conocen exactamente la energı́a total, el momento lineal total y el momento angular total del sistema, además de las ligaduras, la región del espacio de fases accesible al sistema está definida por las ecuaciones: E = Ez + E(q, p) = E0 ; ~ p) = L ~0 ; L(q, P~ (q, p) = P~0 (4.208) que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4 Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distribución microcanónica asigna a cada uno de los estados caracterizados por (4.208) y los valores de las 2l − 7 constantes restantes igual probabilidad. Conjunto estadı́stico. Es una noción útil en los casos donde hay 2l−7 constantes de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo número de grados de libertad, la misma clase de partı́culas y de interacciones, las mismas ligaduras y los mismos valores de las constantes de movimiento aditivas). Es decir, dos sistemas de un conjunto estadı́stico sólo pueden diferir por los valores de las 2l − 7 constantes no aditivas. Se considera que el número de sistemas es muy grande, de modo que es una muestra estadı́sticamente representativa de la distribución de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el estado de cada sistema del conjunto será representado por un punto del espacio fásico, y su estado de movimiento por una trayectoria de fases. El conjunto estadı́stico de sistemas de l grados de libertad estará representado en cada instante por un “enjambre” de puntos del espacio fásico. Como los sistemas del conjunto estadı́stico no interactúan, cada punto se mueve independientemente de los demás en el espacio fásico 2l-dimensional.5 Teorema de Liouville. En cada elemento de volumen del espacio fásico la densidad de puntos representativos del conjunto estadı́stico permanece constante en el tiempo. Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infinitesimal del espacio de fases. Sea: dN = ρ(p, q, t)dΓq dΓp (4.209) 4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en cuenta que asociadas a la posición del centro de masa de un sistema libre hay tres constantes; quedarı́an en ese caso 6N − 10 constantes no determinadas. 5 Un conjunto estadı́stico tiene analogı́a con los “ensambles” que mencionamos en la sección 2.3. La formulación hamiltoniana / 117 el número de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la función de distribución estadı́stica y hace el papel de función de densidad de probabilidad en el espacio de fases. ρ satisface la condición de normalización: Z ρdΓq dΓp = 1 (4.210) donde la integral abarca todo el espacio de fases. Matemáticamente el teorema dice que: l ρ̇ = 0 o dρ X = dt ν=1 ∂ρ ∂ρ q̇ν + ṗν ∂qν ∂ ṗν + ∂ρ =0 ∂t (4.211) Una forma cualitativa de visualizarlo se da a continuación. Sea un volumen arbitrario del espacio de fases en t = t0 . Como el número de sistemas es muy grande, en la frontera de tal volumen habrá un gran número de puntos representativos de sistemas del conjunto, de modo que aproximadamente podemos decir que la frontera del elemento de volumen está definida por un conjunto de puntos representativos del conjunto estadı́stico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de la frontera. El tamaño del volumen podrá cambiar, pero no el número de puntos que lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que entre o salga del elemento de volumen deberá pasar por la frontera, pero al llegar a la frontera tendrá los mismos (q, p) de un punto de la misma. Ambos puntos tendrán las mismas condiciones iniciales para el movimiento posterior, en consecuencia deberán seguir moviéndose juntos. En conclusión, el número de puntos en cualquier región del espacio fásico es constante. Se puede demostar que: Z Z (4.212) dΓq dΓp = dΓq dΓp donde la transformación (q, p) → (q, p) es canónica. Como la evolución temporal es una T.C., se sigue que: Z Z dΓq0 dΓp0 = dΓq dΓp (4.213) Como no cambian con el tiempo ni el volumen ni el número de puntos dentro de él, la densidad será constante. Demostración del teorema de Liouville. Sea un conjunto estadı́stico de sistemas de un grado de libertad, entonces el espacio fásico es bidimensional y dΓ = dq dp. Además, dN = ρ dq dp es el número de sistemas en dΓ. Consideremos que cada uno de los sistemas del conjunto tiene energı́a entre E y E + ∆E. La figura 4.5 muestra la región accesible, definida por las lı́neas E = constante y E + ∆E =p constante (depser osciladores armónicos, tal región serı́a una corona circular de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos representativos del conjunto se mueven dentro de esta región. Entre t y t + dt entran al elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de la izquierda e inferior. El número de los puntos que entran a dΓ durante el tiempo dt 118 / Mecánica clásica avanzada p E + dE t t + dt dp E pdt (q,p) dq q qdt Figura 4.5 Espacio fásico. Región accesible definida por las lı́neas E = constante y E +∆E = constante. será igual a: ρq̇ dt dp + ρṗ dt dq (4.214) O sea que el número de puntos que entran a dΓ por unidad de tiempo es: ρq̇ dp + ρṗ dq = ρ(q̇ dp + ṗ dq) (4.215) Para hallar los puntos que salen, debemos considerar los que se mueven dentro de dΓ hacia las caras derecha y superior y que las alcanzarán en el tiempo dt. Esto se puede obtener de (4.215) mediante una expansión de Taylor alrededor de (q, p), para hallar (4.215) en (q + dq, p + dp): (ρq̇)|q+dq dp + (ρṗ)|p+dp dq̇ = ∂ ∂ (ρq̇) dq dp + ρṗ + (ρṗ) dp dq ρq̇ + ∂q ∂p (4.216) La variación del número de puntos dentro de dΓ es igual a lo que entra menos lo que sale por unidad de tiempo, o sea a (4.215) menos (4.216): ∂ ∂ − (ρq̇) + (ρṗ) dq dp (4.217) ∂q ∂p Dentro de dΓ la rata de incremento temporal de la densidad será ∂ρ/∂t y el cambio del número de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a (4.217): ∂ ∂ ∂ρ dq dp = − (ρq̇) + (ρṗ) dq dp (4.218) ∂t ∂q ∂ρ La formulación hamiltoniana / 119 Se sigue entonces que: ∂ρ ∂ q̇ ∂ρ ∂ ṗ ∂ρ +ρ + q̇ + ρ + ṗ = 0 ∂t ∂q ∂q ∂p ∂p (4.219) Usando las ecuaciones de Halmilton se tiene: ∂ ṗ ∂2H ∂2H ∂ q̇ + = − =0 ∂q ∂p ∂q∂p ∂p∂q (4.220) Con lo cual (4.219) nos da el resultado: ∂ρ ∂ρ ∂ρ dρ + q̇ + ṗ = =0 ∂t ∂q ∂p dt (4.221) La generalización a sistemas de varios grados de libertad es análoga. En ese caso debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de libertad ν. dΓ → dqν dpν es la proyección del elemento de volumen dΓq dΓp sobre el plano ν. Las lı́neas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio de fases E = constante, E + dE = constante. dΓ será: dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2 (4.222) ...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ; ν = 1, 2, ...l Debemos reemplazar las ecuaciones (4.215) y (4.216) por: ρ dΓν (q̇ dpν + ṗν dqν ) y, ∂ ν ν ρ dΓ q̇ν + (ρ dΓ q̇ν ) dqν dpν ∂qν ∂ ν ν + ρ dΓ ṗν + (ρ dΓ ṗν ) dpν dqν ∂pν (4.223) (4.224) Por tanto la variación del número de puntos en el área dqν dpν será igual a (4.223)(4.224): ∂ ∂ ν ν (ρ dΓ q̇ν ) + (ρ dΓ ṗν ) dqν dpν = − ∂qν ∂pν (4.225) ∂ ∂ (ρq̇ν ) + (ρṗν ) dΓ − ∂qν ∂pν La variación del número de puntos en todo el volumen dΓ es igual a la suma de las variaciones de los números de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl . Ésta será: l X ∂ ∂ (ρq̇ν ) + (ρṗν ) dΓ (4.226) − ∂qν ∂pν ν=1 Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a ∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuación (4.211). 120 / Mecánica clásica avanzada Ejemplo 4.8.3 Sea un conjunto de cuatro partı́culas iguales que se lanzan hacia arriba en un campo gravitacional uniforme, con las siguientes condiciones iniciales: z10 = z0 , z20 = z0 + ∆z0 z30 = z0 , z40 = z0 + ∆z0 pz10 = p0 , pz20 = p0 (4.227) pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0 (a) Hallar la región que inicialmente ocupa el conjunto en el espacio de fases. (b) Hallar las trayectorias de fase de las partı́culas. (c) Considerar cómo cambia la región ocupada por el conjunto para t > 0. El espacio fásico de cada sistema es 6-dimensional, pero sólo hay variaciones en la proyección bidimensional z − pz . x, px , y y py permanecen constantes, ya que por definición las partı́culas no interactúan entre sı́. La energı́a de cada partı́cula es constante. Entonces: Hi = p2zi + mgzi = Ei = constante ; 2m i = 1, 2, 3, 4 (4.228) La ecuación de la trayectoria de cada partı́cula en el espacio de fases será parabólica: p (4.229) pzi = ± 2m(Ei − mgzi ) De acuerdo con (a) y (b) las Ei serán: p20 + mg(z0 + ∆z0 ) 2m E1 = p20 + mgz0 ; 2m E3 = (p0 + ∆p0 )2 + mgz0 2m E4 = (p0 + ∆p0 )2 + mg(z0 + ∆z0 ) 2m E2 = (4.230) Asumiendo positivos a ∆p0 y ∆z0 , vemos que: E4 > E3 ; E4 > E2 ; E3 > E1 ; E2 > E1 (4.231) Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo que: E4 > E3 > E2 > E1 (4.232) La solución a este problema es: pzi = pzi0 − mgt ; zi = zi0 + pzi0 1 t − gt2 ; m 2 i = 1, 2, 3, 4 (4.233) La formulación hamiltoniana / 121 De modo que: pz 1 = z1 = pz 3 = pz2 = p0 − mgt p0 − mgt ; z0 + p0 1 t − gt2 ; m 2 p0 + ∆p0 − mgt ; z2 = z0 + ∆z0 + p0 1 t − gt2 m 2 pz4 = p0 + ∆p0 − mgt (4.234) 1 p0 + ∆p0 t − gt2 m 2 z3 = z0 + z4 = z0 + ∆z0 + 1 p0 + ∆p0 t − gt2 m 2 Las ecuaciones (4.234) nos dicen que: Pz1 = pz2 = p < p0 ; z3 = z1 + z2 = z1 + ∆z0 ; ∆p0 t m Pz3 = pz4 = p + ∆p0 (4.235) ∆p0 t; z4 = z2 + m z4 = z3 + ∆Z0 z1 = z La figura 4.6 muestra la región ocupada por el conjunto en el espacio de fases, en t = 0 y en t > 0. Vemos que el área (volumen) del espacio fásico ocupada por el conjunto de sistemas permanece constante en el tiempo y es igual a: ∆z0 ∆p0 (4.236) Dicha región se mueve distorsionándose pero sin cambiar el valor del área. El resultado es el mismo en el caso en que dentro del área en mención haya un número arbitrario de puntos: el área de la región limitada por las lı́neas 1 − 2, 2 − 4, 3 − 4 y 1 − 3 permanecerı́a constante y todos los puntos quedarı́an dentro. La densidad de puntos en el espacio de fases también es una constante; en este caso. 4 = constante ∆z0 ∆p0 (4.237) De haber inicialmente en el centro del rectángulo una quinta partı́cula, esta permanecerı́a en el centro del cuadrilátero en t > 0. La figura 4.7 muestra las trayectorias de fase. Ejemplo 4.8.4 Sea una partı́cula que se lanza hacia arriba en presencia de un campo gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación: 122 / Mecánica clásica avanzada pz p0 + ∆p0 3 4 1 2 ∆p0t / m p0 3 p + ∆p0 4 p 1 z0 + ∆z0 z0 2 z + ∆z0 z z Figura 4.6 Región ocupada por el conjunto de sistemas en el espacio de fases pz p0 + ∆p0 p0 3 4 1 2 z z0 z0 + ∆z0 2 1 3 1 2 4 3 4 Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de puntos z(0) = z0 ± ∆z0 ; 2 pz (0) = p0 ± ∆p0 2 (4.238) Es decir, se sabe que en t = 0 la partı́cula está en un rectángulo de área ∆z0 ∆p0 en el espacio de fases. Analizar la evolución de la partı́cula. Basta considerar el movimiento de la partı́cula en los valores extremos de las condiciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 − La formulación hamiltoniana / 123 ∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227) del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye inmediatamente que para una partı́cula se cumple: ∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0 (4.239) Para un valor dado de esta constante, si se reduce la indeterminación en z, se aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay lı́mite al valor más pequeño que puede tomar la constante ∆p0 ∆z0 . Cuánticamente no puede ser menor que h̄/2, donde h̄ es la constante de Planck, luego: ∆z ∆pz ≥ h̄ 2 (4.240) La ecuación (4.240) se denomina la desigualdad de Heisenberg. El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville. La proyección del volumen del espacio fásico dentro del cual inicialmente se encuentra la partı́cula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν , tiene un área ∆pν0 ∆qν0 . Se tiene entonces que: ∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante (4.241) O sea que, cuánticamente se cumple que para cualquier par de variables canónicamente conjugadas: ∆pν ∆qν ≥ h̄ 2 (4.242) Clásicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la indeterminación de pν , se disminuye la indeterminación de qν y viceversa. Lo especı́fico de la desigualdad de Heisenberg (el “efecto cuántico”) es que la constante no puede ser cero sino que tiene un mı́nimo valor. 124 / Mecánica clásica avanzada 5 Movimiento de dos partı́culas que interactúan por medio de una fuerza central Éste es un problema que en principio es soluble de manera exacta para cualquier fuerza central. Pertenece a los pocos problemas de la mecánica clásica en que es posible la separación de las variables. Como se sabe, no existen soluciones analı́ticas exactas para el problema general de más de dos partı́culas interactuando mutuamente por fuerzas de dos partı́culas. 5.1. Coordenadas de centro de masa y coordenadas relativas En general las coordenadas de las partı́culas individuales, por ejemplo X1 , Y1 , Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. Sólo cuando las fuerzas son lineales ha sido diseñado un formulismo que desacopla las ecuaciones de movimiento mediante la transformación a coordenadas normales. Afortunadamente, el problema de dos partı́culas que interactúan a través de una fuerza central admite la separación de variables mediante la transformación a las coordenadas relativas y de centro de masa. ~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 , R m1 + m2 (5.1) m m 2 1 ~− ~+ ~r1 = R ~r , ~r2 = R ~r M M Un potencial central es aquel que depende sólo de la distancia entre las partı́culas: V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r) (5.2) Las fórmulas (5.1) permiten escribir la energı́a cinética ası́: T = 2 2 1 1 ~˙ 2 1 ˙ 2 1 m1~r˙ 1 + m2~r˙ 2 = M R + µ~r 2 2 2 2 125 (5.3) 126 / Mecánica clásica avanzada donde M es la masa total y µ la masa reducida: m1 m2 m1 + m2 Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir: M = m1 + m2 ; µ= 2 ~˙ + 1 µ~r˙ 2 − V (r) ~ ~r˙ , R ~˙ = 1 M R L ~r, R; 2 2 (5.4) (5.5) ~ es cı́clica y por lo tanto el momento lineal del centro de masa es una constante de R movimiento. L consta de términos desacoplados, es decir, describe un sistema equivalente de dos partı́culas, una libre de masa M colocada en el centro de masa y otra de masa µ colocada por ejemplo en la posición de la partı́cula 2, y sometida al efecto de un centro de fuerzas inmóvil colocado en la posición de la partı́cula 1, y exactamente sometida a la misma energı́a potencial de interacción de las dos partı́culas originales: LCM = 1 ~˙ 2 MR ; 2 Lrel = 1 ˙2 µ~r − V (r) 2 (5.6) Lrel es esféricamente simétrico pues depende sólo de la magnitud de los vectores ~r y ~r˙ . En consecuencia, el momento angular de la partı́cula de masa reducida µ, ~l = ~r × µ~r˙ , es una constante de movimiento. Para pasar al formalismo hamiltoniano, evaluemos los momentos canónicos conju~ gados de ~r y R: p= ~ ∂L = µ~r˙ ; ∂~r˙ ∂L ~˙ = MR P~ = ˙ ~ ∂R (5.7) Entonces el hamiltoniano del sistema será: H= P~2 p~2 + + V (r) 2M 2µ (5.8) H es una constante de movimiento, ası́ como por separado lo son la energı́a del centro de masa y la de la partı́cula de masa reducida. Sistema de coordenadas de centro de masa. Es un sistema de coordenadas con origen colocado en el centro de masa. Las fórmulas de transformación son (véase la figura 5.1): ~r1c = ~r2c m2 m2 ~r (~r1 − ~r2 ) = − M m1 m1 m1 = (~r2 − ~r1 ) = ~r M M (5.9) Además se cumple que: m1~r1c + m2~r2c = 0 ; ~r2c − ~r1c = ~r No existen fórmulas que expresen a ~r1 , ~r2 en función de ~r1c y ~r2c . (5.10) Movimiento de dos partı́culas que interactúan ... / 127 La energı́a total de las dos partı́culas en el sistema de referencia del centro de masa es: Ec = 2 2 1 1 1 2 m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) 2 2 2 (5.11) y el momento angular respecto al centro de masa: ~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙ L (5.12) 1 r1c r2c r1 2 R r2 O Figura 5.1 Sistema de coordenadas de centro de masa para dos partı́culas Se ve que la energı́a total en el sistema del centro de masa coincide con la energı́a total de la partı́cula de masa reducida, y el movimiento angular total coincide con el momento angular de la partı́cula de masa reducida. El momento angular total en el sistema de referencia del laboratorio es: ~ ×R ~˙ + µ~r × ~r˙ ~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R (5.13) L vemos que es igual al momento angular del centro de masa más el momento angular respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que los aspectos no triviales del problema están en el movimiento de la partı́cula de masa reducida. Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sistema de coordenadas esféricas para ubicar la partı́cula de masa reducida µ (véase figura 128 / Mecánica clásica avanzada z êϕ êΦ êr r Θ y ϕ êΦ x Figura 5.2 Posición ~r de la partı́cula µ en coordenadas esféricas 5.2). No hay ninguna razón fı́sica para suponer dónde está el origen de ese sistema de coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso antes, en la posición de la partı́cula 1. Las componentes de ~r y ~r˙ es conveniente expresarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformación entre vectores unitarios: êr = senθ cos φ î + senθ senφ ĵ + cos θ k̂ êθ = −senφ î + cos φ ĵ êφ = senθ k̂ − cos θ (cos φ î + senφ ĵ) (5.14) y las fórmulas inversas: î = senθ cos φ êr − senφ êθ − cos θ cos φ êφ ĵ = senθ senφ êr + cos φ êθ − cos θ senφ êθ k̂ = cos θ êr + senθ êφ (5.15) éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r y ~r˙ tienen las siguientes expresiones: ~r = rêr ; ~r˙ = ṙêr − rθ̇êφ + r senθ φ̇êθ (5.16) Movimiento de dos partı́culas que interactúan ... / 129 El lagrangiano en coordenadas esféricas es: 1 L = µ r2 + r2 θ̇2 + r2 sen2 θ φ̇2 − V (r) (5.17) 2 donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es cı́clica y por ello su momento canónico conjugado pφ es una constante de movimiento: pφ = ∂L ∂ φ̇ = µr2 sen2 θ φ̇ = constante (5.18) Debido a la simetrı́a de rotación del lagrangiano, todas las componentes del momento angular son constantes de movimiento. Las componentes esféricas, o sea, a lo largo de los vectores unitarios êr , êθ , êφ , son: lr = 0 , lφ = µr2 senθ φ̇ lθ = µr2 θ̇ , (5.19) en tanto que las componentes cartesianas son: lx = −µr2 (θ̇senφ + φ̇ senθ cos θ cos φ) ly = µr2 (θ̇ cos φ − φ̇ senθ cos θ senφ) (5.20) lz = µr2 sen2 θ φ̇ Los otros momentos canónicos conjugados son: pr = ∂L = µṙ ; ∂ ṙ pθ = ∂L ∂ θ̇ = µr2 θ̇ (5.21) pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l, (5.19) y (5.20), en función de los momentos canónicos: lθ = pθ ; lφ = pφ ; senθ l2 = p2θ + p2φ sen2 θ (5.22) lx = −pθ senφ − pφ cot θ cos φ ly = −pθ cos φ − pφ cot θ senφ (5.23) lz = pφ Nótese la similitud de (5.23) con las correspondientes expresiones cuántico-mecánicas, y aun con las componentes l± = lx ± ily : l+ = (ipθ − pφ cot θ)eiφ ; l− = (−ipθ − pφ cot θ)e−iφ (5.24) En coordenadas esféricas la constante de movimiento pφ , el momento canónico conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son constantes de movimiento, pero sı́ lx , ly y lz , como también: lr = 0 ; lz = pφ ; l2 = p2θ + p2φ = µ2 r4 (θ̇2 + sen2 θφ̇2 ) sen2 θ (5.25) 130 / Mecánica clásica avanzada de lo anterior se sigue que existe un valor mı́nimo de θ dado por: pφ senθmin = ; θmax = π − θmin l (5.26) Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecerán en un plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la partı́cula de masa reducida permanece siempre sobre un plano; las órbitas son planas. θmin y θmax son los ángulos de máximo y mı́nimo acercamiento de la partı́cula al eje Z respectivamente, donde θ̇ cambia de signo. Comparando la expresión (5.25) para ~l 2 , con (5.17), obtenemos: L= l2 1 − V (r) µṙ + 2 2µr2 (5.27) En esta forma se nota la completa simetrı́a esférica del lagrangiano, ya que sólo depende de r pues ~l es una constante. El hamiltoniano es: H= p2r l2 + V (r) + 2µ 2µr2 (5.28) En esta expresión para H podemos tomar ventaja del hecho de depender sólo de la parte radial: H describe el movimiento unidimensional equivalente de una partı́cula de masa µ en un potencial efectivo: Vef (r) = l2 + V (r) 2µr2 (5.29) La segunda ley de Kepler. Podemos definir las coordenadas de manera que desaparezca del problema uno de los ángulos. Si tomamos el eje Z de modo que coincida con la dirección de ~l, que es constante, entonces el movimiento permanecerá siempre sobre el plano X − Y : θ = π/2 = constante; θ̇ = 0, con lo cual la magnitud del momento toma la forma: l = pφ = µr2 φ̇ = constante (5.30) En el plano de la órbita, el área barrida por el radio vector en un tiempo dt es dA = (1/2)r2 dφ, siendo dφ el ángulo que gira el radio vector en el tiempo dt. Entonces, Ȧ = 1 2 l r φ̇ = = constante 2 2µ (5.31) Nos dice que la velocidad areolar es constante para cualquier movimiento bajo fuerzas centrales (segunda ley de Kepler, descubierta empı́ricamente en 1609 en observaciones planetarias. La primera y la tercera leyes de Kepler valen sólo para potenciales de la forma 1/r). El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la ecuación de movimiento: l2 d d V + = − Vef = fc + f (5.32) µr̈ = − dr 2µr2 dr Movimiento de dos partı́culas que interactúan ... / 131 donde f es la fuerza derivable de V y fc es la llamada fuerza centrı́fuga, derivada del potencial centrı́fugo l2 /(µr2 ). La ecuación radial (5.32) supone un observador fijo respecto a la dirección del radio; como el radio vector gira, para este observador aparece una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante de movimiento, la energı́a total en el centro de masa, que llamaremos E, proporciona una ecuación diferencial para r que puede integrarse por cuadratura: Z r dr t − t0 = (5.33) 1/2 r0 2 l2 (E − V ) − 2 2 µ µ r de (5.33) en principio puede obtenerse a r en función del tiempo, para cada conjunto de valores de t0 , r0 , µ, E y l. Es de interés encontrar a r en función de φ, o sea, hallar la ecuación de la órbita en coordenadas polares en el plano de la misma. De (5.30) podemos notar que: ṙ = l dr µr2 dφ de donde: φ − φ0 = Z (5.34) r r0 l r2 dr 1/2 l2 2µ E − V − 2µr2 (5.35) De manera similar puede hallarse a φ(t) si se conoce a r(t): Z r l dt φ − φ0 = 2 r0 µ r (t) (5.36) Las fórmulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo que el eje z coincide con la dirección de ~l. Para una elección general de las coordenadas, las expresiones para hallar la ecuación de la órbita y la dependencia temporal de θ y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las coordenadas. Hallemos ahora la llamada ecuación diferencial de la órbita. Es una ecuación diferencial para r en función de φ. Se halla a partir de (5.34) y de: ṙ = − l dυ ; µ dφ r̈ = − l2 2 d2 υ υ ; µ2 dφ2 donde υ = 1 r (5.37) Con la ayuda de (5.37), la ecuación (5.32) se transforma en la ecuación diferencial de la órbita: µ F (υ) d2 υ =− 2 2 , dφ2 l υ (5.38) donde F (υ) = f (1/υ). Esta ecuación permite, dada f (r) hallar a r(φ), y dada r(φ) hallar a f (r). 132 / Mecánica clásica avanzada Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos para los cuales ṙ = 0, o sea, los que satisfacen la ecuación algebraica: l2 + V (r) − E = 0 2µr2 (5.39) En estos puntos la velocidad no es cero pues θ̇ y φ̇ no se anulan necesariamente. Si ocurre que ṙ se anula solo cuando r es finito y que el movimiento es acotado o ligado, habrá un punto de máximo acercamiento y uno de máximo alejamiento de la partı́cula al centro de fuerza. Si ṙ = 0 en un punto r → ∞, el movimiento es no ligado; éste es el caso de los procesos de colisiones o de dispersión. Los puntos de retorno en θ son aquellos en que θ̇ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuación (5.26). La ecuación (5.26) nos dice que no existen valores de φ en los cuales φ̇ = 0; no hay puntos de retorno en φ. Si r tiene dos lı́mites, rmin y rmax , el movimiento es ligado y la órbita está contenida dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La órbita puede o no ser cerrada; en general no lo será. Para los potenciales de la forma 1/r o r2 las órbitas son cerradas y pueden ser no circulares (son elı́pticas1 ). Para precisar, consideremos un oscilador bidimensional armónico en el plano de la órbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La dependencia temporal de x y y es: x(t) = Ax sen(ωX t + φX ) ; y(t) = Ay sen(ωY t + φY ) (5.40) Eliminando t obtenemos la ecuación de la órbita en coordenadas cartesianas. Cuando ωX es un múltiplo racional de ωY la órbita es una figura de Lissajous. Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse aparece como si estuviera sometida a un movimiento de precesión (véase figura 5.3). ∆α es el ángulo que se desplaza el semieje mayor cuando la variación temporal de r ha completado un perı́odo completo. La trayectoria será cerrada si después de cierto número de ciclos completos de variación r la trayectoria se repite; o sea si al transcurrir n perı́odos de variación de r, el radio a partir del cual la órbita se repite ha dado un número m de vueltas completas, es decir, si: n∆α = m2π (5.41) Si la condición (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia να . La órbita será cerrada sólo si νr y να son conmensurables. ~rmax y ~rmin se llaman vectores absidales. La órbita siempre es simétrica por reflexión en los vectores absidales, o sea que con sólo conocer la porción de órbita comprendida entre dos ~rmax y ~rmin consecutivos es posible por reflexión construir toda la órbita. Esto se puede obtener fácilmente analizando la ecuación diferencial de la órbita. 1 Para otros potenciales pueden haber órbitas cerradas no circulares pero sólo accidentalmente, es decir, para valores muy bien determinados de l y E. 2 Cuando k X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede presentarse la precesión de las órbitas. Movimiento de dos partı́culas que interactúan ... / 133 ∆α rmáx rmín Figura 5.3 Órbitas de un oscilador armónico bidimensional Ejemplo 5.1.1 Hallar la velocidad angular de precesión de la órbita de una partı́cula sometida a fuerzas restauradoras lineales con kX ≈ kY . Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a ωY − ωX . Para hallar la ecuación de la órbita notemos que, al primer orden en ∆ω t: y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t) (5.42) de este modo la ecuación de la órbita es, al primer orden en ∆ω t: y2 xy x2 + 2 +2 ∆ω t = 1 2 Ax Ay Ax Ay (5.43) que es la ecuación de una elipse con el eje mayor rotado. La ecuación (5.43) puede escribirse como una forma cuadrática no diagonal: A2y Ax Ay ∆ω t x = A2x A2y (x, y) (5.44) 2 y Ax Ay ∆ω t Ax Para llevar (5.43) a la forma estándar de la ecuación de la elipse, realicemos una rotación de los ejes coordenados por cierto ángulo δ: ′ x cos δ −senδ x = (5.45) ′ y senδ cos δ y 134 / Mecánica clásica avanzada Luego, la matriz de la forma cuadrática será diagonal si: tan 2δ = 2Ax Ay ∆ω t A2x − A2y (5.46) Si t es el tiempo que tarda r en completar un perı́odo en este problema de fuerza no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesión de la órbita es: δ̇ ≈ Ax Ay (ωy − ωx ) A2x − A2y (5.47) si AX no es del orden de AY (órbitas muy excéntricas). Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado el movimiento en presencia del potencial: A l2 V (r) = − e−αr r 2µr2 (5.48) La energı́a potencial efectiva es: l2 A Vef (r) = − e−αr + r 2µr2 (5.49) Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra la forma de Vef . Hay posibilidad de movimiento acotado sólo si Vef tiene un mı́nimo, o ′ sea si la ecuación Vef = 0 tiene solución, esto es: l2 Aα −αr Ae−αr − =0 e + r r2 µr3 (5.50) Si llamamos x = αr, entonces (5.50) se puede llevar a la forma: (x2 + x)e−x = αl2 µA (5.51) Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA) (véase figura 5.5), esto es, si: f (x0 ) > αl2 µA (5.52) donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si: x2 − x − 1 = 0 La única solución aceptable de (5.53) es: √ 1+ 5 ≈ 1,618 x0 = 2 (5.53) (5.54) Movimiento de dos partı́culas que interactúan ... / 135 Vef l2 2µr2 E 1/α r –Ae–αr/r Figura 5.4 Energı́a potencial efectiva Vef componente de los potenciales centrı́fugo y de Yukawa Entonces: √ 1+√5 f (x0 ) = 2 + 5 e− 2 ≈ 0,84 (5.55) ′ Hay solución a Vef (r) = 0 sólo si: 0, 84 > αl2 µA (5.56) Si (5.48) se usa para describir la interacción nuclear, por ejemplo entre un neutrón y un protón, habrá resonancias, o sea estados ligados de energı́a positiva, si se cumple la condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias. Puede haber resonancias sólo si: 0, 84 µA > h̄2 α (5.57) La barrera que se forma en Vef se llama “barrera centrı́fuga”. Se entiende por resonancia (“de forma”) el efecto túnel que se produce cuando la partı́cula viene desde r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto tiempo. Este proceso no es clásicamente posible. 136 / Mecánica clásica avanzada αl 2 µA f(x) x0 Figura 5.5 Solución f (x) al potencial efectivo 5.2. El oscilador armónico tridimensional Es el problema del movimiento de la partı́cula de masa reducida en presencia de la interacción central: f~(r) = −kr êr (5.58) Solución en coordenadas cartesianas. Tomando coordenadas cartesianas en el plano de la órbita, la solución al oscilador armónico bidimensional es (5.40). La ecuación de la órbita es: x2 y2 2xy cos δ = sen2 δ ; + − A2x A2y Ax Ay δ = φy − φx (5.59) La ecuación (5.59) es la forma cuadrática bidimensional de la forma ~r · M̃~r = sen2 δ, donde M̃ es la matriz: a − cos δ −1 ; a = Ay (5.60) M̃ = A−1 x Ay Ax −cosδ a−1 Realizando una rotación de coordenadas es posible diagonalizar a M̃ . Sea la rotación ~r = R̃~r ′ , entonces: ~r ′ · R̃T M̃ R̃~r ′ = sen2 δ (5.61) Movimiento de dos partı́culas que interactúan ... / 137 La matriz R̃ es ortogonal, R̃R̃T = I˜ y diagonaliza a M̃ si es de la forma: cos α −senα 2 cos δ ; R̃ = tan 2α = −1 a −a senα cos α (5.62) R̃T es la transpuesta de R̃. Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M̃ diagonalizada son: 1 − cos δ 1 M̃ = 2 A 0 π α = (cos δ > 0) ; 4 0 1 + cos δ (5.63) La ecuación de la órbita (5.60) se torna la estándar de la elipse, con semiejes mayor a y menor b, y excentricidad ǫ: r r δ 2 cos δ b2 δ a = A cos ; ǫ= 1− 2 = (5.64) b = A sen ; 2 2 a 1 + cos δ δ está relacionado con el momento angular y A con la energı́a total: l=− E senδ ; ω E = µA2 ω 2 (5.65) Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en términos de E y l: s kl2 s 2 1− 2 2 µE kl 1E s 1+ 1− (5.66) E2 = ; a2 = 2 2 k µE 2 kl 1+ µE Solución en coordenadas polares. En vez de hacer la transformación de coordenadas, usaremos las fórmulas halladas en el numeral anterior, cuando se toma el eje Z perpendicular al plano de la órbita. De la ecuación (5.35) se sigue: l φ − φ0 = √ 2µ Z r r0 r2 dr s l2 1 E − kr2 − 2 2µr2 (5.67) Haciendo la sustitución ρ = r2 , (5.67) toma la forma: l φ − φ0 = √ 2 µk Z r2 r02 ρ s dρ 2E l2 −ρ2 + ρ− k µk (5.68) 138 / Mecánica clásica avanzada La integral se halla en tablas de integrales. El resultado es: r2 2 2Eρ 2l − 1 l k µk −1 √ s φ − φ0 = sen 2 µk l 2 2 4E 4l √ ρ − µk k2 µk 2 (5.69) r0 Entonces llegamos a: r2 = B2 1 − e sen2(φ − φ0 + β0 ) (5.70) donde B, e y β0 son: B= s l2 µE ; e= s 1− kl2 µE 2 ; 2β0 = arcsen l2 µk r02 e r02 − (5.71) La ecuación de la elipse centrada y no rotada en coordenadas polares es: r2 = b2 1 − cos2 φ (5.72) ǫ2 Si se rota 45◦ toma la forma: b2 r2 = 1 − ǫ2 cos2 (φ − φ ) 4 = b2 /(1 − ǫ2 /2) ǫ2 1− sen2φ 2 − ǫ2 (5.73) Las ecuaciones (5.70) y (5.73) coinciden si: β0 = φ0 ; B2 = b2 2 ǫ 1− 2 ; e= ǫ2 2 − ǫ2 (5.74) Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los parámetros de la elipse en función de las constantes de movimiento. La órbita es una elipse y el centro de la misma coincide con el centro de fuerza. Cálculo de la variación temporal del radio. Para hacer este cálculo usamos la ecuación (5.33): Z r dr s (5.75) t − t0 = r0 1 2 l2 2 E − kr − 2 2 µ 2 µ r Los puntos de retorno se hallan resolviendo la ecuación (5.39): s ! 2 kl E E 2 1± 1− = (1 ± e) rmax, min = k µE 2 k (5.76) Movimiento de dos partı́culas que interactúan ... / 139 Vemos que: l rmax = a = p ; µE(1 − e) l rmin = b = p µE(1 + e) (5.77) Esto nos permite escribir la expresión bajo el signo de raı́z cuadrada en (5.75) como: r Z r µ rdr p t − t0 = (5.78) 2 k r0 (a − r2 )(r2 − b2 ) Haciendo el cambio de variable p = r−2 , llegamos a: 1 t − t0 = 2 r µ k Z r −2 r0−2 dρ p 2 ρ (a ρ − 1)(1 − b2 ρ) (5.79) La solución a esta integral se encuentra en tablas. El resultado es: 1 t = t0 = 2 r (a2 + b2 )ρ − 2 µ arcsen k ρ(a2 − b2 ) r0−2 (5.80) r −2 Incluyendo en t0 la parte que depende de r0 llegamos a: r2 = a2 + b 2 a2 − b 2 E + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] 2 2 k (5.81) l no puede ser arbitrario, está restringido al rango: 0≤l≤ E ω (5.82) La ecuación (5.82) corresponde al comportamiento cuántico, haciendo la correspondencia con los números cuánticos l → lh̄ y E = nh̄ω, donde los valores permitidos del número cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n. Cuando l = E/ω, e =p 0 y ǫ = 0, la órbita es circular pues según (5.81) el radio de la órbita es constante: r = E/k. Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectilı́nea. Según (5.81) la variación temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando e 6= 1: r= r π 2E cos ω(t − t0 − ) k 4ω (5.83) Para hallar a r(t) a partir de (5.81) se requiere realizar una expansión en serie infinita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental 2ω y todos sus armónicos. 140 / Mecánica clásica avanzada 5.3. El potencial 1/r Se trata de estudiar el movimiento de la partı́cula de masa reducida bajo la fuerza: k f~(r) = − 2 êr r (5.84) Este problema es separable en coordenadas esféricas, en coordenadas parabólicas y tal vez en otras coordenadas. La solución en coordenadas parabólicas la hallaremos posteriormente con el formalismo de Hamilton-Jacobi. Aquı́ resolveremos el problema en coordenadas esféricas. La ecuación de la órbita. Es cómodo usar la ecuación diferencial de la órbita (5.38). La solución es simple; el resultado es: l2 /µk = 1 + ǫ cos(φ − φ0 ) r (5.85) donde ǫ y φ0 son las dos constantes de integración. Vemos que rmin ocurre cuando φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la dirección del vector rmin . La órbita será simétrica respecto a la lı́nea φ = φ0 . Relacionemos a ǫ con las constantes de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando ṙ = 0 en: E= 1 2 k l2 − µṙ + 2 2µr2 r (5.86) O sea que: rmin, max k =− 2E 1± s 2El2 1+ µk 2 ! (5.87) Cuál de los signos corresponde a rmin o rmax depende del signo de k y del signo de E.3 Si rmax es finito, el movimiento será ligado. Por otra parte, de (5.85) vemos que: rmin, max = l2 /µk 1±ǫ Comparando a (5.88) con (5.87) hallamos que: s 2El2 ǫ= 1+ µk 2 (5.88) (5.89) El signo de ǫ lo hemos tomado positivo. La ecuación (5.85) representa una sección cónica. Las secciones cónicas. Son las curvas que definen la intersección de un cono con un plano. Sobre el plano una curva cónica es el lugar geométrico de los puntos cuya 3 En estos puntos cambia el signo de la velocidad radial. Además, para E ≥ 0, según veremos, sólo existe un punto de retorno. Movimiento de dos partı́culas que interactúan ... / 141 distancia a un punto dado llamado foco es proporcional a la distancia a una lı́nea dada, la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando ǫ a la constante de proporcionalidad: r = ǫ [S − r cos (φ − φ0 )] (5.90) y • Directriz r S φ φ0 x Foco Figura 5.6 Elementos de las secciones cónicas ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90): ǫS = 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91) r La curva es simétrica respecto a la lı́nea φ = φ0 . La longitud ǫS se llama parámetro de la sección cónica y ǫ se llama excentricidad. Hay distintos tipos de secciones cónicas dependiendo del valor de ǫ. Si ǫ = 1, se obtiene la parábola, es decir, el lugar geométrico de los puntos equidistantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama vértice y está situado a una distancia S/2, en tanto que la máxima distancia es infinita: 1 S; rmax = ∞; ǫ = 1 (5.92) 2 Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este caso dos distancias absidales finitas: ǫS ǫS ; rmax = ; ǫ<1 (5.93) rmin = 1+ǫ 1−ǫ El promedio entre rmax y rmin lo llamaremos a, de modo que: rmin = S=a 1 − ǫ2 ; ǫ ǫS = a(1 − ǫ2 ) (5.94) 142 / Mecánica clásica avanzada La ecuación de una elipse en coordenadas polares con foco en el origen es: r= a(1 − ǫ2 ) 1 + ǫ cos (φ − φ0 ) (5.95) La ecuación de una elipse en coordenadas polares con centro en el origen es (5.72). Las directrices están a distancias a/ǫ del centro (véase figura 5.8). Los semiejes son a y √ b = a 1 − ǫ2 . D ε=1 S/2 )φ0 S F Figura 5.7 Sección cónica: la parábola D2 S ε<1 εS D1 εa F2 • ) φ0 S F1 a /ε Figura 5.8 Sección cónica: la elipse Si ǫ > 1, la cónica es una hipérbola: curva de dos ramas con sus correspondientes focos, directrices y ası́ntotas. De la definición (5.90) se sigue la siguiente ecuación para la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85) Movimiento de dos partı́culas que interactúan ... / 143 ε<1 2 D2 εS )φ0 D1 F2 S a aε 1 a/ε F1 Figura 5.9 Sección cónica: la hipérbola cuando k > 0 y φ0 se sustituye por φ0 + π: ǫ = −1 − ǫ cos (φ − φ0 ) ; rama 1 (k < 0) r (5.96) ǫ = 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0) r Cuando φ − φ0 = π, r toma el valor rmin : (1) rmin = ǫS ; ǫ−1 (2) rmin = ǫS ; 1+ǫ (2) (1) rmin = rmin − 2a (2) (5.97) (1) cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞. Si llamamos la distancia entre los vértices 2a, también se cumple que rmin = a(ǫ − 1). Las directrices están a distancias a/ǫ del centro. El parámetro S en función de a vale: S= ǫ2 − 1 a ǫ (5.98) r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ángulo entre las dos ası́ntotas vale: 2 cos−1 ǫ−1 ; cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1 (5.99) Relación entre el signo de k y E, y el tipo de cónica. La excentricidad y el parámetro están relacionados con la energı́a y el momento angular: s l2 2El2 (5.100) ; ǫ= 1+ ǫS = µ|k| µk 2 Si el potencial es repulsivo, k es negativo. En este caso, sólo es posible que la energı́a sea positiva, pues de lo contrario rmin serı́a negativo. Entonces ǫ es mayor que 144 / Mecánica clásica avanzada la unidad y la trayectoria de la partı́cula es hiperbólica, o sea que el movimiento es no ligado. Esto es consistente con el análisis de la curva de energı́a potencial efectiva cuando k es negativo: la energı́a potencial no tiene un mı́nimo y el movimiento resulta no acotado, con sólo un punto de retorno. Es el caso cuando la partı́cula llega desde el infinito y “rebota” en la barrera de potencial. Este comportamiento incluye también el caso lı́mite en que la energı́a es cero. Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibilidades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperbólico. No hay lı́mite al valor máximo que puede tomar l: 0≤l<∞ si E>0 (5.101) A este caso, y al caso en que k es negativo, corresponden las dos ramas de la hipérbola: si k es negativo, la partı́cula se mueve sobre la hipérbola correspondiente a D1 ; si k es positivo y E > 0, se mueve sobre la hipérbola correspondiente a D2 . Si E = 0 entonces ǫ = 1. l se conserva pero no es cero porque el parámetro de impacto es infinito y en r → ∞ la velocidad es cero: 0≤l<∞ si E=0 (5.102) El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π. La trayectoria es parabólica y no tiene ası́ntotas (serı́an las rectas y = ±∞). De (5.92) se sigue que: rmin = 1 l2 S= ⇒ l 6= 0 2 2µk (5.103) Este caso se presenta cuando la partı́cula parte del reposo desde el infinito. Si E < 0, entonces ǫ < 1. En este caso: s 2|E|l2 <1 ǫ= 1− µk 2 Es claro que el rango de valores posibles de l es finito: r µ 0≤l≤ k 2|E| (5.104) (5.105) Esto es análogo al comportamiento del número cuántico orbital en el átomo de hidrógeno: l = 0, 1, ...n − 1. ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado. En este caso: rmin, max = k (1 ∓ ǫ) ; 2|E| a= k 2|E| (5.106) Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio: r= l2 k = =a µk 2|E| (5.107) Movimiento de dos partı́culas que interactúan ... / 145 Como r es constante, se sigue de (5.31) que φ̇ también es constante. Si ǫ = 1, entonces l = 0 y la trayectoria es la lı́nea recta φ = φ0 . En este caso: rmin = 0 ; rmax = a (5.108) Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor y menor dados por: a= k ; 2|E| b=a p l 1 − ǫ2 = p 2µ|E| (5.109) respectivamente. Vemos que b está comprendido, dependiendo de l, entre: 0≤b≤a (5.110) El hecho de que las trayectorias sean elı́pticas es consecuencia de la primera ley de Kepler (cuando k = GM m). Las figuras desde 5.10 hasta 5.13 muestran las curvas de energı́a potencial efectiva para cada uno de los casos. Del análisis de las mismas se obtiene cualitativamente el comportamiento descrito. Vef E r mín k<0 r Figura 5.10 Energı́a potencial efectiva. Trayectoria hiperbólica. La tercera ley de Kepler. El área de la elipse es: s p l 2 kl 2 = πa2 A = πab = πa 1 − ǫ2 = π 4|E| µ|E| lmax (5.111) Recordando la ecuación (5.31) para la velocidad areolar, obtenemos que: r πk p µ 3/2 A −2µE = 2π a (5.112) = τ= 2 2E k Ȧ 146 / Mecánica clásica avanzada Vef E r mín r k > 0, E > 0 Figura 5.11 Energı́a potencial efectiva. Trayectoria hiperbólica. Vef · E r rmín k > 0, E = 0 Figura 5.12 Energı́a potencial. Trayectoria parabólica. Vemos que el perı́odo del movimiento no depende del valor de l. Para la interacción gravitacional entre un planeta (masa m) y el Sol (masa M ), (5.112) toma la forma: s 1 a3/2 (5.113) τ = 2π G(m + M ) Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado. Movimiento de dos partı́culas que interactúan ... / 147 Vef l = l máx l l=0 · r r mín r máx k > 0, E < 0 E Figura 5.13 Energı́a potencial efectiva. Trayectoria elı́ptica. La ecuación de Kepler. Encontrar a r(t) es interesante en muchos casos, por ejemplo para predecir el movimiento de un satélite. Para hallar a r(t) debemos usar la ecuación (5.33). Por simplicidad, consideraremos sólo el caso k > 0, E < 0. Es conveniente expresar a E y l en términos de a y ǫ: p p k (5.114) E=− ; l = µka 1 − ǫ2 2a Entonces (5.33) toma la forma: r Z µa r rdr p t − t0 = 2 k r0 −r + 2ar − (1 − ǫ2 )a2 Usando la expresión para τ , ecuación (5.112), obtenemos: Z r r dr τ p t − t0 = 2πa r0 −r2 + 2ar − (1 − ǫ2 )a2 La solución a esta integral se encuentra en tablas. El resultado es: r−a 1p 2 2πa −r + 2ar − (1 − ǫ2 )a2 + arcsen (t + δ) = − τ a ǫa donde δ es una constante arbitraria. Definamos las siguientes variables: (5.115) (5.116) (5.117) 2π a−r (t + δ) ; ψ = cos−1 (5.118) τ ǫa Las cantidades M , ψ y φ reciben los siguientes nombres en astronomı́a: M , anomalı́a media; ψ, anomalı́a excéntrica y φ, anomalı́a verdadera (véase figura 5.14). De simples argumentos geométricos se sigue a partir de las fórmulas de la elipse que ψ y M tienen la siguiente interpretación geométrica: M= 148 / Mecánica clásica avanzada y R Q P M ψ r φ x Figura 5.14 Variables de la ecuación de Kepler. ψ es el ángulo del vector de posición del punto Q, tomando como origen el centro de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a, con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el texto de Marion, Classical dynamics of particles and systems, segunda edición, sección 8,8). Expresando a (5.117) en función de (5.118) obtenemos: r = (1 − ǫ cos ψ)a ; M = ψ − ǫsenψ (5.119) En (5.119) hemos adicionado a M la constante π/2. La ecuación que relaciona a ψ con M se denomina la ecuación de Kepler, y permite expresar a r en función del tiempo. ψ es una función trascendental de M . Bessel halló en 1830 la solución exacta de la ecuación de Kepler en forma de serie de Fourier. El resultado es: ψ =M +2 ∞ X Jn (nǫ) n=1 sen(nM ) n (5.120) donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t) es: ( " r(t) = a 1 − ǫ cos 2πν(t + δ)+ ∞ X sen{2πnν(t + δ)} 2 Jn (nǫ) n n=1 #) Ejemplo 5.3.1 Demostrar la solución (5.120) de la ecuación de Kepler. (5.121) Movimiento de dos partı́culas que interactúan ... / 149 ψ es una función impar de M , luego su expansión de Fourier contendrá sólo funciones seno y además contiene una componente no oscilante que será M misma. Entonces busquemos soluciones de la forma: ψ=M+ ∞ X Cn sen(nM ) (5.122) n=1 La expansión de Fourier de la función ǫ senψ = f (M ) tiene coeficientes dados por: Z 2 π Cn = f (M ) sen(nM ) dM (5.123) π 0 Utilizando la ecuación de Kepler, el integrando en (5.123) será: Z 2ǫ π senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ Cn = π 0 (5.124) Efectuando los productos y expresando los productos de funciones seno como suma de funciones coseno llegamos a: Z ǫ πn cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ Cn = π 0 1 (5.125) −nǫsenψ] dψ − ǫ cos[(n − 2)ψ 2 o 1 −nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ 2 La función de Bessel entera tiene la siguiente representación integral: Z 1 π Jκ (x) = cos (κθ − xsenθ)dθ ; κ : entero π 0 Con lo cual Cn toma la forma: h Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ) i ǫ ǫ − Jn−2 (nǫ) + Jn+2 (nǫ) 2 2 (5.126) (5.127) Las funciones Jκ tienen la siguiente relación de recurrencia: Jκ+1 (x) = 2κ Jκ (x) − Jκ−1 (x) x (5.128) El uso de (5.128) nos permite llegar finalmente a: Cn = 2 Jn (nǫ) n (5.129) Con lo cual queda demostrada la expresión (5.120). Precesión de las órbitas elı́pticas. Vimos que, bajo fuerzas centrales, las órbitas son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de lı́neas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0), 150 / Mecánica clásica avanzada las órbitas son cerradas, o sea que el ángulo de precesión de los ábsides es cero. En el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente. Para el movimiento de la luna alrededor de la tierra, además de la interacción gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adicionales como una fuerza externa no central debida al campo gravitacional homogéneo producido por el sol sobre la órbita de la luna; esto se traduce en pequeñas oscilaciones del plano de la órbita. La tierra y la luna no son masas puntuales y por ello la interacción del tipo −k/r es sólo el primer término en una expansión multipolar, que dependerá de la distribución de masa de los cuerpos; la parte central de esta interacción dará lugar a la precesión de la órbita, o sea al giro del semieje mayor de la elipse, y la parte no central da lugar a movimientos giroscópicos de la tierra y la luna. En el caso de Mercurio hay efectos de precesión de su órbita debidos al efecto combinado de todos los demás cuerpos del sistema solar y efectos residuales que sólo son explicados por la teorı́a general de la relatividad. Ejemplo 5.3.2 Analizar la precesión de la órbita de una partı́cula que se mueve en presencia del potencial: V =− C k + 2; r 2r C ≪1 ka (5.130) γ =2 Figura 5.15 Trayectoria para γ = 2 Tenemos que la fuerza sobre la partı́cula es central, ası́ que ~l es constante. La ecuación diferencial de la órbita es: µ d2 υ + υ = − 2 2 (−kυ 2 + Cυ 3 ) ; dφ2 l υ υ= 1 r (5.131) Movimiento de dos partı́culas que interactúan ... / 151 γ =3 Figura 5.16 Trayectoria para γ = 3 La solución de (5.131) es: α = 1 + ǫ cos γ(φ − φ0 ) ; r γ 2 l2 α= ; µk γ= r 1+ µC l2 (5.132) donde ǫ y φ0 son constantes de integración. φ0 es la dirección del vector absidal rmin y ǫ se puede expresar en términos de las constantes de movimiento comparando las dos expresiones para las distancias de retorno. s ! k α 2El2 2 rmax, min = − = 1± 1+ γ (5.133) 2E µk 2 1±ǫ Se sigue entonces que: rmax − rmin E= = rmax + rmin s 1+ 2El2 2 γ ; µk 2 a=− k 2E (5.134) El efecto del término adicional es variar ligeramente la excentricidad de la órbita e introducir el factor de γ a φ − φ0 . Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ángulo entre los vectores absidades γmin y rmax es: φmax − φmin = π γ (5.135) 152 / Mecánica clásica avanzada γ=5 Figura 5.17 Trayectoria para γ = 5 y no π como cuando C = 0. De esta forma, al cumplir un perı́odo, el vector rmin sufre un desplazamiento angular dado por: 1 (5.136) ∆φ = 2π 1 − γ Si la partı́cula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tardará un tiempo mayor en φ dar una vuelta completa. La trayectoria será cerrada solamente si ∆φ es un submúltiplo racional de 2π, o sea, si γ es un número racional, lo cual ocurrirá sólo accidentalmente. Si r ≥ 1 la órbita es esencialmente una elipse que precesa; el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variación de r. Ver figuras 5.15 a 5.18. Un ejemplo de aplicación del método variacional. Muchas veces no es posible resolver exactamente un problema mecánico, pero es deseable obtener información aproximada sobre el mismo. Supongamos que hay un sistema cuya solución conocemos exactamente y que tiene aspectos similares al sistema original para el cual no conocemos la solución; la solución para el sistema aproximado contendrá una serie de parámetros. El principio variacional de Rayleigh expresa que la energı́a del sistema es menor que el valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de modo que del sistema aproximado se puede obtener una aproximación óptima al problema original buscando cuáles son los valores de los parámetros que minimizan al valor medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano Movimiento de dos partı́culas que interactúan ... / 153 γ = 1,33 Figura 5.18 Trayectoria para γ ≈ 1 que es función de las variables de estado, H(q, p); para cada estado de movimiento (q, p), H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una aproximada, el valor de H siempre será en promedio mayor que el que tendrı́a tomando para q(t), p(t), sus valores exactos. Este método está relacionado con el método variacional usado en mecánica cuántica para hallar la energı́a del estado base de un sistema usando funciones de onda de ensayo. Veamos cómo trabaja por medio de un ejemplo. Consideremos un átomo de litio y tratemos de hallar las energı́as del electrón externo usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo, el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el siguiente modelo.4 El resto del átomo –los electrones internos– es reemplazado por una capa esférica de distribución uniforme de carga negativa, externa a la cual hay entonces un campo de fuerza coulombiano, correspondiente a una carga positiva +e del núcleo “apantallado” por dos electrones, y en el interior hay un campo coulombiano, correspondiente a una carga positiva +3e, la del núcleo. Llamemos ρ al radio del cascarón. Entonces la energı́a potencial en este modelo será: 2e2 3e2 − + r<ρ r ρ (5.137) V = 2 −e r>ρ r 4 Véase el texto The mechanics of the atom de Max Born, sección 28. 154 / Mecánica clásica avanzada donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la energı́a sea lo suficientemente alta, la órbita permanecerá a distancias del núcleo mayores que ρ, con lo cual la solución será, para el electrón externo, una trayectoria elı́ptica como en la figura 5.13. Pero cuando el perihelio de la órbita resulta menor que ρ, la órbita penetra al interior y no será más de forma elı́ptica pues será la correspondiente al potencial (5.137) que no es coulombiano. Si el electrón externo sólo permanece dentro de la esfera de radio ρ una fracción pequeña de tiempo es de esperarse que la órbita sea una elipse que precesa, como en la figura 5.18. Durante un perı́odo la órbita exacta correspondiente al potencial (5.137) diferirá poco de la órbita correspondiente al potencial coulombiano. Tomaremos entonces como soluciones de ensayo las órbitas elı́pticas en un potencial: V =− ze2 r (5.138) donde z será un parámetro variacional que se determina por la condición de que hHi sea un mı́nimo. Por simplicidad supondremos que el electrón externo está en un estado s, o sea que tiene l = 0. Para este caso, según (5.104) la excentricidad será ǫ = 1. Como V es central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0: r = (1 − cos ψ)a ; 2πνt = ψ − senψ (5.139) La ecuación (5.139) permite escribir a r y ṙ en la forma: r = 2a sen2 ψ ; 2 ṙ = 2πνa cot ψ 2 (5.140) La ecuación (5.140) permite ahora expresar a H en términos de la solución de ensayo ası́: H= 3e2 2e2 2 ψ 2 ψ 2 2 2 − csc + 2π mν a cot 2 2a 2 ρ 2 2π 2 mν 2 a2 cot2 ψ − e csc2 ψ 2 2a 2 r<ρ (5.141) r>ρ El valor medio de H en un perı́odo será, usando la ecuación de Kepler: hHi = 2ν Z 1/(2ν) 0 2 Hdt = π Z π 0 ψ Hsen2 dψ 2 (5.142) Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140): ψ1 = sen 2 r ρ 2a (5.143) Movimiento de dos partı́culas que interactúan ... / 155 Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual obtenemos después de manipulaciones simples: Z 2 ψ1 3e2 2e2 2 2 2 2 ψ 2ψ hHi = 2π mν a cos dψ − + sen π 0 2 2a ρ 2 (5.144) Z 2 e ψ 2 π dψ 2π 2 mν 2 a2 cos2 − + π ψ1 2 2a Efectuando las integraciones llegamos a: 2 2 e e2 e2 e2 hHi = − ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π π a ρ ρ 2a (5.145) Es conveniente expresar a e2 /a en términos del número cuántico principal n, la energı́a de Rydberg y el parámetro z, ası́: z z e2 = e 2 = 2R a n a0 n (5.146) donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analogı́a que ρ será el radio de la órbita de los electrones internos, que se mueven en presencia del núcleo que tiene carga 3e, y están en la primera órbita que tiene n = 1; entonces ρ = a0 /3. De esta forma (5.143) es: r 1 z ψ1 = (5.147) sen 2 n 6 Usando (5.112) con k = ze2 obtenemos: π 2 mν 2 a2 = π z2 R 4 n2 de modo que (5.145) tomará la forma: " r 2z 1 z 2R 6 − 2 arcsen hHi = π n n 6 r # 1 z2 π z2 − 6z − 2 + −z n n 2n 2 (5.148) (5.149) z es un parámetro que se determina por la condición de que minimice a hHi, es decir, por la condición: ∂hHi =0 ∂z (5.150) Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente ecuación trascendental: r π 1 z = sen (z − 1) (5.151) n 6 4 156 / Mecánica clásica avanzada de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza en (5.149) para obtener la energı́a: " R n E= 2z(z − 1) 1 − 2 2n 2 # r 4n z2 +zn(1 − 6n) + 6n + 6z − 2 (5.152) π n De acuerdo con el principio variacional, la aproximación óptima por medio de órbitas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial coulombiano −ze2/r, donde z es el número que se obtiene de (5.151) para cada n. Los resultados que se obtienen al resolver numéricamente a (5.151) son aproximados, dando errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta; las energı́as variacionales siempre serán mayores que las experimentales. Ası́, por ejemplo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15; −0, 03; −0, 06); (40; -0, 01; −0, 03). Los resultados no son muy buenos pero ilustran el método variacional que es usado extensivamente en muchas ramas de la fı́sica; las discrepancias se deben en parte al modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método variacional en sı́, y en parte al uso de la aproximación clásica. 5.4. El problema de la dispersión bajo fuerzas centrales Esta sección trata con las soluciones que describen estados no ligados; tales son los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el problema es causal, es decir se conocen exactamente las constantes de movimiento y φ0 , las ecuaciones de la órbita nos dan la evolución de la partı́cula; este problema es estrictamente mecánico. En fı́sica microscópica, cuando se trabaja con átomos, moléculas o electrones, entre otros, una descripción mecánica es muy difı́cil; entonces se acude a conceptos estadı́sticos. En esta sección en gran parte trabajaremos con los conceptos estadı́sticos de la sección eficaz, aptos para sistemas microfı́sicos, aunque también se aplican por ejemplo en cosmologı́a. La sección eficaz de dispersión. Un experimento tı́pico de dispersión consiste en estudiar el efecto de un centro dirpersor sobre un haz de partı́culas. Se entiende por dispersión el proceso de colisión en el cual la dirección del movimiento de las partı́culas incidentes cambia al azar, como resultado de la interacción con el centro dispersor. En el estudio estadı́stico se hacen las siguientes suposiciones: todas las partı́culas del haz incidente son de la misma naturaleza y tienen la misma energı́a y dirección de la velocidad inicialmente. La interacción es de corto rango, de modo que a partir de distancias mayores que cierta cantidad α es esencialmente cero. El haz de partı́culas Movimiento de dos partı́culas que interactúan ... / 157 incidentes tiene una sección transversal A que es mucho mayor que el área efectiva de interacción σ = πα2 , las partı́culas se distribuyen al azar sobre el área de la sección transversal del haz. El haz tiene un número muy grande de partı́culas para permitir un tratamiento estadı́stico, pero no tan grande como para que una partı́cula del haz interfiera con otra. Toda partı́cula que se acerque al centro dispersor a una distancia menor que α es dispersada; la probabilidad a priori de una partı́cula ser dispersada es: p= σ ; A σ = πα2 (5.153) donde σ se llama sección eficaz total de dispersión y es una medida de la dispersión en cualquier ángulo. Llamaremos θ al ángulo entre la dirección del haz incidente y la del movimiento final de una partı́cula dispersada. Las partı́culas que incidan sobre el blanco con un parámetro de impacto s serán dispersadas en un ángulo θ; las que incidan con un parámetro de impacto s + ds serán dispersadas en un ángulo θ + dθ donde dθ es negativo. Todas las partı́culas que incidan sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular θ y θ + dθ. Todas las partı́culas que incidan sobre el área dσ (área rayada en la figura 5.19) se dispersarán con ángulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α, rd θ A dσ r dϕ θ θ + dθ dϕ ds Figura 5.19 Sección eficaz de dispersión entonces hemos notado que no hay diferencia esencial en suponer que las partı́culas emergen del centro dispersor en vez del centro del área rayada dσ. Estas partı́culas serán dispersadas dentro de un ángulo sólido dΩ dado por: dΩ = senθ dθ dφ (5.154) La probabilidad de dispersión dentro del ángulo dΩ se expresa en función de la llamada sección eficaz dσ. dp = dσ s ds dφ = A A (5.155) Supongamos que la intensidad del haz incidente es I: I= ∆N A ∆t (5.156) 158 / Mecánica clásica avanzada donde ∆N es el número de partı́culas incidentes que pasan por el área A durante el tiempo ∆t. De las ∆N que en ∆t pasan a través de A, solamente dN (θ) incidirán sobre el área dσ y serán dispersadas dentro de dΩ en el tiempo ∆t. Entonces la probabilidad de dispersión dentro de dΩ durante el tiempo ∆t será: dp = dN (θ) dσ = ∆N A (5.157) Se sigue entonces de (5.156) y (5.157) que: dN (θ) = Idσ ∆t (5.158) Definimos la sección eficaz diferencial σ(θ), como: σ(θ) = dσ dΩ (5.159) Se sigue entonces que: σ(θ) = 1 dN (θ) I(θ) = I I ∆t dΩ (5.160) Es decir, σ(θ) es igual al número total de las partı́culas dispersadas dentro de dΩ por unidad de tiempo y unidad de ángulo sólido, dividido por el número de partı́culas incidentes por unidad de área por unidad de tiempo. Como esta definición de σ(θ) incluye sólo conceptos macroscópicos, o sea conceptos de cantidades observables experimentalmente, entonces es válido también en mecánica cuántica. La siguiente expresión mecánica que resulta de (5.159) al reemplazar a dσ y dΩ en función de θ, φ y s sólo es válida en mecánica clásica, σ(θ) = dσ −s ds = dΩ senθ dθ (5.161) La ecuación (5.161) está expresada en función de s, que en microfı́sica no es accesible directamente al experimento. La relación entre las tres definiciones de sección eficaz (sección eficaz, sección eficaz total y sección eficaz diferencial) es: Z Z σ = dσ = σ(θ) dΩ (5.162) Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de partı́culas de masa m y radio b también duras, que se dispersan elásticamente al chocar. Hallar la sección eficaz diferencial (véase figura 5.20). El parámetro de impacto está dado por: s = (a + b) senα = (a + b) cos θ 2 (5.163) Movimiento de dos partı́culas que interactúan ... / 159 a z S b α α θ Figura 5.20 El haz partı́culas de masa m y radio b incide sobre una esfera de masa infinita y radio a Entonces: σ(θ) = 1 (a + b)2 ; 2 σ = π(a + b)2 (5.164) σ(θ) no depende de θ ni de la energı́a. Cuánticamente se halla que σ es cuatro veces mayor debido a efectos de difracción. Sección eficaz diferencial de Rutherford. Es la sección eficaz diferencial de dispersión coulombiana, cuando inciden partı́culas cargadas sobre un blanco de masa infinita y cargado eléctricamente. Asumamos que las cargas son positivas, ze y z ′ e, de modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una de las partı́culas, que es hiperbólica. Tomamos por simplicidad a φ0 = 0 con lo cual obtenemos de acuerdo con la figura 5.9, la figura 5.21. De acuerdo con la definición de sección cónica, la ecuación de la hipérbola (rama 1 en la figura 5.9) es: QF2 = ǫQD2 (5.165) donde Q es el punto cuyo vector de posición es ~r, F2 es el foco de la derecha y D2 la directriz de la derecha. Entonces la ecuación de la trayectoria es: ǫs ǫs l2 /mk = −1 − ǫ cos φ ⇒ φ = π → rmin = = r ǫ−1 1−ǫ (5.166) Que también se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor: 1 (5.167) φmin = cos−1 − ǫ φmin está relacionado con el ángulo de dispersión θ: φ π θ + θ = φmin ; θ + φ = π ⇒ φmin = + 2 2 2 (5.168) 160 / Mecánica clásica avanzada y • z′e Q θ / 2 r Θ O ϕ •ze x v∞ •u S Figura 5.21 Dispersión de Rutherford. La trayectoria de las partı́culas es hiperbólica. Entonces: 1 θ θ cos φmin = −sen = − ⇒ ǫ = csc 2 ǫ 2 (5.169) Por otra parte ǫ está relacionado con E y l, o sea con υ∞ y con s: l = mυ∞ s ; E = 1 mυ∞ 2 2 (5.170) Como, según (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que: s2 = k2 2 (ǫ − 1) 4E 2 (5.171) De (5.169) y (5.171) se sigue que: s= k θ cot 2E 2 Reemplazando a (5.172) en (5.161) obtenemos para σ(θ): 2 θ k csc4 σ(θ) = 4E 2 (5.172) (5.173) que es la fórmula de Rutherford.5 Como el resultado no depende del signo de k, la fórmula también es válida cuando el potencial es atractivo. 5 Hallada en 1911. En el tomo I del Berkeley physics course, al final del capı́tulo 15, puede verse el trabajo original de Rutherford. Movimiento de dos partı́culas que interactúan ... / 161 La fórmula (5.173) coincide exactamente con la formula cuántica no relativı́stica; es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad con los resultados cuánticos. La sección eficaz total que se calcula de (5.173) resulta infinita. Como σ es una medida de la dispersión, el área efectiva para la dispersión de Coulomb es infinita por ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del blanco siempre habrá dispersión en alguna dirección. Sistemas de referencia de centro de masa y de laboratorio. Hasta aquı́ las consideraciones de las órbitas se han hecho suponiendo que el centro de fuerzas es inmóvil, lo que equivale a decir que trabajamos en un sistema de referencia donde se mueve una partı́cula de masa reducida µ, que puede asumirse que está colocada en vez de la partı́cula 2, en tanto que el centro de fuerzas, inmóvil, está donde estaba la partı́cula 1. El radio vector ~r describe el movimiento de la partı́cula µ, ası́ como el movimiento relativo de las dos partı́culas originales [ecuaciones (5.9) a (5.13)]. Aquı́ analizaremos más en detalle la transformación de coordenadas, de manera adecuada a los procesos de dispersión bajo fuerzas centrales. Experimentalmente los procesos de dispersión se trabajan en el sistema de referencia de laboratorio. Los cálculos teóricos se hacen en el sistema de centro de masa, donde la dinámica de los problemas consiste en el movimiento de la partı́cula de masa µ. Es necesario encontrar la conexión entre los resultados teóricos y los experimentales. Todas las fórmulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo que el centro dispersor es fijo (véase figura 5.22). En el laboratorio usualmente una de las dos partı́culas, que llamaremos el blanco, está inicialmente en reposo y sobre ella incide el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separación de las dos partı́culas es mucho mayor que el rango de la interacción α, es ~υ y la del blanco ~ = 0. En el centro de masa estas dos velocidades son ~υc y V ~c respectivamente. La es V m -v v m m c.m. Laboratorio: inicial M1 vc x x c.m. v=0 vc Laboratorio: final Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ . m ~υ = ~υ (5.174) m+M Los momentos lineales de las partı́culas inicialmente, cuando su separación es muy grande de modo que no interactúan, son en el laboratorio: p~P L = m~υ ; pBL = 0 y en el centro de masa son: p~P C = m(~υ − ~υ) = µ~υ ; (5.175) ~pBC = M (0 − ~υ) = −µ~υ (5.176) 162 / Mecánica clásica avanzada Las energı́as cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son: TL = 1 mυ 2 ; 2 TC = 1 2 µυ 2 (5.177) La energı́a cinética del centro de masa, que es constante, es: TC.M = 1 (M + m)υ 2 2 (5.178) De modo que si p ~ es el momento lineal relativo, las energı́as cinéticas están conectadas por: TL = p~2 P~ 2 + = TC.M + Tc 2(M + m) 2µ (5.179) o sea que en la región asintótica (r → ∞): TL = EL ; EC.M = TC.M = µ EL ; M EL = m EC µ (5.180) El momento lineal total anterior a la colisión (r → ∞), es igual al momento lineal total después de la colisión (r → ∞). Usaremos primas para denotar las cantidades en la región asintótica después de la colisión. En el centro de masa el momento lineal total es cero, de modo que: ~C = 0 ; m~υC + M V ′ ~′ =0 m~υC + MV C (5.181) La ecuación de la conservación de la energı́a total en el centro de masa es: 1 1 ~2 1 1 ~ ′2 2 ′2 m~υC + MV υC + MV C = m~ C 2 2 2 2 La fórmula (5.182) se puede escribir, usando (5.181), en la forma: m ′ m ′ ′ · ~υC + ~υC = ~υC ~υ ~υC · ~υC + M M C (5.182) (5.183) Se sigue entonces que: 2 ′2 υC = υC ; VC2 = VC′2 ; ′ mυC = mυC = M VC = M VC′ (5.184) es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son iguales, de modo que en el centro de masa cada partı́cula queda después de la colisión con la misma energı́a inicial.6 En el proceso de colisión no interviene el ángulo φ, porque con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos ahora la relación entre los ángulos de dispersión θL y θC . La relación de las velocidades de centro de masa y laboratorio es: ′ ′ ~υL = ~υC + ~υ ; 6 Se V~L′ = V~C′ + ~υ (5.185) ve que la partı́cula µ no coincide con m cuando se toma el origen de ~ r en el centro de masa. Como sólo interesa θC , es irrelevante saber dónde está el origen de ~ r. Movimiento de dos partı́culas que interactúan ... / 163 v2′ m Vc′ m r Θc Θ2 v vc v r C.M. Centro de mesa M C.M. vc v=0 Laboratorio v2′ vc′ Figura 5.23 Sistemas laboratorio y centro de masa Sabemos que: υC = ~ M~ ~BC p = υ; m m ~C ′ = p~BC = −~υ V M (5.186) ′ Como υC = υC y VC′ = VC , la ecuación (5.186) nos dice que: ′ υC = M υ; m VC′ = −υ (5.187) ′ ′ O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC < υ = VC′ . Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras 5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego: senθLmax = ′ M υC = υ m (5.188) o sea que hay una región angular en el laboratorio que está prohibida cuando m > M . Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es común para los casos m > M y m < M . Dicha relación se obtiene a partir de: υL senθL = υC senθC ; υL cos θL = υ + υC cos θC (5.189) Se sigue entonces que: tan θL = senθC ; cos θC + γ γ= m M (5.190) Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃ (1/2)θC . Hallemos ahora la relación entre las secciones eficaces diferenciales σL (θL ) y σc (θc ). La sección eficaz dσ es invariante por ser perpendicular a la dirección del movimiento del proyectil en los dos sistemas de referencia: dσC = dσL (5.191) 164 / Mecánica clásica avanzada v ′L vi′C ΘL ΘC v γ>1 Figura 5.24 Relación entre los ángulos de dispersión θC y θL con γ > 1 v ′L ΘL vi′C ΘC v γ<1 Figura 5.25 Relación entre los ángulos de dispersión θC y θL con γ < 1 de (5.159) se sigue entonces que: σC (θC )dΩC = σL (θC )dΩL ; σL (θL ) = σC (θC ) d(cos θC ) d(cos θL ) (5.192) Movimiento de dos partı́culas que interactúan ... / 165 Para hallar el factor en (5.192), notemos que de (5.190) se sigue: tan θC = senθL cos θL − γ 1+γ (5.193) Entonces usamos: d(cos θC ) d(cos θC ) d(tan θC ) = = d(cos θL ) d(tan θC ) d(cos θL ) Para obtener finalmente:7 2 p 2 sen2 θ + γ cos θ 1 − γ L L d(cos θC ) p = fγ (θL ) = d(cos θL ) 1 − γ 2 sen2 θL (5.194) (5.195) La fórmula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los cálculos teóricos, centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) = 4 cos θL , y si γ = 0, f0 (θL ) = 1. Ejemplo 5.4.2 Hallar la sección eficaz diferencial de dispersión en el laboratorio para la colisión de dos esferas duras de masas m y M , y radios b y a respectivamente. En el centro de masa la dispersión es como en la figura 5.20, de modo que: σC (θC ) = 1 (a + b)2 4 (5.196) El resultado se obtiene usando la siguiente consideración: el problema es como si reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una de masa infinita. Como la interacción es la misma, entonces el radio de la esfera de masa µ debe ser b y el de la esfera de masa infinita debe ser a. Como la ecuación (5.164) no depende del valor de la masa, se sigue el resultado (5.196). En el sistema de referencia de laboratorio la sección eficaz diferencial es: σL (θL ) = 1 (a + b)2 fγ (θL ) 4 (5.197) La sección eficaz diferencial en el centro de masa es isotrópica, en tanto que en el laboratorio sı́ habrá una dependencia angular. En virtud del resultado (5.188), la función fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que θL máximo, cuando γ > 1. Ejemplo 5.4.3 Hallar la sección eficaz diferencial de Rutherford en el laboratorio cuando la masa de la carga ze es finita. 7 Ver la demostración en el texto Classical dynamics of particles and systems de Marion, 2a ed., ¯ sección 9.4. 166 / Mecánica clásica avanzada En el centro de masa σC (θC ) está dada por (5.173): 2 k θC σC (θC ) = csc4 ; k = −zz ′ e2 4E 2 En el laboratorio será: σL (θL ) = k 4E 2 1 + cos θL − γ 1+γ sen2 θL 2 −2 fγ (θL ) (5.198) (5.199) o sea que la dependencia angular en el laboratorio es mucho más complicada que en el centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que θC = 2θL y f1 (θL ) = 4 cos θL : 2 cos θL k ; γ=1 (5.200) σL (θL ) = 2E sen4 θL 6 Pequeñas oscilaciones de sistemas de varios grados de libertad En vez de exponer el formalismo general, resolveremos en detalle algunos problemas que ilustran los aspectos principales del mismo. Veremos que las fórmulas que se obtienen en forma de matrices se generalizan fácilmente. Al respecto, el lector puede ver los correspondientes capı́tulos en los textos de Goldstein, Hauser, Marion, Gantmacher, entre otros, donde además se explica en qué consiste la “pequeñez” de las oscilaciones. 6.1. Modos normales de oscilación. Caso no degenerado La molécula triatómica lineal. Oscilaciones longitudinales. La molécula triatómica lineal consta de dos átomos de masa m y uno de masa M , ligados entre sı́ por fuerzas interatómicas de modo que en la configuración de equilibrio la molécula es lineal, y al oscilar se conserva la forma lineal (véase figura 6.1). Supondremos que las interacciones más importantes se presentan entre los átomos 1 y 2, y 2 y 3; más adelante incluiremos una interacción un poco más general. La energı́a potencial de interacción entre dos átomos puede variar como un pozo de potencial, a grandes distancias es atractiva y a pequeñas distancias es repulsiva, con un mı́nimo en una distancia dada. Nos interesaremos en los movimientos que consisten en pequeñas oscilaciones alrededor de la posición en que la energı́a potencial tiene un mı́nimo, que es una posición de equilibrio estable. m M m x1 x2 x3 Figura 6.1 Molécula triatómica lineal 167 168 / Mecánica clásica avanzada Para estos movimientos se cumple: (a) La energı́a potencial es del tipo de un “resorte” con pequeñas elongaciones; (b) La energı́a cinética no depende de la posición, o sea, es función cuadrática homogénea de las velocidades, con coeficientes que no dependen de la posición. Ver la discusión detallada de lo anterior, por ejemplo en Gantmacher, numeral 40. El número de grados de libertad necesarios para especificar las oscilaciones longitudinales es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte” que une los átomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la partı́cula i en la configuración de equilibrio. La elongación del resorte 1−2 será entonces: (x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 ) (6.1) ηi = xi − xi0 (6.2) Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición de equilibrio: podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como: η2 − η1 y η3 − η2 (6.3) de modo que la energı́a potencial para pequeñas oscilaciones será: 1 1 k(η2 − η1 )2 + (η3 − η2 )2 V = 2 2 (6.4) 1 2 2 2 k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 ) 2 donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a considerar aquı́, pero que supondremos conocido. En (6.4) no se incluye interacción entre los átomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en la forma: 3 1 X kij ηi ηj (6.5) V = 2 i,j=1 donde kij son los elementos de la matriz 3 × 3, k̃: 1 −1 0 −1 2 −1 k̃ = k 0 −1 1 (6.6) k̃ es una matriz simétrica, kij = kji . La energı́a cinética es: 1 1 1 mẋ21 + M ẋ22 + mẋ23 T = 2 2 2 = 3 1 X mij η̇i η̇j 2 i,j=1 (6.7) Pequeñas oscilaciones de sistemas de varios grados de libertad / 169 donde mij son los elementos de la matriz 3 × 3, m̃, que es diagonal y por lo tanto simétrica: m 0 0 m̃ = 0 M 0 (6.8) 0 0 m El lagrangiano del problema es: L= 3 1 X (mij η̇i η̇j − kij ηi ηj ) 2 i,j=1 (6.9) Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales de L respecto a ηi y η̇i . Para ello evaluemos a dL: dL = 3 1 X (mij dη̇i η̇j + mij η̇i dη̇j − kij dηi ηj + kij ηi dηj ) 2 i,j=1 (6.10) usando la simetrı́a de k̃ y m̃, un cambio adecuado de los ı́ndices mudos de la suma permite escribir, 3 3 3 X X X mij η̇j dη̇i − kij ηj dηi (6.11) dL = i=1 j=1 j=1 con lo cual obtenemos: 3 3 X X ∂L ∂L kij ηj ; mij η̇j ; i = 1, 2, 3 =− = ∂ηi ∂ η̇i j=1 j=1 (6.12) Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son: 3 X (mij η̈j + kij nj ) = 0; i = 1, 2, 3 (6.13) j=1 Si definimos los vectores en el espacio de configuración del sistema, 0 η̈1 η1 ¨ ~ η= ~ η2 ; ~η = η̈2 ; 0 = 0 0 η̈3 η3 (6.14) las ecuaciones de Lagrange (6.13) toman la forma condensada: m̃~ η¨ + k̃~η = ~0 (6.15) 170 / Mecánica clásica avanzada Veremos que (6.15) es la forma de la ecuación de movimiento para cualquier sistema de muchos grados de libertad con pequeñas oscilaciones. El sistema que consideramos tiene sólo oscilaciones en una dimensión; sin embargo, por tener tres grados de libertad para los movimientos longitudinales, el espacio de configuración de tales movimientos es tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describirán el movimiento del punto del espacio de configuración. La ecuación para el vector ~η , (6.15), es lineal, luego la solución general puede expresarse como una combinación lineal de las soluciones linealmente independientes. Como el vector ~ η es tridimensional, existirán tres soluciones linealmente independientes, en términos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con α = 1, 2, 3, de modo que la solución general de (6.15) será de la forma: ~η = C1 ~ η1 + C2 ~η2 + C3 ~η3 (6.16) Como la ecuación de movimiento es de segundo orden, la solución contendrá dos constantes de integración arbitrarias por cada grado de libertad. En total hay seis constantes de integración que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma: ~ηα = ~ µα sen(ωα t + φα ); α = 1, 2, 3 (6.17) ~ α es un vector tridimensional constante y φα es una constante de integración. Las µ componentes de ~ µα son µα1 , µα2 , µα3 . En términos de las componentes, (6.17) será: ηαi = µαi sen(ωα t + φα ) ; i, α = 1, 2, 3 (6.18) En (6.18) el ı́ndice i se refiere a los grados de libertad, en tanto que α numera las soluciones diferentes. ωα es una constante que no debe depender de las constantes de integración. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente independientes cuando ωα 6= ωβ , las ~ηα serán linealmente independientes cuando ωα 6= ωβ . Las soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas las partı́culas oscilan con la misma frecuencia y tienen una definida relación entre sus amplitudes de oscilación. La pregunta que sigue es: ¿cuánto valen las ωα y cuáles son las relaciones que deben existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15): (−ωα2 m̃ + k̃)~ µα = ~0 , 3 X (ωα2 mij + kij )µαj = 0; i, α = 1, 2 , 3 (6.19) j=1 La ecuación (6.19) es un sistema de tres ecuaciones lineales algebraicas homogéneo, con las tres incógnitas µα1 , µα2 , µα3 , que tendrá solución para ciertos valores de ωα . Hallar a ~ µα equivale a realizar la siguiente operación con matrices: µα = (−ωα2 m̃ + k̃)−1~0 ~ (6.20) Vemos que ~ µα será no trivial, es decir, diferente del vector ~0 solamente si la matriz k) es singular, o sea si su determinante es cero. Esto introduce una condición que permite determinar las ωα : (−ωα2 m + det(ωα2 m̃ − k̃) = 0 (6.21) Pequeñas oscilaciones de sistemas de varios grados de libertad / 171 La ecuación (6.21) se llama ecuación secular o determinante secular. El término secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una ecuación análoga en astronomı́a que aparece al realizar cálculos perturbativos que predicen efectos sobre las órbitas apreciables sólo en tiempos muy largos. De acuerdo con las ecuaciones (6.6) y (6.8) se tiene que: ωα2 m̃ mωα2 − k − k̃ = k 0 k M ωα2 k 0 k − 2k mωα2 − k (6.22) El determinante de la matriz (6.22) es: det ωα2 m̃ − k̃ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2 −k k(mωα2 − k) (6.23) Por tanto la ecuación (6.21) es una ecuación algebraica de tercer grado en ωα2 , que tendrá tres raı́ces que serán ω12 , ω22 y ω32 : M + 2m k (ω 2 − 0) ω 2 − k det ωα2 m̃ − k̃ = m2 M ω 2 − m Mm (6.24) = m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 ) En conclusión, las frecuencias con las cuales puede ocurrir la oscilación simultánea de las tres coordenadas son: ω12 = 0; ω22 = k m k 1+2 ; ω32 = m m M (6.25) Si m ≪ M entonces ω2 ≈ ω3 presentándose una cuasidegeneración. Hay una matriz 172 / Mecánica clásica avanzada de la forma (6.22) por cada una de las frecuencias (6.25): ω12 m̃ − k̃ = ω22 m̃ − k̃ = −k k k 0 k k k ω32 m̃ − k̃ = 2 0 k m k M k k 0 k M − 2m k m 0 k −k −2k 0 0 (6.26) 0 k 0 M m k k 2 m k M Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes de los vectores ~ µ1 , µ ~ 2 y ~µ3 , son: −k k 0 0 k 2 0 µ11 k µ12 µ13 −k −2k k 0 k k k 0 M m k k 2 µ21 µ31 µ22 k µ23 0 M − 2m k m m k M k 0 k 0 k m k M µ32 µ33 = = = 0 0 0 0 0 0 0 0 0 (6.27) Pequeñas oscilaciones de sistemas de varios grados de libertad / 173 Siendo más explı́citos, respectivamente estas ecuaciones toman la forma: µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13 µ22 = 0; µ21 + µ23 = 0; µ22 = 0 2 (6.28) m M 2m µ31 + µ32 = 0; µ31 + µ32 + µ33 = 0; µ32 + µ33 = 0 M m M Las relaciones buscadas entre los componentes de los vectores ~µα para los movimientos en que las tres partı́culas oscilan con la misma frecuencia son: ω1 : µ11 = µ12 = µ13 ω2 : µ21 = −µ23 ; µ22 = 0 ω3 : µ31 = µ33 ; µ32 = − (6.29) 2m µ31 M Cada vector µα resulta indeterminado por una constante arbitraria, aunque las relaciones entre sus componentes están bien definidas:1 1 1 1 2m (6.30) µ1 = µ11 1 ; ~ ~ µ2 = µ21 0 ; ~µ3 = µ31 − M 1 −1 1 Notamos que ~ µ1 , ~ µ2 y ~ µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 = 2µ11 µ31 (1 − m/M ); ~ µ2 · ~ µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogonales. Los vectores siguientes son ortogonales: √ √ m m √ 1/2 1/2 m̃ ~ µ1 = µ11 M ; m̃ ~µ2 = µ21 0 √ √ − m m √ m −2m m̃1/2 µ ~ 3 = µ31 √ M √ m (6.31) 1 Las trayectorias descritas en el espacio de configuración son rectilı́neas. ~ η1 corresponde a una lı́nea infinita, describe una translación no acotada a lo largo del vector ~ µ1 . ~ η2 y ~ η3 describen oscilaciones sobre segmentos rectos finitos a lo largo de los vectores ~ µ2 y ~ µ3 respectivamente. 174 / Mecánica clásica avanzada En vez de trabajar con estos vectores, es cómodo quedarse con los vectores (6.30), pero cambiando la definición del producto escalar. Definiremos el producto escalar de dos vectores ~ µ y ~ν ası́: (~ µ, ~ν ) = (m̃1/2 ~µ).(m̃1/2 ~ν ) = ~µ.(m̃~ν ) = 3 X mij µi νj (6.32) i,j=1 Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los vectores ~ µα formen una trı́ada ortonormal bajo el producto escalar (6.32), es decir, normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos conduce inmediatamente a: 1 1 1 1 0 1 ; µ1 = √ ~ ~µ2 = √ 2m + M 2m −1 1 1 −2m µ3 = r ~ m M 2m(1 + 2 ) M 1 1 (6.33) La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco del sentido fı́sico original. La exigencia de ortonormalidad nos conduce a vectores que no tienen dimensiones de desplazamiento y a soluciones que no dependen de las condiciones iniciales: contienen información sobre la relación de amplitudes pero no de su valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los movimientos longitudinales de la molécula triatómica lineal son no degenerados porque las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos modos normales diferentes con la misma frecuencia. La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente con la forma del vector propio correspondiente: las tres partı́culas se desplazan la misma cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de ~ que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la partı́cula 2 se queda quieta y las partı́culas 1 y 3 oscilan en contrafase. En el modo ~µ3 las partı́culas 1 y 3 oscilan en fase, pero la partı́cula 2 se desplaza respecto a 1 − 3 una cantidad que depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” actúa p independientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m. Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras soluciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de coordenadas generalizadas independientes para describir el estado del sistema y contienen información sobre las condiciones iniciales. Pequeñas oscilaciones de sistemas de varios grados de libertad / 175 Coordenadas normales para la molécula triatómica lineal. Las ecuaciones de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La solución (6.18) fue obtenida por “tanteo”. Un método directo de solución consiste en realizar una transformación de coordenadas donde las nuevas ecuaciones de movimiento resulten desacopladas. El lagrangiano (6.9) puede escribirse en forma compacta usando la notación matricial. Si ~η es un vector columna, ~η T es un vector fila: L= 1 ˙T ˙ 1 T η η m̃~ ~ η − ~η k̃~ 2 2 (6.34) L es una forma cuadrática no diagonal en η̇i y en ηi pues la matriz k̃ es no diagonal. Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una transformación lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de movimiento serán no acopladas, pues en ese caso L consta de una suma de términos que dependen de sólo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas generalizadas y ÃT la matriz de la transformación: η = ÃT ~ ~ θ (6.35) donde ÃT es la matriz transpuesta de Ã. En las nuevas variables L toma la forma: L= 1 ~˙ T ˙ θ Ãm̃ÃT θ~ − 2 1 ~T θ Ãk̃ ÃT ~θ 2 (6.36) Ahora exigimos que à sea tal que m̃′ = Ãk̃ÃT y k̃ ′ = Ãm̃ÃT sean ambas diagona′ les, es decir, tales que m′ij = m′i δij y kij = ki′ δij para i, j = 1, 2, 3 de modo que (6.36) queda ası́: 3 1X ′ 2 (m θ̇ − kα′ θα2 ) L= 2 α=1 α α (6.37) La ecuación de movimiento (6.37), será ahora: m′α θ̇α2 − kα′ θα2 = 0 (6.38) Las soluciones para las nuevas coordenadas, en función de las constantes de integración Cα y φα , serán: s ! kα′ (6.39) t + φα kα′ θα2 = 0; α = 1, 2, 3 θα = Cα sen m′α De (6.35) y (6.39) se sigue que: s ! 3 X kα′ ηi = Aαi Cα sen t + φα ; i = 1, 2, 3 m′α α=1 (6.40) Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sistema. El problema matemático ahora consiste en hallar las nueve componentes de la 176 / Mecánica clásica avanzada matriz Ã, que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las condiciones: (Ãm̃ÃT )ij = m′i δij ; (Ãk̃ ÃT )ij = ki′ δij (6.41) A partir de (6.16) y (6.17) vemos que ~ηi toma la forma: ηi = 3 X Cα µαi sen(ωα + φα ) (6.42) α=1 Las expresiones (6.40) y (6.42) coinciden si se cumple que: kα′ ; i, α = 1, 2, 3 (6.43) m′α Llegamos a la conclusión de que los vectores propios, o modos normales de oscilacion ~ µα , son las filas de la matriz Ã, o sea las columnas de la matriz ÃT que realiza la transformación de ~η a θ~ según (6.35). Como los vectores ~µα son ortogonales y ortonormales según el producto escalar (6.32): Aαi = µαi y ωα2 = (µα , µβ ) = δαβ ; α, β = 1, 2, 3 (6.44) Podemos escribir (6.44) también en la forma: ~ Tα m̃~µβ = δαβ ; µ α, β = 1, 2, 3 (6.45) Explı́citamente (6.45) es: 3 X mij µαi µβj = δαβ ; α, β = 1, 2, 3 (6.46) i,j=1 Notamos la identidad entre las filas de à y los vectores ~µTα , y por lo tanto podemos escribir a (6.46) como: Ãm̃ÃT = I˜ (6.47) donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las condiciones que nos definen las frecuencias ωα2 y la matriz à son de (6.41), (6.43) y (6.47): (Ãm̃ÃT )ij = δij ; (Ãk̃ ÃT )ij = ωi2 δij ; i, j = 1, 2, 3 T ωα2 (6.48) Las columnas de à son los vectores ~µα y las son los elementos diagonales de la matriz k̃ ′ = Ãk̃ÃT . La ecuación (6.47) es la condición de que la matriz à sea ortogonal, o sea que preserve el producto escalar (6.32) en una transformación de coordenadas generalizadas. Explı́citamente la matriz ÃT es: −1/2 −1/2 M 2m 1 1+ 1 + 2m M −1/2 −1/2 1 M 2m 2m (6.49) ÃT = √ 1+ 1+ 0 − 2m 2m M 2M −1/2 −1/2 2m M −1 1+ 1+ 2m M Pequeñas oscilaciones de sistemas de varios grados de libertad / 177 y la matriz k̃ ′ es: 0 0 ′ k̃ = 0 0 0 0 k 2m 1+ m M k m 0 (6.50) No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma (6.39). En efecto, para esta frecuencia la ecuación de movimiento es: θ̈1 = 0 (6.51) cuya solución es: θ1 = At + B (6.52) donde A y B son constantes de integración, aunque podrı́a llegarse a (6.52) de (6.39) mediante una expansión en serie de Maclaurin alrededor de ω1 = 0. Las otras dos coordenadas normales son: θα = Cα sen(ωα t + φα ) ; α = 2, 3 (6.53) donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53) nos permiten expresar los desplazamientos generales de las partı́culas, usando (6.35) y (6.49): η2 = t + φ3 ) 1 rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω √ r 3 2m 2m M 1+ 1+ M 2m η3 = η1 = t + φ3 ) 1 rAt + B − 2m C3 sen(ω √ r 3 M 2m 2m M 1+ 1+ M 2m (6.54) 1 t + φ3 ) rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω √ r 3 2m 2m M 1+ 1+ M 2m Esto nos dice que el movimiento más general de las partı́culas consiste en una traslación uniforme y en una superposición de oscilaciones de frecuencias ω2 y ω3 . La oscilación de la partı́cula 2 es de frecuencia ω2 en tanto que las oscilaciones de las 178 / Mecánica clásica avanzada partı́culas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de frecuencia ω2 .2 Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en términos de los valores en t = 0 de η1 , η2 , η3 , η̇1 , η̇2 y η̇3 a través de las fórmulas: ˙ ~ θ = (AT )−1 ~ η ; θ~ = Ãm̃~η ; ~θ = Ãm̃~η˙ (6.55) La matriz Ãm̃ explı́citamente es: −1/2 −1/2 M m −1/2 M M 1+ m 1+ m 1+ 2m 2m 2M 1 m 0 −m Ãm̃ = √ 2m −1/2 −1/2 −1/2 2m 2m 2m m 1+ −2m 1+ m 1+ M M M ˙ En tanto que θ~ y θ~ en t = 0 son: B A ˙ ~ θ~ = C2 senφ2 θ = ω2 C2 cos φ2 C3 senφ3 ω3 C3 cos φ3 (6.56) (6.57) Los modos normales de oscilación no son entonces más que casos particulares de la solución general (6.54) en que sólo contribuye una de las componentes normales. Ası́ por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformación a coordenadas normales puede interpretarse como la correspondencia con un sistema equivalente que consiste en un conjunto de osciladores armónicos lineales no acoplados. La descomposición en modos normales es muy útil en otras ramas de la fı́sica como la teorı́a de campos, la cual tendremos ocasión de estudiar con un campo mecánico unidimensional. Los modos normales para la molécula triatómica lineal en oscilaciones longitudinales los podemos representar gráficamente (véase figura 6.2). Generalización del formalismo anterior. Si se tiene un conjunto de osciladores acoplados con pequeñas oscilaciones, de l grados de libertad oscilatorios, con frecuencias no degeneradas, podemos fácilmente generalizar el anterior formalismo. No es difı́cil ver que en general la matriz m̃ es simétrica, aunque no necesariamente diagonal. k̃ también es simétrica. De esto se deducen importantes propiedades de los vectores propios y frecuencias propias. Las matrices m̃ y k̃ son de dimensión l × l y los vectores del espacio de configuración son de l componentes. La ecuación (6.19) puede escribirse en cualquiera de las formas siguientes: µα = ωα2 ~µα (m̃−1 k̃)~ ~ α ) = ωα2 (m̃1/2 ~µα ) ó (m̃1/2 k̃m̃−1/2 )(m̃1/2 µ (6.58) 2 El vector η ~ con componentes (6.54) describe el movimiento de un punto del espacio de configuración. En el plano formado por µ ~2 y ~ µ3 , la proyección del movimiento da una figura de Lissajous. O sea que la trayectoria de configuración se obtiene al desplazar dicha proyección a lo largo de ~ µ1 . Por ejemplo, si m ≪ M , la trayectoria será una hélice elı́ptica alrededor de µ1 . Pequeñas oscilaciones de sistemas de varios grados de libertad / 179 1 2 3 ω1 = 0 x Traslación: η1 = η2 = η3 ω2 = ω3 = m √m ( 1 + M ( k ns √k x Vibración simétrica: η1= –η3 , η2 = 0 2m x Vibración asimétrica: η1 = η3 , η2 = –2m/M η1 Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales Con la primera forma podemos definir el producto escalar en términos del “tensor métrico” de cierto espacio Riemanniano, mij : ~ ~η ) = (ζ, l X mij ζi ηj (6.59) i,j=1 La ecuación (6.58) tiene la forma de una ecuación de valores propios y vectores propios de una matriz simétrica. En efecto, m̃−1 k̃ es el producto de matrices simétricas que, según es fácil mostrar, da una matriz simétrica. Entonces se cumplen los siguientes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m̃−1 k̃ son reales y (b) los vectores propios, ~ µα , correspondientes a valores propios diferentes son ortogonales y linealmente independientes. La ecuación correspondiente a la (6.16) representa la expansión de un estado arbitrario de oscilación en un conjunto completo de vectores propios de la matriz m̃−1 k̃. La prueba de la ortogonalidad de los vectores propios es simple. Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 : µα = ωα2 ~ µα ; (m̃−1 k̃)~ (m̃−1 k̃)~µβ = ωβ2 ~µβ (6.60) Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ ~ α: (~ µβ , m−1 k̃~ µα ) = ωα2 (~ µβ , ~µα ) (6.61) µβ , ~µα ) µβ , ~ µα ) = ωβ2 (~ (m−1 k̃~ 180 / Mecánica clásica avanzada Como m̃−1 k̃ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto: l l X X µα ) = (~ µβ , m̃−1 k̃~ µβi mij krs µαs (m̃)−1 jr i,j=1 r,s=1 l X = µβr krs µαs = r,s=1 krs µβr µαs r,s=1 l l X X (m̃−1 k̃~ µβ , ~ µα ) = l X (6.62) (m̃)−1 ir krs µβs mij µαj i,j=r r,s=1 l X = krs µβs µαr = r,s=1 l X ksr µβr µαs r,s=1 Entonces se sigue que: (ωα2 − ωβ2 )(~ µβ , ~µα ) = 0 (6.63) Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene algún valor que tomamos igual a 1, entonces, (~ µα , ~ µβ ) = δα,β α , β = 1, 2, l (6.64) Ahora, si definimos con las componentes de las µα una matriz à de dimensión l × l: Aαi = µαi ; α, i = 1, 2, ...l (6.65) Entonces la ecuación (6.64) no es más que la condición de ortogonalidad de à en el espacio riemanniano de configuración: Ãm̃ÃT = I˜ (6.66) La ortogonalidad ordinaria de una matriz es ÃÃT o Ã−1 = ÃT . La ecuación de valores propios k̃~ µα = ωα2 m̃~ µα puede escribirse en términos de la matriz diagonal ω̃, con 2 elementos ωα , ωαβ = ωα2 δαβ de la siguiente forma: Ãk̃ = ω̃Ãm̃ (6.67) Si multiplicamos por ÃT y usamos la ortogonalidad de Ã, (6.67) toma la forma: Ãk̃ ÃT = ω̃ (6.68) vemos que la matriz à realiza sobre k̃ una transformación que la diagonaliza, siendo las frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen que à diagonaliza simultáneamente a m̃ y a k̃. m̃ es el tensor métrico en el espacio de configuración. Podemos entonces interpretar a à como la matriz de una transformación lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m̃ Pequeñas oscilaciones de sistemas de varios grados de libertad / 181 no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza˜ dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m̃ = I, de ahı́ que el lagrangiano en coordenadas normales tenga términos independientes entre sı́). Estos nuevos ejes son los ejes principales de k̃ porque mediante Ã, k̃ se transforma en ω̃ que es diagonal. Las coordenadas normales son un sistema de “ejes principales” en el espacio de configuración donde m̃ y k̃ son ambas diagonales.3 Esto tiene como consecuencia que las ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ̈α +ωα2 θα = 0; α = 1, 2, ...l. 6.2. Modos normales de oscilación. Caso degenerado Las oscilaciones transversales de la molécula del tipo “CO2 ” no se pueden considerar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intrı́nsecamente no lineales. La demostración de esto se propone como ejercicio. Como el potencial tiene un mı́nimo en la posición de equilibrio aun para desplazamientos transversales, es válida una aproximación por un potencial parabólico, aunque la constante k no será la misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transversales es la degeneración de los modos normales que a continuación analizamos cualitativamente. Para especificar completamente la molécula, constituida a partir de tres partı́culas puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a traslaciones a lo largo de la molécula (el modo ~µ1 analizado anteriormente) y dos grados de libertad traslacionales en direcciones perpendiculares al eje de la molécula. Además, para una posición dada del centro de masa, hay dos rotaciones alrededor de él, pues no tiene sentido una rotación alrededor del eje de la molécula. En total, pues, hay tres grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad vibracionales (dos longitudinales y dos transversales). La simetrı́a de rotación alrededor de la molécula implica que la constante k es la misma para cualquier desplazamiento transversal y como hay dos modos de oscilación transversales, éstos tendrán la misma frecuencia, es decir, la frecuencia de las oscilaciones transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”, como se representan en la figura 6.3. y y x z Modo y x z Modo z Figura 6.3 Modos de oscilación transversales. 3 En efecto, las filas de à determinan los vectores unitarios de los “ejes principales”, o sea los ~ µα . 182 / Mecánica clásica avanzada Un movimiento transversal arbitrario será una combinación de los modos “y” y “z”. Si las dos oscilaciones están en fase, el movimiento será lineal; si no, el movimiento será elı́ptico. Si la diferencia de fase es de 900 las partı́culas se moverán en trayectorias circulares, como se ve en la figura 6.4. Al aplicar el formalismo general al problema completo de la molécula del tipo “CO2 ”, se encuentra una ecuación secular de grado nueve en ω 2 pero a priori esperamos que los cinco grados de libertad no vibracionales den lugar a modos normales con frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den lugar a modos normales con frecuencia doble. Es decir, el problema completo tedrá una frecuencia quı́ntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro raı́ces diferentes. y En fase: oscilaciones lineales y En desfase: rotaciones x z x z Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble. La molécula triatómica lineal. Oscilaciones longitudinales y transversales. Consideraremos sólo el problema de hallar los modos normales de oscilación, ya que los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordenadas vibracionales se llaman coordenadas internas. Si imponemos la condición de que el centro de masa esté fijo y no haya rotaciones netas de la molécula, quedarán solamente las coordenadas internas. El cálculo lo realizaremos en tres dimensiones. ~ri es el vector de posición de la partı́cula i = 1, 2, 3 y ~ri0 el de la posición de equilibrio. La separación de la posición de equilibrio es para la partı́cula i es: d~i = ~ri − ~ri0 ; i = 1, 2, 3 (6.69) ~ 0 = m~r10 + M~r20 + m~r30 ~ = m~r1 + M~r2 + m~r3 = R R 2m + M 2m + M (6.70) d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu~ y la consideraremos fija, es decir: ración. La coordenada del centro de masa es R Se sigue entonces que las componentes de los d~i no son independientes sino que están sometidos a las condiciones: md~1 + M d~2 + md~3 = 0 (6.71) La condición sobre la no rotación de la molécula alrededor del centro de masa es que el momento angular total sea cero: ~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3 L ˙ ˙ ˙ = m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0 (6.72) Pequeñas oscilaciones de sistemas de varios grados de libertad / 183 Las coordenadas de la posición de equilibrio son, tomando el origen de coordenadas en la posición de la partı́cula 2: ~r10 = −bî; ~r20 = 0; ~r30 = bî. Por lo tanto la ecuación (6.72) es: ~ = mbî × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0 L (6.73) para pequeñas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de (6.73): ˙ ˙ î × (d~3 − d~1 ) = 0 (6.74) o más explı́citamente: d˙3y = d˙1y ; d˙3z = d˙1z (6.75) Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición de equilibrio: d3y = d1y ; d3z = d1z (6.76) La condición (6.71) vale también para las velocidades, de donde: m m ˙ ˙ ˙ d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 ) M M (6.77) En conclusión, existen las siguientes cinco relaciones entre los nueve desplazamientos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos: d1y = d3y ; d2y = − 2m d1y ; M d2x = − m (d1x + d3x ) M d1z = d3z d2z = − 2m d1z M (6.78) Existen además cinco relaciones similares a (6.78) para las velocidades de los desplazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 : η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z (6.79) Los otros cinco desplazamientos pueden expresarse en términos de los desplazamientos internos por medio de las relaciones (6.78). El espacio de configuración del sistema completo es 9-dimensional. El subespacio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de configuración que describe los movimientos de la molécula en que el centro de masa permanece fijo y no hay rotación de la misma es ~η . También: η~T = (η1 , η2 , η3 , η4 ) (6.80) 184 / Mecánica clásica avanzada Ahora debemos expresar el lagrangiano en función de ~η y ~η˙ . La energı́a cinética es: 2 1 1 ˙2 ˙2 ˙ ~ ~ T = m d1 + d3 + M d~2 2 2 (6.81) m2 2 1 ˙2 ˙ ~˙ ˙2 ˙ 2 2 2 ~ ~ ~ ˙ ˙ d1 + d3 + 2d1 · d3 m d1x + d3x + 2ḋ1y + 2d1z + = 2 2M Si usamos (6.78) y (6.79) para expresar todos los d~i en función de los η̇ν , ν = 1, 2, 3, 4 obtenemos para T (~η˙ ): m2 1 2m m 2 T = m 1+ η̇1 + η̇22 + m 1 + η̇32 + η̇42 + η̇1 η̇2 (6.82) 2 M M M puede escribirse ası́ con notación matricial: 1 ˙T ˙ η m̃~ ~ η 2 o usando la notación de producto escalar: T = 1 ˙ ˙ (~ η , ~η ) 2 donde m̃ es la matriz simétrica no diagonal siguiente: m m2 m 1 + 0 0 M M m m2 0 0 m 1+ M M m̃ = 2m 0 0 2m 1 + 0 M 2m 0 0 0 2m 1 + M (6.83) (6.84) T = (6.85) En el cálculo de la energı́a potencial vamos a considerar un modelo más realista. Llamaremos k la constante de fuerza para los desplazamientos longitudinales relativos a la partı́cula 2; k ′ la constante de fuerza para los desplazamientos longitudinales de la partı́cula 1 relativos a la partı́cula 3, y a K a la constante de fuerza para los desplazamientos transversales. La constante K no se puede expresar en función de k y k ′ mediante un modelo de resortes. La energı́a potencial de interacción entre las partı́culas para pequeñas oscilaciones es: 1 1 V = k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2 2 2 1 + K (d1y − d2y )2 + (d3y − d2y )2 2 +(d1z − d2z )2 + (d3z − d2z )2 (6.86) Pequeñas oscilaciones de sistemas de varios grados de libertad / 185 Si usamos a (6.78) y (6.79) para expresar todos los d~i en función de los ην , ν = 1, 2, 3, 4 obtenemos para V (~ η ): 1 2m2 2m ′ V = k 1+ + k (η12 + η22 ) + 2 M2 M i 1h m m 4k 1+ − 2k ′ η1 η2 2 M M " 2 # 2m 1 (η32 + η42 ) + 2K 1 + 2 M + (6.87) En notación matricial V puede escribirse ası́: V = 1 T η k̃~η ~ 2 (6.88) o usando la notación de producto escalar: V = 1 (~ η , m̃−1 k̃~η ) 2 donde k̃ es la siguiente matriz simétrica no diagonal 4 × 4: 2m 2m2 m m ′ 2k (1+ )−k ′ 0 0 k(1+ M + M 2 )+k M M m 2m 2m2 m 2k (1+ )−k ′ k(1+ 0 0 + 2 )+k ′ M M M M k̃ = 2m 2 0 0 2K(1+ ) 0 M 2m 2 0 0 0 2K(1+ ) M El lagrangiano será: L= 1 1 ˙ ˙ η) (~ η , ~η ) − (~ η , m̃−1 k̃~ 2 2 (6.89) (6.90) (6.91) La ecuación de movimiento para ~η es: m̃~ η¨ + k̃~η¨ = 0 (6.92) Buscamos soluciones propias de la forma: ηα = ~ ~ µα sen(ωα t + φα ); α = 1, 2, 3, 4 (6.93) Al reemplazar (6.93) en (6.92) obtenemos: (m̃ωα2 − k̃)~ µα = ~0 (6.94) 186 / Mecánica clásica avanzada La ecuación (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son tales que satisfacen la ecuación secular: det(m̃ωα2 − k̃) = 0 ; α = 1, 2, 3, 4 (6.95) Si usamos la siguiente notación (Classical mechanics, Corben-Stehle, capı́tulo 8): 2 2m m α = 2K 1 + ; α′ = 2m 1 + M M (6.96) m m2 2m β′ = + 2 2; β= M M M Podemos escribir: m̃ω 2 − k̃ = m(1+β ′ )ω 2 −k(1+β)−k ′ ′ 2 mβ ω −kβ +k ′ mβ ′ ω 2 −kβ +k ′ ′ 2 m(1 +β )ω −k(1+β)−k ′ 0 0 0 0 0 0 α′ ω 2 − α 0 0 0 0 α′ ω 2 −α Usando la regla para el cálculo del determinante de una matriz M̃ : detM̃ = n X Mij Cij (6.97) (6.98) i=1 donde Cij es el determinante de la matriz de los cofactores del elemento Mij : Cij = (−1)i+j Dij (6.99) donde Dij es el determinante menor complementario del elemento, entonces la ecuación secular es: n 2 o 2 m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′ (α′ ω 2 − α)2 = 0 (6.100) Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno cuadrático en ω 2 . Hay dos raı́ces dobles que son: α 2m K ω32 = ω42 = ′ = 1+ (6.101) α m M Las otras dos raı́ces son: ω12 = k + 2k ′ k ; ω22 = m m 2m 1+ M (6.102) Pequeñas oscilaciones de sistemas de varios grados de libertad / 187 ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitudinales por separado, cuando k ′ = 0. La ecuación de valores propios (6.94) es de la forma: 0 Aα Bα 0 0 µα1 Bα Aα 0 0 µα2 0 = (6.103) 0 µα3 0 0 C 0 α 0 µα4 0 0 0 Cα Los valores de las Aα , Bα y Cα son: 2m ′ m m A1 = 1+ k −k ; A2 = − k ′ − k M M M A3 = m 2m 2m 2m2 K 1+ 1+ −k 1+ − k′ + M M M M2 C1 = 2m 2m ′ k + 2k − K 1 + 2 1+ M M C2 = 2 2m 2 1+ (k − K) ; C3 = 0 M B1 = m m 2m ′ k −k ; B2 = −k ′ − k 1+ M M M B3 = K m M (6.104) 2m m m 1+ − 2k 1+ + k′ M M M La ecuación (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones algebraicas: Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0 (6.105) Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4 Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son: Aα µα2 µα1 =− =− ⇒ µα1 = ±µα2 Bα µα1 µα2 (6.106) Como se cumple que: A1 = B1 ; A2 = −B2 y A3 6= ±B3 (6.107) Entonces µα2 y µα1 deben necesariamente tener las relaciones: µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0 (6.108) 188 / Mecánica clásica avanzada Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple: µ13 = µ23 = µ14 = µ24 = 0 (6.109) µ33 , µ43 , µ34 , µ44 : Arbitrarias Tenemos en este problema seis cantidades indeterminadas. O sea que aquı́ no hay simplemente una indeterminación por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los vectores propios para este problema son de la forma siguiente: 1 1 1 −1 µ1 = µ11 ~ 0 ; ~µ2 = µ21 0 0 0 µ3 = µ33 ~ 0 0 1 µ34 µ33 ~ 4 = µ43 ; µ 0 0 1 µ44 µ43 (6.110) Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición de normalización, sin embargo µ43 y µ44 quedan aún indeterminadas. Hay un número infinito de vectores propios normalizados correspondientes a la frecuencia propia degenerada ω3 = ω4 . La condición de normalización es: ~ Tα m̃~µα = 1 ; α = 1, 2, 3, 4 µ (6.111) donde m̃ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33 y µ43 : 1 ; µ11 = √ 2m µα3 v u =u u t 1 2m 2m 1 + M µ21 = s 1 − µ2α4 ; 2m 2m 1 + M (6.112) α = 3, 4 Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes. ~3 y µ µ ~ 4 generan entonces un espacio de dimensión dos, siendo cualquier vector de este espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores linealmente independientes genera el espacio; por esto podemos sin perder generalidad escoger los vectores ~ µ3 y ~µ4 de modo que sean ortogonales entre sı́, bajo el producto escalar (6.59): µ33 µ43 + µ34 µ44 = 0 (6.113) Pequeñas oscilaciones de sistemas de varios grados de libertad / 189 Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener signos opuestos; (6.112) y (6.113) conducen a: µ234 + µ244 = 1 2m 2m 1 + M (6.114) Todavı́a los vectores no están bien definidos pues aún hay infinitos pares de vectores ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la forma: µ ~ T3 = µ ~ T4 = r 1 (0, 0, cos δ, senδ) 2m 2m(1 + ) M 1 r (0, 0, senδ, − cos δ) 2m 2m(1 + ) M (6.115) donde δ está comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y µ43 . Los vectores ~ µ3 y µ ~ 4 generan todas las posibles oscilaciones transversales con la frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son: η~3T = µ ~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z ) (6.116) η~4T = η~4T sen(ω3 t + φ4 ) Vemos que δ es esencialmente el ángulo de los vectores de desplazamientos en el plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria. z d1 (Modo µ3) δ y δ d1 (Modo µ4) Figura 6.5 Modos de oscilación transversales en el espacio de configuración 190 / Mecánica clásica avanzada Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a las oscilaciones en “z”. Una oscilación transversal general será de la forma: ~η = C3 ~ η3 + C4 ~η4 (6.117) Sin perder generalidad η~T puede escribirse en la forma: ~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )] (6.118) φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en una dirección que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el movimiento será una circunferencia y en general será una elipse, donde γ será la dirección del eje mayor de la elipse. Recordando las fórmulas (6.78), d2y = − 2m 2m d1y ; d2z = − d1z M M (6.119) d3y = d1y ; d3z = d1z Vemos que el desplazamiento del átomo central es siempre contrario al de los laterales. En general, el átomo central gira en sentido contrario a los laterales, en una trayectoria elı́ptica, con una amplitud tal que el momento angular es cero. El movimiento transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si quisiéramos describir las nueve coordenadas del sistema, deberı́amos usar vectores 9dimensionales y matrices 9 × 9. Ası́ por ejemplo, en vez de ~µ3 y µ ~ 4 tendrı́amos, usando las fórmulas (6.78): ~eT3 = ~eT4 = 2m 1 (0, 1, 0; 0, − M , 0; 0, 1, 0) 2m 2m 1 + M s 1 2m s (0, 0, 1; 0, 0, − M ; 0, 0, 1) 2m 2m 1 + M (6.120) En el tratamiento completo aparecerán además los cinco vectores propios de frecuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneración puede ser removida por ejemplo introduciendo algún efecto que rompe la simetrı́a de rotación de la interacción alrededor del eje de la molécula (de la cual se derivó que K no depende de la dirección del desplazamiento). Si existiera algún efecto direccional (como una interacción entre espines), ya no habrı́a la simetrı́a rotacional en la interacción y desaparecerı́a la degeneración. Este tema es susceptible de un estudio más completo usando la teorı́a de grupos de simetrı́as. Los vectores propios constituyen representaciones del grupo de simetrı́as. El subespacio generado por ~µ3 y µ ~ 4 es una representación irreductible bidimensional del grupo de simetrı́as (rotaciones alrededor del eje de la molécula). En otros sistemas de osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresión Pequeñas oscilaciones de sistemas de varios grados de libertad / 191 de la degeneración. Tratamiento usando el método de diagonalización. Buscaremos una matriz que diagonalice simultáneamente a m̃ y a k̃, de acuerdo con las fórmulas (6.66) y (6.68). Tanto m̃ como k̃ son diagonales en bloques de matrices 2 × 2; es razonable suponer que à sea de la misma forma: D E 0 0 F G 0 0 à = (6.121) 0 0 H K 0 0 L J Llamaremos A, B y C a los elementos de la matriz m̃ o de la matriz k̃. Se requiere entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos en la diagonal si A, B y C son los elementos de m̃, y con las ω 2 si son los elementos de k̃: D F 0 0 A B 0 0 D E 0 0 F G 0 0 B A 0 0 E G 0 0 0 0 H K 0 0 C 0 0 0 H L 0 0 K J 0 0 0 C 0 0 L J (6.122) d e 0 0 f g 0 0 = 0 0 h l 0 0 k j donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+ EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ), l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ). Asumimos que los elementos de à no dependen de las constantes k, k ′ y K entonces, como los elementos de la matriz k̃ son combinaciones de las constantes, Ãk̃ÃT será diagonal sólo si: DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0 (6.123) Esto implica las relaciones siguientes entre los elementos de A: G = F , D = −E o G = −F , D = E (6.124) 192 / Mecánica clásica avanzada ˜ Por Cuando A, B y C son los elementos de m̃, entonces (6.122) debe ser igual a I. tanto se cumple, usando las relaciones de la izquierda en (6.124), que: 2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1 (6.125) C(H 2 + K 2 ) = C(J 2 + L2 ) = 1 Recordando la expresión para A y B en m̃, ecuación (6.85), obtenemos para D y F: D=√ 1 1 = −E ; F = s =G 2m 2m 2m 1 + M (6.126) En (6.126) por convención tomamos las raı́ces cuadradas positivas. Por otra parte, para H, K, L, J, obtenemos las relaciones: K = L , H = −J o K = −L , H = J (6.127) Como hay sólo tres ecuaciones para determinar las cuatro incógnitas H, K, J, L, podemos asignar el valor a una de ellas arbitrariamente. Sea que: cos δ π ; ≤δ≤ 2 2m 2m 1 + M H=s (6.128) Con ello obtenemos las siguientes expresiones para J, K, L: sen δ =L 2m 2m 1 + M J = −H ; K = s Entonces la matriz à tiene la siguente expresión explı́cita: r r 2m 2m 1+ 0 0 1+ M M 1 1 1 0 0 à = r 2m ) 2m(1 + 0 0 cos δ senδ M 0 0 senδ cosδ (6.129) (6.130) Vemos que las filas de à coinciden con los vectores propios ~µα hallados anteriormente. Cuando tomamos como A, B y C los elementos de k̃ de la ecuación (6.96), encontramos: A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22 (6.131) C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32 Pequeñas oscilaciones de sistemas de varios grados de libertad / 193 donde ω12 , ω22 y ω32 están dados en las ecuaciones (6.101) y (6.102). En este problema el procedimiento de diagonalización se simplificó debido a la forma de m̃ y k̃ que nos permitió partir de la forma (6.121) para la matriz Ã. Para sistemas más complicados no es tan simple la elección de la forma de Ã. A pesar de esto, muchas veces la ecuación secular resulta mucho más complicada, por requerir primero la evaluación de un determinante y luego el cálculo de las raı́ces de una ecuación algebraica de grado l. En estos casos, donde l es grande y m̃ y k̃ complicadas, es más conveniente el método de la diagonalización, que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico de diagonalización de Jacobi. Ejemplo 6.2.1 Una partı́cula se mueve en presencia de un potencial central de la forma: V (r) = − A (6.132) rn−1 suponiendo que la órbita es circular, hallar los valores de n para los cuales hay pequeñas oscilaciones estables. Este es un ejemplo de pequeñas oscilaciones alrededor de un movimiento estable. Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el sistema a una distorsión. En fuerzas centrales la órbita es plana, con lo cual podemos describir la partı́cula con las coordenadas polares r, θ. El lagrangiano es: L= 1 A m(ṙ2 + r2 θ̇) + n−1 2 r (6.133) Las ecuaciones de movimiento de Lagrange son: mr̈ − mrθ̇2 + (n − 1)Ar−n = 0 mr2 θ̈ + 2mrṙ θ̇ = 0 (6.134) El movimiento de “equilibrio” es circular uniforme, o sea que son constantes: r = r0 y θ̇ = ω0 (6.135) Si se hacen pequeñas alteraciones a este movimiento estable, ρ al radio y φ̇ a la velocidad angular, habrá oscilaciones si el movimiento es estable, r = r0 + ρ y θ̇ = ω0 + φ̇ (6.136) En el movimiento de equilibrio se cumple que: mr0 ω02 = (n − 1)Ar0−n (6.137) Entonces las ecuaciones de movimiento para los pequeños desplazamientos ρ y φ̇, al primer orden en los mismos, son: mρ̈ − mω02 ρ − 2mr0 ω0 φ̇ − n(n − 1)Ar0−n−1 ρ = 0 mr02 φ̈ + 2mr0 ω0 ρ̇ = 0 (6.138) 194 / Mecánica clásica avanzada estas son ecuaciones lineales acopladas para ρ y φ̇. Buscamos ahora los “modos normales de oscilación” de ρ y φ̇: ρ = ρ0 sen(ωt + α) ; φ̇ = φ̇0 sen(ωt + α) (6.139) donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias), y α la fase, como en la ecuación (6.93). ρ0 y φ̇0 son las componentes de los vectores propios ~ µ, que satisfacen las ecuaciones algebraicas: −m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0 2mω0 ωr0 mr02 ω ρ0 0 = × (6.140) 0 φ̇0 El sistema (6.140) tiene soluciones no triviales sólo si: mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0 (6.141) Las raı́ces de (6.141) son: ω2 = 0 y ω 2 = (3 − n)ω02 (6.142) La segunda raı́z si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3 el movimiento es degenerado con dos raı́ces ω = 0. El movimiento será, pues, estable solamente si n < 3. Para una órbita de Kepler, por ejemplo n = 2. Entonces: ω02 = ω 2 (6.143) ω0 es la frecuencia de rotación de la partı́cula. ω es la frecuencia de las oscilaciones en el radio de la órbita y en la velocidad angular que coinciden con ω0 . Para un potencial central armónico, V = Ar2 , n = −1, entonces: ω = 2ω0 (6.144) La frecuencia ω 2 = 0 corresponde a un desplazamiento de una órbita circular a otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio constante en el radio de la órbita y en la velocidad angular. Hay una forma simple de calcular directamente la frecuencia de las pequeñas oscilaciones. La partı́cula se mueve radialmente dentro un “pozo” que consta del potencial centrı́fugo y el potencial externo: Vef (r) = − A rn−1 1 A l2 + mr2 θ̇2 = − n−1 + 2 r 2mr2 (6.145) En el movimiento estable el potencial tiene un mı́nimo. Para pequeños desplazamientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo Pequeñas oscilaciones de sistemas de varios grados de libertad / 195 parábolico. El problema consiste en determinar para qué valores de n es posible la formación del potencial parábolico. Vef (r) puede expandirse alrededor de r0 para pequeños desplazamientos: Vef (r) ≈ Vef (r0 ) + dVef (r) dr ρ+ r=r0 1 d2 Vef (r) 2 dr2 ρ2 = r=r0 (6.146) 1 Vef (r0 ) + kρ2 2 donde el término lineal en ρ se anula en el equilibrio y k es la “constante de resorte”: k= d2 Vef (r) dr2 (6.147) r=r0 La frecuencia de las pequeñas oscilaciones en r será: ω2 = 1 d2 Vef (r) m dr2 (6.148) r=r0 Efectuando las operaciones indicadas en (6.148), usando la relación (6.137) que se cumple en la posición de equilibrio, y notando que la magnitud del momento angular es l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente la frecuencia de las pequeñas oscilaciones alrededor de la órbita circular estable. 6.3. Un campo mecánico unidimensional: la cuerda uniforme Primero estudiaremos el sistema de n partı́culas de masa m unidas entre sı́ por cuerdas elásticas sin masa. La cuerda uniforme se obtendrá del problema anterior como un caso lı́mite en que las masas se distribuyen uniformemente formando un continuo. La cuerda estirada sin masa con un conjunto discreto de masas. Sea una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La cuerda está estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales. La longitud de cada segmento de cuerda en la posición de equilibrio es d = xi − xi−1 ; i = 1, 2, ...n + 1. Entonces L = (n + 1)d. Para los desplazamientos longitudinales, la energı́a potencial resulta de la elasticidad de la cuerda k. Para los desplazamientos transversales, la contribución de la elasticidad de la cuerda es de cuarto orden en la elongación, la demostración se propone como un ejercicio; ası́ que la contribución cuadrática viene directamente de la tensión de la cuerda τ . La tensión es independiente de los desplazamientos transversales si estos son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensión (constante) por la elongación. De modo que la energı́a potencial del segmento i cuando la partı́cula i − 1 se desplaza transversalmente ηi−1 , y la partı́cula i en ηi , es: i hp d2 + (ηi − ηi−1 )2 − d (6.149) Vi = τ 196 / Mecánica clásica avanzada η1 η2 x1 x0 = 0 ηi – 1 x2 ηi xi – 1 ηi + 1 ηi + 1 xi + 1 xi xi + 2 d ηn – 1 xn – 1 ηn xn x xn – 1 = L Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas de modo que para pequeños desplazamientos la energı́a potencial total es: V = n+1 1τ X (ηi − ηi−1 )2 2d (6.150) i=1 El espacio de configuración es n-dimensional y las matrices m̃ y k̃ son de dimensión n × n. En notación matricial: 1 V = ~η T k~η (6.151) 2 donde η~T = (η1 , η2 , ...ηn ) y 2 −1 −1 2 0 −1 τ 0 k̃ = 0 d .. .. . . 0 0 0 0 la matriz k̃ es: 0 0 ··· 0 0 −1 0 ··· 0 0 −1 · · · 0 0 2 −1 2 ··· 0 0 .. . .. . .. . .. . .. . 0 0 ··· 2 −1 0 0 · · · −1 La energı́a potencial es: 2 T T = ~η˙ m̃~η˙ (6.152) (6.153) donde la matriz m̃ es un múltiplo de la matriz unidad: m̃ = mI˜ (6.154) La ecuación de valores propios es: (−ωα2 m̃ + k̃)~ µα = ~0; α = 1, 2, ...n (6.155) Pequeñas oscilaciones de sistemas de varios grados de libertad / 197 Explı́citamente las ecuaciones de valores propios son: τ τ τ − µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n d d d (6.156) En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es: τ 2 −m̃ωα + k̃ = d λ −1 0 0 ··· −1 λ −1 0 ··· 0 −1 λ 0 0 −1 λ ··· .. . .. . .. . .. . .. . 0 0 0 0 ··· 0 0 0 0 ··· −1 · · · donde λ depende de ωα : λ = 2 − mωα2 0 0 0 0 0 τ 0 0 = D̃ d .. .. . . λ −1 −1 λ 0 d τ (6.157) (6.158) Llamemos Dn al determinante de la matriz D̃, que es un polinomio de grado n en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de polinomios: D1 = λ D2 = λ2 − 1 D3 = λ3 − 2λ = λD2 − D1 D4 = λ4 − 3λ2 + 1 = λD3 − D2 D5 = λ5 − 4λ3 + 3λ = λD4 − D3 D6 = .. . λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4 .. . (6.159) Notamos la siguiente relación de recurrencia entre los polinomios: Dk = λDk−1 − Dk−2 ; k = 1, 2, ...n (6.160) 198 / Mecánica clásica avanzada Los coeficientes de las potencias de λ pueden escribirse en términos de los números combinatorios. Ası́ por ejemplo: 9 8 7 D9 = λ9 − λ7 + λ5 9 7 5 − D10 = − 6 3 10 10 7 4 λ3 + 10 λ 4 − λ + 5 1 9 8 6 2 λ 8 λ + 2 λ − 8 6 5 0 (6.161) 6 λ De (6.161) se puede obtener fácilmente una generalización. Las fórmulas resultantes se demuestran fácilmente por el método matemático de inducción, n n/2 +k X 2 k+1 2k Dn = (−1) λ si n es par k=0 2k (6.162) n + 1 (n−1)/2 +k X 2 k 2k+1 Dn = si n es impar (−1) λ k=0 2k + 1 Es conveniente el siguiente cambio de variable: λ = 2 cos β (6.163) En términos de β obtenemos la secuencia siguiente de los Dk : D1 = 2 cos β D2 = 2 cos 2β + 1 D3 = 2(cos 3β + cos β) D4 = 2(cos 4β + cos 2β) + 1 D5 = 2(cos β + cos 3β + cos 5β) D6 = 2(cos 6β + cos 4β + cos 2β) + 1 (6.164) Se pasa de (6.159) a (6.164) usando identidades trigonométricas (fórmulas 5.53 a 5.67 del manual de fórmulas matemáticas de Spiegel). La generalización de (6.164) es Pequeñas oscilaciones de sistemas de varios grados de libertad / 199 simple; el resultado es: Dn = 2 n/2 X cos 2kβ + 1 ; si n es par k=1 (6.165) (n−1)/2 Dn = 2 X cos(2k + 1)β ; si n es impar k=0 Las fórmulas (6.165) se pueden simplificar usando cos 2kβ = (ei2β )k + (e−i2β )k 2 (6.166) y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En este caso la razón de la serie es e±2β : 1 + ei2β + (ei2β )2 + ...(ei2β )r = 1 − (ei2β )r+1 1 − ei2β (6.167) que vale si ei2β 6= 1. Ası́, si n es par: Dn = 2Re 1 − (ei2β )(n/2+1) −1 1 − ei2β (6.168) El resto es un cálculo trigonométrico. Para n impar el procedimiento es similar. El resultado final es que, para todo n: Dn = sen(n + 1)β ; senβ n par o impar (6.169) Se sigue entonces que la ecuación secular correspondiente a (6.156) es: sen(n + 1)βα = 0; α = 1, 2, ...n (6.170) Esta ecuación tiene n raı́ces, (n + 1)βα = απ, o sea: βα = α π ; α = 1, 2, ...n n+1 (6.171) Entonces los λ serán, usando (6.163): λα = 2 cos απ ; α = 1, 2, ...n n+1 (6.172) Recordando la relación entre las λα y las ωα , ecuación (6.158), obtenemos para las frecuencias propias: r απ τ ωα = 2 sen ; α = 1, 2, ...n (6.173) md 2(n + 1) 200 / Mecánica clásica avanzada Para hallar los λα −1 −1 λα 0 −1 0 0 .. .. . . 0 0 0 0 vectores propios, reemplazamos a (6.157) en (6.155): 0 0 ··· 0 0 µα1 0 µα2 0 −1 0 · · · 0 0 λα −1 · · · 0 0 µα3 0 −1 λα · · · 0 0 = .. .. .. .. .. .. .. . . . . . . . 0 0 · · · λα −1 µαn−1 0 0 0 · · · −1 λα µαn 0 (6.174) La ecuación (6.174) representa el siguiente sistema de ecuaciones lineales: µα2 µα3 µα4 µα5 = = = = .. . µαk = λα µα1 (λ2α − 1)µα1 (λ3α − 2λα )µα1 (λ4α − 3λ2α + 1)µα1 (6.175) Dk−1 (λα )µα1 .. . senkβα µα1 = senβα α, k = 1, 2, ...n La última lı́nea de (6.175) también puede obtenerse comparando a (6.160) con la relación de recurrencia para los µαk , (6.156): µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n (6.176) Entonces los vectores propios son: ~ Tα = µ µα1 (senβα , sen2βα , ...sennβα ); α = 1, 2, ...n senβα (6.177) µα1 es una constante que se determina por normalización: (~ µα , ~ µα ) = m~µTα · ~µα = m n µ2α1 X sen2 kβα = 1 sen2 βα (6.178) k=1 La sumatoria en (6.178) se puede tratar como una serie geométrica: n X n sen2 kβα = 1X (1 − cos 2kβα ) 2 k=0 k=1 n = n + 1 1 X i2βα k ) − Re (e 2 2 k=1 = n + 1 sen(n + 1) βα cos 2nβα − 2 2senβα (6.179) Pequeñas oscilaciones de sistemas de varios grados de libertad / 201 como, según (6.170), sen(n + 1)βα = 0, se sigue que: µ2α1 = 2 sen2 βα (n + 1)m (6.180) llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan: r 2 αk π µαk = sen = µkα ; α, k = 1, 2, ...n M +m n+1 (6.181) Como debe ser, las ~ µα son ortogonales pues todas las frecuencias propias ωα son no degeneradas: n (~ µα , ~ µα ) = m~µα · µ ~β = 2 X senkβα senkββ = δαβ n+1 (6.182) k=1 Las coordenadas normales para este problema son: r τ απ θα = Cα sen 2 sen t + φα ; α = 1, 2, ...n md 2(n + 1) p La matriz à que realiza la transformación 2/(M + m) sen[αβπ/(n + 1)]: 2π π sen n + 1 sen n + 1 4π sen 2π sen r n+1 n+1 2 à = M +m .. .. . . nπ 2nπ sen sen n+1 n+1 (6.183) de ~η a ~θ, η~ = Ãθ~ es simétrica, Aαβ = nπ n+1 2nπ · · · sen n+1 .. .. . . 2 n π · · · sen n+1 · · · sen (6.184) Una oscilación arbitraria del sistema está descrita por una superposición de las oscilaciones propias: r τ αiπ απ ηi (t) = Cα sen sen 2t sen + φα n+1 md 2(n + 1) α=1 n X (6.185) En los modos normales de oscilación todas las partı́culas están sobre una curva sinusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una onda viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 . 202 / Mecánica clásica avanzada La cuerda uniforme. Lagrange demostró que mediante un procedimiento de paso al lı́mite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la cuerda cargada. La densidad lineal de masa ρ es: M nm n m ρ= = = (6.186) L L n+1 d en (6.173) puede obtenerse en el lı́mite en que n → ∞, m → 0, d → 0 manteniendo m/d constante: m (6.187) lı́m ρ = n→∞ d Entonces el lı́mite de ωα cuando n → ∞ es: r απ τ (n + 1)n sen ωα = 2 ρ L2 2(n + 1) (6.188) r r 2 τ απ π τ → =α ; α = 1, 2, ...∞ L ρ 2 L ρ p Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono fundamental de una cuerda y ωα es el armónico de orden α. Cuando n → ∞, el número de modos normales de oscilación es infinito aunque es contable. En cambio el ı́ndice que numera las partı́culas se convierte en una variable continua: x → kd ; k = 0, 1, 2, ...∞ ; d→0 (6.189) x es una variable que define la posición de la partı́cula k. Entonces la fórmula (6.181) se convierte en: r πx 2 µα,k → µα (x) = ; α = 1, 2, ...∞ (6.190) sen α M L Una oscilación general de la cuerda estará dada por: r ∞ X απx απ τ η(x, t) = Cα sen (6.191) sen t + φα L L ρ α=1 donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. à ya no será una matriz, pues si bien las filas siguen siendo contables, las columnas forman un continuo. Las fórmulas de transformación entre las coordenadas ~η y las coordenadas ~θ son: ∞ X η(x, t) = µα (x)θα (t) (6.192) α=1 En vez de la matriz m̃ con elementos mij = mδij debemos tener una función delta de Dirac, de modo que Ãm̃ÃT = I˜ se convierte en: Z L Z L Z L ρ dx dy µα (x)δ(x − y)µβ (y) = ρµα (x)µβ (x)dx = 0 0 0 2 L Z o L βπx απx sen = δαβ dx sen L L (6.193) Pequeñas oscilaciones de sistemas de varios grados de libertad / 203 En vez de los elementos de m̃ y k̃, debemos tener: m(x, x′ ) = k(x, x′ ) = = ρδ(x − x′ ) τ [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] d2 d2 −τ 2 δ(x − x′ ) dx (6.194) Ãk̃ ÃT = ω̃ se convierte en: Z L Z L τ dx dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)− 2 d 0 0 δ(x − x′ − d) µβ (x) τ = 2 d ( τ d2 ( = 2 τ = ρ d2 1 2 δαβ − ρ Z ) L µα (x) [µβ (x − d) + µβ (x + d)] dx 0 2 2 δαβ − ρ M Z 0 L sen (6.195) ) βπx βπd απx 2sen cos dx L L L 4τ πβd βπd δαβ = 2 sen2 1 − cos δαβ L ρd 2L Entonces, los elementos diagonales de Ãk̃ ÃT son, tomando d → 0: ωβ2 = β 2 π2 τ L2 ρ (6.196) como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecuación diferencial. En efecto, (6.156) se convierte en: τ τ 2τ − µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197) d d d Podemos escribir a (6.197) en la forma: τ τ [µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x) d d (6.198) En el lı́mite cuando d → 0, en el lado izquierdo obtenemos: −τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x) (6.199) Tomando una vez más el lı́mite cuando d tiende a cero obtenemos: d2 µα (x) ρ 2 + ωα µα (x) = 0; α = 1, 2, ...∞ dx2 τ (6.200) 204 / Mecánica clásica avanzada Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la solución de (6.200). De (6.188) podemos obtener la ecuación diferencial que obedece la amplitud dependiente del tiempo. En efecto: r ∞ απ 2 X ∂2η απx απ τ sen = − Cα sen t + φα ∂x2 L L L ρ α=1 (6.201) r ∞ απ 2 τ X ∂2η απx απ τ = − C sen sen t + φα ∂t2 L ρ L L ρ α=1 De donde: ρ ∂2η ∂2η − =0 2 ∂x τ ∂t2 (6.202) Esta ecuación se obtiene también directamente de (6.15) y (6.195). Es la ecuación de onda en una dimensión. Hemos llegado a la teorı́a de las ondas mecánicas. No seguiremos con el tema, que nos aleja del propósito del presente capı́tulo. 7 Cinemática del cuerpo rı́gido 7.1. Definición de cuerpo rı́gido Es un sistema de partı́culas sometidas a las siguientes ligaduras holónomas: |~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N (7.1) El número de relaciones de este tipo es: N 2 = 1 N (N − 1) 2 (7.2) Para N > 7 el número de ligaduras excede el número de coordenadas 3N . En realidad, para N ≥ 4 el número de ligaduras independientes es menor que el número dado por (7.2). Sea un cuerpo rı́gido formado por más de tres partı́culas no colineales. Dados tres puntos no colineales del cuerpo rı́gido, las ligaduras fijan las posiciones de todos los demás puntos, pues para ubicar un punto en el espacio bastan sólo las distancias a tres puntos no colineales (véase figura 7.1). Luego, para especificar los grados de libertad de un cuerpo rı́gido, basta determinar el número de coordenadas independientes necesarias para ubicar la posición de tres puntos del cuerpo rı́gido. Como entre los tres puntos dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 , se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posición de tres puntos no colineales del cuerpo rı́gido. En consecuencia el número de grados de libertad de un cuerpo rı́gido es seis. Otra manera de hallar lo anterior es la siguiente. Para especificar la posición del punto 1 se requieren tres coordenadas. Para especificar la posición del punto 2, dado el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posición del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere sólo una coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos. 205 206 / Mecánica clásica avanzada i 2 l12 1 l23 l13 3 Figura 7.1 Posición de un punto respecto de tres puntos no colineales del cuerpo rı́gido 7.2. Sistemas de coordenadas espacial y del cuerpo rı́gido Para especificar la posición de un cuerpo rı́gido es suficiente: (a) Especificar la posición en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres coordenadas; (b) Especificar la orientación del cuerpo respecto a unas coordenadas fijas en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el número total de grados de libertad. El sistema de coordenadas η, ξ, ζ, está fijado al cuerpo rı́gido (véase figura 7.2). El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, sólo por translación al origen de coordenadas fijado al cuerpo rı́gido. z′ ζ z r′ r y′ a η y x′ ξ x Figura 7.2 Sistemas de coordenadas espacial y del cuerpo rı́gido Cinemática del cuerpo rı́gido / 207 Para una partı́cula del cuerpo rı́gido se tiene: ~r = ~r′ + ~a (7.3) En el sistema de coordenadas del cuerpo rı́gido la partı́cula tiene coordenadas η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas coordenadas difieren por una rotación, o sea que están relacionadas entre sı́ mediante una transformación lineal: ′ x η ξ = à y ′ (7.4) z′ ζ donde à es la matriz de la transformación. Llamemos las coordenadas ası́: x1 = x x′1 = x′ x1 = η a1 = ax x2 = y x′2 = y ′ x2 = ξ a2 = ay x3 = z x′3 = z ′ x3 = ζ a3 = az (7.5) Con lo cual podemos describir: xi = x′i + ai ; xi = 3 X aij x′j ; i = 1, 2, 3 (7.6) j=1 donde aij son los elementos de la matriz Ã. La transformación de las coordenadas espaciales (x) a las coordenadas del cuerpo rı́gido (x) son: xi = 3 X a−1 ij xj + ai i = 1, 2, 3 (7.7) j=1 −1 −1 donde a−1 . Obviamente aij no es l/aij ·. a−1 ij son los elementos de la matriz inversa ã ij son un conjunto de nueve números que especifican la dirección de los ejes de coordenadas fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los anteriores pero no rotados respecto a los espaciales. Como la descripción del movimiento translacional del cuerpo rı́gido es posible usando los métodos de la cinemática de partı́culas, podemos sin perder generalidad hacer coincidir los sistemas de coordenadas (x) y (x′ ). Nos interesaremos pues, en la relación entre las coordenadas (x) y (x). La longitud del vector ~r es la misma en los dos sistemas de coordenadas con origen común: r2 = r 2 . Por tanto: ! 3 3 3 3 X X X X −1 −1 2 aij xj a xk xi xi = r = ik i=1 i=1 j=1 3 X 3 X 3 X k=1 (7.8) r2 = i=1 xi xi = j=1 k=1 δjk xj xk 208 / Mecánica clásica avanzada Igualando las ecuaciones (7.8) obtenemos: ! 3 X 3 3 X 3 3 X X X −1 −1 δjk xj xk = aij aik xj xk j=1 k=1 j=1 k=1 (7.9) i=1 Como las x son independientes por definición, se sigue que: 3 X −1 a−1 ij aik = δjk (7.10) i=1 En términos de los elementos (Ã−1 T )lm de la matriz traspuesta de la matriz Ã−1 , que se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como: 3 X ˜ jk (Ã−1 T )ij (Ã−1 )ik = (I) (7.11) i=1 donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es: Ã−1 T Ã−1 = I˜ ⇒ Ã−1 = ÃT (7.12) donde hemos usado el hecho de que: Ã−1 à = I˜ y (Ã−1 T )T = Ã−1 . Llegamos a la conclusión que: Ã−1 = ÃT . Una matriz para la cual su inversa coincide con su transpuesta se llama ortogonal. La matriz de rotación à contiene nueve parámetros, pero entre ellos hay las relaciones: 3 X i=1 aji aTik = δjk ⇒ 3 X aji aki = δjk (7.13) i=1 Tres relaciones se obtienen cuando j = k: 3 X (aji )2 = 1; j = 1, 2, 3 (7.14) i=1 Hay seis relaciones cuando j 6= k: 3 X i=1 aji aki = 0 j 6= k; j, k = 1, 2, 3 (7.15) Pero de (7.15) también se sigue que: 3 X i=1 aki aji = 0 j 6= k; j, k = 1, 2, 3 (7.16) O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis relaciones entre los elementos de la matriz Ã. Como era de esperarse, à contiene sólo tres parámetros independientes. Cinemática del cuerpo rı́gido / 209 x2 x2 r,r x1 θ θ φ x1 Figura 7.3 Rotación de los ejes (x) alrededor del eje x3 = x3 . Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación por un ángulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de transformación. Las fórmulas de transformación se obtienen fácilmente de la figura 7.3, que representa el plano x1 − x2 : x= r cos θ x= r senθ (7.17) donde hemos usado que r = r. Como θ = θ − φ podemos escribir: cos θ = cos θ cos φ + senθ senφ (7.18) senθ = senθ cos φ − cos θ senφ Teniendo en cuenta que: x1 = r cos θ ; x2 = r senθ (7.19) Se sigue inmediatamente que las fórmulas de transformación son: x1 = x1 cos φ + x2 senφ x2 = −x1 senφ + x2 cos φ x3 = x3 (7.20) 210 / Mecánica clásica avanzada O en forma de matriz: cos θ senφ x1 x2 = −senφ cos φ x3 0 0 0 x1 0 x2 x3 1 (7.21) Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para j = k: j= primera fila , cos2 φ + sen2 φ + 02 = 1 j= segunda fila , sen2 φ + cos2 φ + 02 = 1 j= tercera fila , 02 + 02 + 12 = 1 (7.22) satisface también las relaciones para j 6= k (ortogonalidad de las filas entre sı́ o de las columnas entre sı́): j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0 j = 1, k = 3 ( 1a y 3a filas) : 0 +0 +0 =0 j = 1, k = 2 ( 2a y 3a filas) : 0 +0 +0 =0 (7.23) y similarmente para la ortogonalidad entre columnas. En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para una matriz ortogonal à se cumple que el producto escalar de una fila por sı́ misma, o de una columna por sı́ misma, es igual a la unidad. Dos filas diferentes o dos columnas diferentes son ortogonales entre sı́. No es cierto sin embargo que una fila sea ortogonal a una columna. Es claro en el ejemplo anterior que Ã−1 = ÃT . 7.3. Los cosenos directores Sean dos sistemas de ejes cartesianos con origen común (x) y (x). Los ejes (x) están rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x) respecto a los ejes (x) como los cosenos de los ángulos que hacen cada uno de los ejes (x) con cada uno de los ejes (x). Los denotaremos αij . De su definición se sigue que: αij = ~e′i · ~ej ; i, j = 1, 2, 3 (7.24) Es claro que αij es el coseno del ángulo entre el eje xi y el eje xj . En total hay nueve cosenos directores, que no son independientes. Es claro que la transformación de los vectores ~ei a los vectores ~e′i es: ~e′i = 3 X j=1 αij ~ej = 3 X j=1 (~e′i · ~ej )~ej (7.25) Cinemática del cuerpo rı́gido / 211 en efecto: ~e′i · ~ek = 3 X j=1 (~e′i · ~ej )(~ej · ~ek ) = 3 X j=1 (~e′i · ~ej )δjk = ~e′i · ~ek (7.26) Un vector cualquiera V~ puede expresarse de dos maneras equivalentes: 3 X V~ = Vi~ei = 3 X Vi′~e′i (7.27) i=1 i=1 Multiplicando escalarmente (7.27) a ambos lados por ~e′k : 3 X i=1 3 X Vi~ek · ~ei = i=1 Vi′~e′k · ~e′i = Vk′ (7.28) ~ se transforman de la siguiente manera: Por tanto se tiene que las componentes de V Vk′ = 3 X αkj Vj (7.29) j=1 En tanto que: ~e′k = 3 X αkj ~ej (7.30) j=1 Es decir, las componentes de los vectores se transforman de la misma manera que los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir como: Vi = ~ei · V~ ; Vi′ = ~e′i · V~ (7.31) De acuerdo con (7.29): ~ = Vi′ = ~e′i · V 3 X j=1 (~e′i · ~ej )(~ej · V~ ) (7.32) ~ como ~e′ , según (7.32): Tomando V i 1= 3 X j=1 (~e′i · ~ej ) → 3 X α2kj = 1 ; i = 1, 2, 3 (7.33) j=1 ~ como ~e′ con k 6= i, según (7.32): Tomando V k 0= 3 X j=1 (~ei · ~ej )(~ej · ~e′k ) → 3 X j=1 αij αkj = 0 ; i, k = 1, 2, 3 (7.34) 212 / Mecánica clásica avanzada Vemos que la fórmula de transformación de los vectores ~e′i a los vectores ~ei es: ~ei = 3 X αij ~e′j = j=1 puesto que: ~ei · ~e′k = 3 X j=1 3 X j=1 (~e′j · ~ei )~e′j (~e′j · ~ei )δjk = (~e′k · ~ei ) (7.35) (7.36) Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x) a los ejes (x). Las componentes de un vector se transforman según: Vk = 3 X αjk Vj′ = 3 X αTkj Vj′ (7.37) j=1 j=1 Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como: 3 X αij αkj = j=1 3 X αij αTjk = δik (7.38) j=1 En sı́ntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propiedades de la matriz de rotación Ã. Los cosenos directores son los elementos de la matriz Ã. Dı́adas y diádicos. Se define un diádico como una entidad algebraica que se representa por una matriz 3 × 3, de la misma manera que un vector es una entidad algebraica que se representa por una matriz columna 3 × 1. De acuerdo con (7.27) un vector unitario se puede expresar como: ~e1 = 1 · ~e1 + 0 · ~e2 + 0 · ~e3 ~e2 = 0 · ~e1 + 1 · ~e2 + 0 · ~e3 ~e3 = 0 · ~e1 + 0 · ~e2 + 1 · ~e3 (7.39) Entonces los vectores unitarios se pueden representar por las tres matrices columna siguientes: 0 0 1 (7.40) ~e1 → 0 ; ~e2 → 1 ; ~e3 → 0 1 0 0 ~ se puede representar mediante una matriz columna: Un vector arbitrario V 0 0 1 V1 ~ → V2 = V1 0 + V2 1 V3 0 (7.41) V 1 0 V3 0 Cinemática del cuerpo rı́gido / 213 Análogamente podemos suponer que una matriz 3 × 3 es la representación de cierta entidad que llamaremos diádico. Una dı́ada unitaria es el análogo de un vector unitario y un diádico es el análogo de un vector cualquiera. Definimos la dı́ada unitaria como una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un 1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve dı́adas unitarias. Ası́ por ejemplo: 1 0 0 0 0 0 ~e1~e1 → 0 0 0 ~e2~e3 → 0 0 1 (7.42) 0 0 0 0 0 0 Notamos que ~ei~ej se puede representar por el producto de una matriz columna por una matriz fila: 1 0 0 1 (1 0 0) = 0 0 0 0 ~e1~e1 → 0 0 0 0 (7.43) 0 0 0 0 (0 0 1) = 0 0 1 1 ~e2~e3 → 0 0 0 0 ~B ~ como un poliEs de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una dı́ada A nomio de dı́adas unitarias ası́: 3 X 3 X ~B ~ = Ai Bj ~ei~ej A i=1 j=1 (7.44) ~A ~= B 3 X 3 X Bi Aj ~ei~ej i=1 j=1 Un diádico en general es un polinomio de dı́adas unitarias, pero no necesariamente ~ B: ~ de la forma A 3 3 X X ~~ Dij ~ei~ej (7.45) D = i=1 j=1 ~~ Es claro que la representación de D es: D11 D12 D13 ~~ D → D21 D22 D23 D31 D32 D33 (7.46) 214 / Mecánica clásica avanzada Ası́ como el producto de un vector fila por una matriz da un vector fila y el producto de una matriz por un vector columna da un vector columna, definimos por analogı́a el producto de un vector por un diádico y de un diádico por un vector para obtener vectores. Definimos los productos entre dı́adas unitarias y vectores ası́: ~ = ~ei (~ej · V ~ ) = ~ei Vj ~ei~ej · V V~ · ~ei~ej = (7.47) ~ · ~ei )~ej = ~ej Vi (V y el producto entre diádicos y vectores ası́: ~~ ~ D ·V = 3 X 3 X ~~ V~ · D = 3 3 X X i=1 j=1 i=1 j=1 3 3 X X ~ = Dij Vj ~ei Dij ~ei ~ej · V i=1 j=1 ! 3 3 X X ~ · ~ei ~ej = Dij Vi ~ej Dij V j=1 i=1 Se define el diádico unidad como: ~ ~1 = ~e ~e + ~e ~e + ~e ~e 1 1 2 2 (7.48) 3 3 (7.49) ~ ~1 claramente tiene las propiedades: ~ ~= ~1 · A 3 3 X X ~ ~= ~ei Ai = A ~ei~ei · A i=1 i=1 ~ ·~ ~1 = A 3 X 3 X i=1 ~ · ~ei~ei = A (7.50) ~ Ai~ei = A i=1 La dı́ada ~ei~ej tiene la propiedad de proyección. Al multiplicarla por un vector se obtiene la componente del vector en la dirección ~ei : ~=A ~ · ~ei~ei = ~ei~ei · A 3 X j=1 Aj (~ei · ~ej )~ei = Ai~ei (7.51) Se define el producto escalar de dos matrices ası́: à : B̃ = 3 X 3 X Aij Bij (7.52) i=1 j=1 que corresponde al producto escalar de dos diádicos: ~~ ~~ A : B = à : B̃ (7.53) Para el diádico (7.44) y uno similar tenemos: ~B ~ :C ~D ~ = A 3 X i=1 ~ · C)( ~ B ~ · D) ~ Ai Bj Ci Dj = (A (7.54) Cinemática del cuerpo rı́gido / 215 Vemos que esto es lo mismo que: ~ ·A ~B ~ ·D ~ = C = 3 3 X X ~ · ~ei )(~ej · D) ~ Ai Bj (C 3 X 3 X ~ · A)( ~ B ~ D) ~ Aj Bj Ci Dj = (C i=1 j=1 i=1 j=1 (7.55) Por tanto: ~B ~ :C ~D ~ =C ~ ·A ~B ~ ·D ~ A (7.56) Veremos que existe completa correspondencia entre los diádicos y los tensores. Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se transforma ası́: Tij′ = 3 X 3 X αik αjl Tkl (7.57) k=1 l=1 donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos ~ de la matriz que representa a cierto diádico T~ : ~ ~ Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j (7.58) ~ T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j : 3 3 3 3 XX XX ~ Tij′ ~e′i~e′j Tij ~ei~ej = T~ = (7.59) i=1 j=1 i=1 j=1 Por tanto (7.57) se puede escribir como: Tij′ = 3 X 3 X k=1 l=1 Tlk ~ei · ~ek ~el · ~ej = 3 X 3 X αik αjl Tkl (7.60) k=1 l=1 Se denomina relación de completidad de la base ~ei a: X ~ ~ei~ei = I~ (7.61) i=1 y relación de ortonormalidad de la base ~ei a: ~ei · ~ej = δij ; i, j = 1, 2, 3 (7.62) En mecánica cuántica la notación de Dirac es la notación diádica en el espacio de Hilbert. Dos forma. Se define el diádico antisimétrico: ~ei ∧ ~ej = ~ei~ej − ~ej ~ei (7.63) 216 / Mecánica clásica avanzada se cumple que ~ei ∧ ~ei = 0 y además: ~e1 ∧ ~e2 = ~e2 ∧ ~e3 = 0 1 −1 0 0 0 0 0 0 0 0 0 , ~e1 ∧ ~e3 = 0 0 0 0 0 0 −1 0 1 0 , 0 (7.64) 0 1 −1 0 Una 2-forma entre dos vectores es: ~∧B ~ = A 3 X 3 X i=1 j=1 Ai Bj ~ei ∧ ~ej = 3 X 3 X i=1 j=1 (Ai Bj − Aj Bi )~ei~ej (7.65) Se cumplen las propiedades: ~ ·A ~∧B ~ ·D ~ = (C ~ · A)( ~ B ~ · D) ~ − (C ~ · B)( ~ A ~ · D) ~ C (7.66) ~∧B ~ :C ~ ∧D ~ = 2(D ~ · B)( ~ A ~ · C) ~ − 2(C ~ · B)( ~ A ~ · D) ~ A El deteminante de la matriz de rotación. Sabemos que la matriz de los cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x) es ortogonal: ÃT à = I˜ (7.67) Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema matemático que dice que el determinante de un producto de matrices es igual al producto de los determinantes, tenemos que: det(ÃT Ã) = det ÃT · det à = det I˜ (7.68) otro teorema matemático dice que los determinantes de una matriz y de su traspuesta son iguales, entonces: det(Ã)2 = 1 ⇒ det à = ±1 (7.69) Es fácil ver que det à = −1 ocurre cuando la matriz à contiene una inversión del sistema de coordenadas. Entonces los desplazamientos de un sólido rı́gido con un punto fijo sólo pueden ser descritos mediante una matriz de determinante +1. Cinemática del cuerpo rı́gido / 217 7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido El teorema dice: el desplazamiento general de un cuerpo rı́gido con un punto fijo es un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo estas dos propiedades de una rotación alrededor de un eje: (a) El eje de rotación permanece inalterado; (b) La rotación no cambia la longitud de los vectores. El teorema de Euler queda demostrado si para una rotación arbitraria, descrita por la matriz Ã, podemos hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en los dos sistemas: ~ =V ~ V~ ′ = ÃV (7.70) Esta ecuación es un caso particular de: ~ = λV ~ V~ ′ = ÃV (7.71) Como à es unitaria (ortogonal) pero no hermı́tica (no simétrica), sus valores propios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra manera: “la matriz real y ortogonal que determina el movimiento fı́sico de un cuerpo rı́gido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios (7.71) puede escribirse: ˜V ~ = ~0 (à − λI) (7.72) Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las componentes de V~ : (a11 − λ)V1 + a12 V2 + a13 V3 = 0 a21 V1 + (a22 − λ)V2 + a23 V3 = 0 a31 V1 + a32 V2 + (a33 − λ)V3 = 0 (7.73) Como es conocido, habrá solución no trivial sólo si el determinante de la matriz ˜ es igual a cero. Esto hace que exista solución solamente para ciertos valores de (à − λI) λ: a11 − λ a12 a13 a22 − λ a23 (7.74) det a21 =0 a31 a32 a33 − λ La ecuación (7.74) es de tercer grado en λ con coeficientes reales: λ3 + bλ2 + cλ + d = 0 (7.75) 218 / Mecánica clásica avanzada donde: b = −a11 − a22 − a23 c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31 (7.76) d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22 −a22 a33 a11 − a12 a23 a31 − a13 a21 a32 cuyas principales propiedades son: ~ podrı́a ser (a) λ puede ser complejo pero con módulo 1. Si λ es complejo, V 2 ~ ~ ~ ~ complejo. En este caso escribimos el módulo de V como |V | = V · V donde V~ † es la ~ y tomando el complejo conjugado: V ~ † = (V ~ T )⋆ . matriz fila que se obtiene trasponiendo V ′ ~ es la misma de V~ : La longitud de V ~ ′ |2 = V ~ ′† · V ~ ′ = (ÃV ~ )† · (ÃV~ ) = V ~ † ÃT ÃV~ |V (7.77) ~ ′ |2 = | V ~ |2 . Por otra parte, V ~ ′ = λV ~ , por Como à es ortogonal, se sigue que |V tanto: ~ ′ |2 = V ~ ′† · V ~ ′ = (λV ~ )† · (λV ~ ) = λ⋆ λV ~†·V ~ = |λ|2 |V ~ |2 |V (7.78) En conclusión: |λ|2 = 1 (7.79) (b) La ecuación secular (7.75) tiene al menos una raı́z real. Grafiquemos la ecuación real: f (x) = x3 + bx2 + cx + d (7.80) asumiremos x real. De la ecuación (7.76) sabemos que b, c y d son reales. Claramente: f (x) → ∞ para x → ∞ f (x) → −∞ para x → −∞ (7.81) Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el punto donde corta el eje, o sea el cero de f (x): λ3 + bλ2 + cλ + d = 0 (7.82) Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1 o λ = +1 (véase figura 7.4). (c) Si λ es un valor propio compleio, λ⋆ también es un valor propio. Como a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ también la satisface: de (a), (b) y (c) se sigue que la matriz à tendrá tres valores propios λ, λ⋆ , +1 o −1. Para cada valor propio habrá un vector propio: ~α = λα V~α ; ÃV α = 1, 2, 3 con λα = λ, λ⋆ , 1 o − 1 (7.83) Cinemática del cuerpo rı́gido / 219 y λ x Figura 7.4 Gráfico de la función real f (x) = x3 + bx2 + cx + d En términos de las componentes podemos escribir a (7.83) como: 3 X aij Vαj = λα Vαj = j=1 3 X λβ Vβi δαβ (7.84) β=1 Definimos las siguientes matrices formadas con las componentes de los vectores propios y con los valores propios: Ṽ = (Vαi ) , λ̃ = (λβ δαβ ) (7.85) Entonces (7.84) puede reinterpretarse como productos de matrices: ~ )αi = (Ṽ T λ̃T )iα = (Ṽ T λ̃)iα (ÃṼ T )iα = (λ̃V (7.86) O también: ÃṼ T = Ṽ T λ̃ ⇒ (Ṽ T )−1 ÃṼ T = λ̃ (7.87) Es decir, los vectores propios forman una matriz que diagonaliza a à siendo los elementos de la diagonal los valores propios. (d) El producto de las raı́ces de la ecuación secular es ±1. Tomando determinantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una matriz es igual al inverso del determinante de la matriz, obtenemos: 1 det à det Ṽ = det λ̃ ⇒ det à = det λ̃ det Ṽ (7.88) De (7.69) se sigue que: det λ̃ = ±1 (7.89) 220 / Mecánica clásica avanzada Hemos dicho que para rotaciones se debe cumplir que det à = +1 y para inversiones det à = −1. Entonces, cuando à representa rotaciones: det λ̃ = λ1 λ2 λ3 = |λ|2 λ3 = +1 (7.90) Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una transformación cualquiera à (corresponde al valor propio +1). ~: Los vectores propios. El vector invariante bajo rotaciones es V ~ =V ~ ÃV (7.91) ~α formamos la matriz Ṽ que diagonaliza a Ã: Con las componentes de V Ṽ ÃṼ T = λ̃ (7.92) La traza de λ̃ es: tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 Como |λ| = 1, podemos escribir: λ = eiΦ (7.93) (7.94) De donde: tr λ̃ = 2 cos Φ + 1 (7.95) Como, según un teorema matemático, la traza es invariante bajo transformaciones de semejanza (Ṽ ÃṼ T es una transformación de semejanza sobre Ã): tr à = tr λ̃ = 1 + 2 cos Φ (7.96) Es decir, a11 + a22 + a33 = 1 + cos Φ (7.97) Podemos mediante una transformación de semejanza rotar los ejes de modo que ~ , de modo que la matriz de rotación tendrá la forma dada por x3 esté a lo largo de V (7.21): cos φ senφ 0 −senφ cos φ 0 à = (7.98) 0 0 1 Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse ~ . La ecuación de valores como el ángulo de rotación alrededor del eje determinado por V propios para la matriz à es: V1 V1 cos Φ senΦ 0 −senΦ cos Φ 0 V2 = V2 (7.99) V3 V3 0 0 1 Cinemática del cuerpo rı́gido / 221 Con lo cual obtenemos: V1 cos Φ + V2 senΦ = V1 −V1 senΦ + V2 cos Φ = V2 (7.100) V3 = V3 Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando: (V12 + V22 ) senΦ = 0 (7.101) Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando ~ = V3~e3 . Para una elección general de los ejes, seguirá siendo V3 indeterminado, luego V ~ , pero no quedará determinado comválido que Φ representa la rotación alrededor de V ~ sino sólo su dirección: su magnitud quedará indeterminada. En pletamente el vector V cualquier caso la traza de à nos determina el ángulo de rotación. Teorema de Chasles. El desplazamiento más general de un cuerpo rı́gido consiste en una translación más una rotación. Este teorema se demuestra en el texto Dynamics of a rigid body, de Routh. 7.5. El rotador rı́gido Es un sólido rı́gido que se mueve sometido a la condición de ligadura que un punto permanezca fijo. Los movimientos de un rotador rı́gido quedarán especificados por medio de las tres componentes de la matriz à que relaciona las componentes de los vectores en el sistema de ejes espacial con el sistema de ejes unido al sólido rı́gido: ~r = Ã~r o xi = 3 X aij xj (7.102) j=1 En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del sólido rı́gido respecto al sistema de ejes espacial para conocer completamente la ubicación de todos los demás puntos del sólido rı́gido. Es decir, los tres parámetros independientes de la matriz à sirven para especificar las posiciones de un rotador rı́gido. Es claro que estos tres parámetros serán funciones del tiempo. El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un cuerpo rı́gido con un punto fijo constituye un grupo. Cada rotación à está especificada por tres parámetros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura algebraica: (i) Existe un conjunto de elementos g = {Ã(q), ∀q1 , q2 , q3 }. (ii) Si Ã1 y Ã2 ∈ g entonces Ã1 Ã2 ∈ g. ˜ (iii) Si à ∈ g, ∃Ã−1 ∈ g tal que ÃÃ−1 = I. ˜ ˜ (iv) ∃I ∈ g tal que I à = Ã, ∀à ∈ g. (v) ∀ Ã, B̃, C̃ ∈ g se cumple Ã(B̃ C̃) = (ÃB̃)C̃. 222 / Mecánica clásica avanzada Estas propiedades se siguen del hecho de que las matrices de rotación son ortogonales. Es sencillo demostrar a partir de lo anterior que: (a) El producto de dos matrices ortogonales es ortogonal. (b) Como para toda matriz de rotación det à = 1, se sigue que toda matriz de rotación tiene inverso. (c) I˜ es ortogonal. (d) El producto de matrices obedece la ley asociativa. Las rotaciones consideradas en abstracto como simples transformaciones geométricas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una representación del grupo de rotaciones. 7.6. Los ángulos de Euler Los nueve cosenos directores no son independientes, sólo tres lo son. Podemos pensar que todos los cosenos directores sean expresados en términos de tres parámetros independientes φ, θ, ψ: αij = αij (φ, θ, ψ) ; i, j = 1, 2, 3 (7.103) La elección de estos tres parámetros independientes no es única. Una conveniente elección de φ, θ y ψ, es la siguiente (véase figura 7.5). Se puede efectuar la transformación de (x) a la posición del cuerpo rı́gido dada por (x) por medio de las siguientes rotaciones: una rotación por un ángulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x) a (µ). Una rotación por un ángulo θ alrededor de µ1 , con lo cual los ejes se cambian de (µ) a (µ′ ). Finalmente una rotación por un ángulo ψ, alrededor del eje µ′3 , con lo cual los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotación S̃ en términos de los ángulos φ, θ y ψ (ángulos de Euler) debemos calcular los cosenos directores en términos de estos ángulos. x3, µ 3 x3 µ3′ µ2′ µ2 ϕ x1 ϕ µ1 χ3, µ3′ θ x2 x2 x3 θ x2 x1 ϕ µ1, µi x2 x1 ϕ ψ x1 Línea de nodos Figura 7.5 Angulos de Euler 1 (θ, φ − π/2) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 . Cinemática del cuerpo rı́gido / 223 Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la lı́nea de nodos y que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que: x3 x3 π- θ α a φ ψ x2 x2 b l x1 θ x1 Figura 7.6 Planos que se cortan en la lı́nea de nodos a cos φ = b cos ψ (7.104) l2 = a2 + b2 − 2ab cos α (7.105) l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ) (7.106) Igualando (7.105) y (7.106) llegamos a: −b cos α = −a cos2 φ + b senφ senψ cos θ (7.107) Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente: α11 = cos α = cos ψ cos φ − senφ senψ cos θ (7.108) α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2: α12 = cos ψ senφ + cos φ senψ cos θ (7.109) α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2: α21 = −senψ cos φ − senφ cos ψ cos θ (7.110) α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2: α22 = −senψ cos φ + cos φ cos ψ cos θ (7.111) 224 / Mecánica clásica avanzada α33 = ~e′3 · ~e3 se obtiene directamente: α33 = ~e′3 · ~e3 = cos θ (7.112) α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuación (7.38): α2j1 + α2j2 + α2j3 = 1 (7.113) Con lo cual se obtiene para α13 : α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ) (7.114) ⇒ α13 = senψ senθ Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual: α23 = cos ψ senθ (7.115) Para calcular a α32 y a α31 usamos la ecuación (7.38) ası́: α31 α21 + α32 α22 + α33 α23 = 0 (7.116) α31 α11 + α32 α12 + α33 α13 = 0 (7.117) Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando: α32 = α13 α21 − α23 α11 α33 α22 α11 − α12 α21 (7.118) Con lo cual se obtiene: α32 = −senθ cos φ (7.119) Por otra parte la relación (7.38) para la fila tres: α231 + α232 + α233 = 1 (7.120) nos permite escribir: α31 = senθ senφ (7.121) con lo cual la matriz de rotación es, en definitiva: à = cos φ cos ψ − senφ cos θ senψ senφ cos ψ + cos φ cos θ senψ senθ senψ (7.122) − cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ senφ senθ − cos φ senθ cos θ Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que à es una matriz ortogonal. Es decir, que Ã−1 se obtiene simplemente trasponiendo a Ã. Cinemática del cuerpo rı́gido / 225 Del teorema de Euler se sigue que de alguna manera à representa una rotación única alrededor de cierto eje n̂ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación se halla resolviendo la ecuación de valores propios (7.91), con λ = 1: 3 X j=1 (aij − δij )Cj = 0 ; i = 1, 2, 3 (7.123) El resultado para los cosenos directores del eje n̂ es: C1 = senθ(cos ψ − cos φ) 2 senΦ C2 = senθ(senφ − senψ) 2senΦ (7.124) sen(Φ + ψ) (1 + cos θ) 2senΦ Donde Φ es el ángulo de rotación alrededor de n̂ que se halla a partir de la traza de Ã, ecuación (7.97): C3 = cos φ = 1 − tr à 2 (7.125) Calculando la traza de à se llega finalmente a: θ ψ+φ Φ (7.126) cos = cos cos 2 2 2 Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n̂ y Φ especifican la rotación.2 Se puede ver que à se puede obtener también a partir de la definición de los ángulos de Euler, de acuerdo con la figura 7.5: x1 cos φ senφ 0 µ1 µ2 = −senφ cos φ 0 x2 o ~µ = Ãφ ~x (7.127) x3 µ3 0 0 1 ′ 1 0 0 µ1 µ1 ′ µ2 = 0 cos θ senθ µ2 o µ~′ = Ãθ ~µ (7.128) µ3 0 −senθ cos θ µ′3 ′ µ1 cos ψ senψ 0 x1 x2 = −senψ cos ψ 0 µ′2 o ~x = Ãψ µ ~′ (7.129) µ′3 0 0 1 x3 2 Las ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138). 226 / Mecánica clásica avanzada De modo que ~x puede obtenerse de ~x a través de: ~x = Ãψ Ãθ Ãφ ~x = Ã~x (7.130) Ası́ que: à = Ãψ Ãθ Ãφ (7.131) Al hacer el producto de matrices se llega al resultado para la matriz à dado por (7.122). Definiciones alternas de los ángulos de Euler. La convención usada en mecánica cuántica en los textos de teorı́a de grupos de Wigner, y de momentos angulares de Rose, es diferente a la presentada anteriormente. Allı́ la segunda rotación es tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “convención y” que obviamente dará lugar a expresiones diferentes para la matriz Ã. Es fácilmente demostrable que para obtener la matriz à en la convención “y” a partir de la matriz à en la convención “x” bastan las sustituciones: π φ →φ+ 2 (7.132) π ψ →ψ− 2 donde se entenderá a φ como el ángulo de la primera rotación y a ψ como el ángulo de la tercera rotación, con lo cual: senφ → cos φ cos φ → −senφ senψ → − cos ψ (7.133) cos ψ → senψ Se propone como ejercicio probar estas afirmaciones. Otra convención es la llamada convención “xyz”, usada en aeronáutica: la primera rotación es por ángulo φ alrededor de x3 , la segunda por ángulo θ alrededor de x2 y la tercera por ángulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo, tomando los ejes de coordenadas fijos a un avión de la siguiente manera: x3 perpendicular al avión en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del avión, una posición arbitraria de la nave se puede obtener a partir de la posición en que los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones: una alrededor de x3 por ángulo φ, otra alrededor de x2 por ángulo θ y la tercera alrededor de x1 por un ángulo ψ. 7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros de Euler Hemos mostrado que los desplazamientos de un cuerpo rı́gido con un punto fijo se pueden expresar por medio de rotaciones. Cada rotación puede especificarse por tres Cinemática del cuerpo rı́gido / 227 parámetros independientes que pueden ser por ejemplo tres cosenos directores independientes, tres ángulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones constituyen un grupo matemático que tiene una representación obvia en términos de matrices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones fı́sicas y las matrices ortogonales 3 × 3). Queremos buscar una representación de la transformación de coordenadas en términos de los parámetros de una rotación: dos cosenos directores del eje de rotación y el ángulo de rotación. Formas “activa” y “pasiva” de una rotación. Hasta ahora hemos considerado que la matriz à rota los ejes coordenados, de modo que la ecuación ~r = Ã~r simplemente expresa cómo están relacionadas las componentes de un vector vistas respecto a dos diferentes sistemas de coordenadas: à actúa sobre el sistema de coordenadas dejando los vectores inalterados. Hay además la siguiente interpretación: à puede pensarse como un operador que actúa sobre los vectores ~r para cambiarlos por vectores diferentes ~r′ con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un ángulo φ, se puede rotar al vector ~r en el sentido del reloj por un ángulo φ para obtener el vector ~r′ (véase figura 7.7). Las componentes del nuevo vector, ~r′ , estarán entonces x2 x2 Pasiva: r = Ar r x1 r x2 Activa r ′ = Ar i r′ r i φ φ x1 x1 Figura 7.7 Formas activa y pasiva de una rotación relacionadas con las del viejo vector ~r, por medio de la ecuación ~r′ = Ã~r. En general à corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las agujas del reloj por un ángulo φ cuando sea aplicada a los vectores. Rotaciones finitas. Usaremos el punto de vista activo, según el cual en un sistema de coordenadas dado realizamos una rotación de un vector por un ángulo Φ alrededor de un eje n̂. Se trata de encontrar la matriz à que relaciona las componentes del viejo y del nuevo vector. De las figuras 7.8 y 7.9 se ve que: ~ + N~V + N~Q ~r′ = ON (7.134) donde los vectores tienen las siguientes expresiones en términos de ~r, n̂ y Φ, teniendo en 228 / Mecánica clásica avanzada N P V Φ Q r′ i r n O Figura 7.8 Rotación de un vector alrededor de un eje n̂. Vista lateral. N V Φ P r ×n Q Figura 7.9 Rotación de un vector alrededor de un eje n̂. Vista en dirección ~n. Cinemática del cuerpo rı́gido / 229 cuenta que N V = N Q cos Φ y V Q = N Q senΦ: ~ = ON (n̂ · ~r)n̂ N~Q = ~ ) cos Φ (~r − ON (7.135) V~Q = ~r × n̂ senΦ Con lo cual obtenemos: ~r′ = ~r cos Φ + n̂(n̂ · ~r)(1 − cos Φ) + ~r × n̂ senΦ (7.136) Esta fórmula es válida para cualquier rotación finita de un vector. Para Φ infinitesimal, dicha expresión toma la forma: ~r′ = ~r + ~r × n̂Φ (7.137) en concordancia con la fórmula (3.148). Escrita en forma de matriz, la ecuación (7.136) es: ′ x1 ′ x2 = x′3 (7.138) x1 C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ cos Φ+C12 c 2 C1 C2 c−C3 senΦ x2 c C C c+C senΦ cos Φ+C 2 3 1 2 x3 C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c donde hemos llamado c = (1 − cos Φ). En (7.138) la matriz à depende de los cuatro parámetros no independientes C1 , C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados parámetros de Euler, no independientes, e0 , e1 , e2 , e3 , definidos ası́: e0 = cos Φ 2 (7.139) Φ ei = Ci sen ; i = 1, 2, 3 2 En términos de estos parámetros (7.136) toma la forma: ~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 y la matriz à entonces será: 2 e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 ) e20 − e21 + e22 − e23 à = 2(e1 e2 − e0 e3 ) 2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) 2(e1 e3 − e0 e2 ) 2(e2 e3 + e0 e1 ) e20 − e21 − e22 + e23 (7.140) (7.141) 230 / Mecánica clásica avanzada Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones entre los parámetros de Euler y los ángulos de Euler: e0 = cos θ φ+ψ cos 2 2 e1 = sen φ−ψ θ cos 2 2 e2 = θ φ−ψ sen sen 2 2 e3 = cos (7.142) φ+ψ θ sen 2 2 Los parámetros y los ángulos de Euler fueron hallados por Euler en 1776, quien llamó ei a los parámetros simétricos. 7.8. Representación del grupo de rotaciones por medio de matrices 2 × 2. Los parámetros de Cayley-Klein Representación de un grupo. En el numeral 7.5 hemos mencionado que el conjunto de todos los desplazamientos de un cuerpo rı́gido con un punto fijo satisface los axiomas de un grupo matemático: (i) Dos desplazamientos sucesivos cualesquiera del cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que consiste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento inverso o sea aquel que retorne el cuerpo a su posición original; (iv) Los desplazamientos sucesivos del cuerpo rı́gido satisfacen la propiedad asociativa. El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representación del grupo de los desplazamientos de un rotador rı́gido en el sentido de que a cada desplazamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y sólo una. Se dice entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador rı́gido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3 es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante +1, que en rigor es el que corresponde a los desplazamientos de un rotador rı́gido, se llama el grupo SO(3). Vectores y diádicos en un espacio bidimensional. En un espacio bidimensional, un vector arbitrario V~ puede expresarse en términos de los vectores unitarios ~e1 , e~2 : ~ = V1~e1 + V2~e2 . V ~ y ~ei pueden representarse por matrices 2 × 1: V V~ → V1 V2 ~e1 → 1 0 ~e2 → 0 1 (7.143) Cinemática del cuerpo rı́gido / 231 Podemos definir las dı́adas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden representarse por matrices 2 × 2: 1 0 0 1 ~e1~e2 → ~e1~e1 → 0 0 0 0 (7.144) 0 0 0 0 ~e2~e2 → ~e2~e1 → 1 0 0 1 En una dı́ada unitaria el primer vector se representa por una matriz columna y el segundo por una matriz fila. Por ejemplo: 1 0 1 ~e1~e2 → (0 1) = (7.145) 0 0 0 Nótese que: 0 ~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 = 1 −1 0 ~~ Un diádico D puede expresarse en términos de las dı́adas unitarias: ~~ D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 y puede representarse por medio de una matriz 2 × 2: D11 D12 ~~ D → D21 D22 ~1, es: El diádico unidad, ~ ~ ~1 = ~e1~e1 + ~e2~e2 → 1 0 0 1 Se definen los diádicos ~ ~σ x , ~ ~σ y y 0 ~ ~σ x = ~e1~e2 + ~e2~e1 → 1 ~ ~σ y = −i~e1~e2 + i~e2~e1 → ~ ~σ z = ~e1~e1 − ~e2~e2 → 1 (7.146) (7.147) (7.148) (7.149) ~~σ z de la siguiente manera: 1 = σ̃x 0 0 −i i 0 0 0 −1 = σ̃y = σ̃z (7.150) 232 / Mecánica clásica avanzada Las dı́adas unitarias pueden expresarse en términos de ~~σ i y ~~1: ~e1~e1 = 1 ~ (~1 + ~~σ z ) ; 2 ~e1~e2 = 1 ~e2~e1 = (~ ~σ x − i~~σ y ) ; 2 1 ~ (~σ x + i~~σ y ) 2 1 ~ ~e2~e2 = (~1 − i~~σ z ) 2 (7.151) ~ Un diádico arbitrario puede igualmente expresarse en términos de ~1 y ~~σ i : 1 ~~ ~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y D = (V11 + V22 )~ 2 2 2 2 (7.152) O sea que cualquier diádico de traza cero puede expresarse en términos de ~~σ x , ~~σ y , ~ ~ ~ a cualquier diádico de traza cero: ~σ z . Llamaremos V ~ ~~σ y ~~σ z ~σ x ~ ~ = Vx √ V + Vy √ + Vz √ 2 2 2 (7.153) Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores ~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero ordinarios V satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa; (ii) El producto de un número por un diádico de traza cero es un diádico de traza cero; (iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define el producto escalar de dos diádicos como: ~ ~ ~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22 ~ : W V 11 12 21 22 (7.154) Vemos que este producto escalar satisface las mismas propiedades del producto escalar de vectores. Para ello es suficiente mostrar que: ~ ~σ i : ~ ~σ j = 2δij ; i, j = x, y, z (7.155) lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada diádico de traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario: ~ = Vx~e1 + Vy ~e2 + Vz ~e3 V (7.156) Homomorfismo entre las rotaciones en el espacio bidimensional y las ~ es rotado para convertirse en V ~ ′: rotaciones en el espacio ordinario. Si el vector V ~ ′ = ÃV ~ V (7.157) donde à es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimensional deberá presentar una transformación correspondiente en virtud del mencionado homomorfismo. Como: Vi′ = 3 X j=1 aij Vj (7.158) Cinemática del cuerpo rı́gido / 233 ~′ entonces V~ será: 3 3 1 ~ ′ XX ~σ i aij Vj √ ~ V~ = 2 i=1 j=1 (7.159) Por otra parte, una transformación de un diádico es de la forma: ~ ′ ~~ ~ ~~ † ~ ·Q V~ = Q ·V (7.160) ~~ † ~~ donde Q es el adjunto de Q: † ~~ Q = Q⋆11 ê1 ê1 + Q⋆21 ê1 ê2 + Q⋆12 ê2 ê1 + Q⋆22 ê2 ê2 ′ ~ ~ es: Explı́citamente V 2 2 X X ~′ = Qij êi êj · V Vkl êk êl · i,j=1 2 X k,l=1 2 X Q⋆mn ên êm m,n=1 (7.161) ! (7.162) (Q̃Ṽ Q̃† )im êi êm i,m=1 ~′ Por otra parte V~ está dado por (7.159). Por tanto, según (7.152) y (7.153): 3 i 1 h Q̃Ṽ Q̃† + Q̃Ṽ Q̃† 2 12 21 3 i i h Q̃Ṽ Q̃† − Q̃Ṽ Q̃† 2 12 21 1 X √ a1j Vj = 2 j=1 1 X √ a2j Vj = 2 j=1 3 1 X √ a3j Vj = 2 j=1 (7.163) i 1 h − Q̃Ṽ Q̃† Q̃Ṽ Q̃† 2 22 11 ~~ Estas ecuaciones nos permiten relacionar à con Q̃. El diádico Q en (7.160) debe ser unitario: ~~ † ~~ ~~ ~~ † Q ·Q=1=Q ·Q (7.164) ~~ Si llamamos α, β, γ y δ las componentes de Q: ~~ Q = αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 (7.165) 234 / Mecánica clásica avanzada ~~ † ~~ Q .Q = (α⋆ ê1 ê1 + γ ⋆ ê1 ê2 + β ⋆ ê2 ê1 + δ ⋆ ê2 ê2 )· (αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 ) (|α|2 + |γ|2 )ê1 ê1 + (α⋆ β + γ ⋆ δ)ê1 ê2 = (7.166) +(β ⋆ α + δ ⋆ γ)ê2 ê1 + (|β|2 + |δ|2 )ê2 ê2 ê1 ê1 + ê2 ê2 + ê3 ê3 = ~~1 = Con lo cual obtenemos: |α|2 + |γ|2 = 1 α⋆ β + γ ⋆ δ = 0 (7.167) |β|2 + |δ|2 = 1 Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y δ, que por ser complejos contienen ocho parámetros. Las relaciones (7.167) dejan 8−4 = 4 parámetros independientes. Si además se impone la condición de que el determinante de Q̃ sea +1, obtenemos: αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1 (7.168) Con lo cual quedan sólo tres parámetros independientes de los ocho que contiene Q̃. Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad (7.167) y de unimodularidad (7.168). En (7.163) se requiere conocer la matriz Q̃Ṽ Q̃† . Esto es: Q̃Ṽ Q̃† = = α β γ δ V11 V12 V21 V22 α⋆ γ⋆ β⋆ δ⋆ |α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12 γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22 α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22 |γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12 ! (7.169) Cinemática del cuerpo rı́gido / 235 De (7.163) y (7.169) obtenemos las siguientes relaciones: 3 √ X a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21 2 j=1 +(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22 3 √ X a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21 2 j=1 (7.170) +i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22 3 √ X a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22 2 j=1 +(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12 Como por otra parte: V1 = 1 √ (V12 + V21 ) 2 V1 = i √ (V12 − V21 ) 2 V1 = 1 √ (V11 + V22 ) 2 (7.171) Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes de à y las de Q̃, igualando coeficientes de los Vij : a13 = γ ⋆ α + α⋆ γ (a11 + ia13 ) = δ⋆α + β ⋆γ a23 = i(γ ⋆ α − α⋆ γ) (a21 + ia22 ) = i(δ ⋆ α − β ⋆ γ) a33 = |α|2 − |γ|2 (a31 + ia32 ) = αβ ⋆ − δ ⋆ γ (7.172) 236 / Mecánica clásica avanzada Con lo cual la matriz à toma la forma: 1 i 2 (α2 − γ 2 + δ 2 − β 2 ) (γ − α2 + δ 2 − β 2 ) γδ − αβ 2 2 1 2 i à = (α2 + γ 2 − β 2 − δ 2 ) (α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ) 2 2 βδ − αγ i(αγ + βδ) αδ + βγ (7.173) donde hemos usado además las relaciones α⋆ = δ, γ ⋆ = −β de la ecuación (7.168). à es una matriz que está expresada en términos de α, β, γ, δ, o sea que los parámetros α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo rı́gido. Son llamados los parámetros de Cayley-Klein, estudiados por estos autores en los años 1875-1879. En resumen, hemos mostrado que si al efectuar una rotación un vector V~ ′ se cambia ~ ′ = ÃV ~ , entonces el diádico V~~ en el espacio bidimensional que corresponde en el vector V ~ ′ ~~ ~~ ~~ † V ·Q . Por tanto, a cada rotación del cuerpo rı́gido a V~ se transforma en el diádico V~ = Q· ˜ y le corresponde una matriz à y una matriz Q̃ 2 × 2. La matriz Q̃ es unitaria, Q̃Q̃† = I, unimodular, det Q̃ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2 es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2). Si en (7.173) se hacen las siguientes sustituciones de los parámetros de Cayley-Klein en términos de e0 , e1 , e2 y e3 : α = e0 + ie3 ; γ = −β ⋆ β = e2 + ie1 ; (7.174) δ = α⋆ Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los parámetros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei en términos de los ángulos de Euler, ecuación (7.142), obtenemos para α, β, γ y δ en términos de los ángulos de Euler: α = ei(φ+ψ)/2 cos θ ; 2 β = iei(ψ−φ)/2 sen θ 2 (7.175) θ θ γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos 2 2 ~~ El diádico Q definido en (7.166) puede escribirse en términos de los diádicos de ~ Pauli y el diádico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165): 1 i 1 ~~ ~ 1 Q = (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y 2 2 2 2 (7.176) que usando (7.174) toma la forma:3 ~~ ~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z Q = e0~ 3 Los e0 , ei , forman un sistema de cuaterniones. (7.177) Cinemática del cuerpo rı́gido / 237 Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 = senθ/2, e2 = e3 = 0. Por tanto: θ~ ~~ ~1 + i sen θ ~ ~σ x Q θ = cos 2 2 (7.178) donde θ es el ángulo de rotación. Para una rotación por φ alrededor del eje x3 : φ~ ~~ ~1 + i sen φ ~ Q ~σ z φ = cos 2 2 (7.179) Cada diádico de Pauli ~ ~σ i está asociado con una rotación alrededor de un eje particular y puede considerarse como el “rotador unitario” para dicho eje. Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es, que: ~ ~σ i · ~ ~σ j = −~ ~σ j · ~ ~σ i (7.180) Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150): ~ ~ ~σ x · ~ ~σ x = ê1 ê1 + ê2 ê2 = ~1 ; ~~σ x · ~~σ y = iê1 ê1 − iê2 ê2 = i~~σ z ~ ~σ x · ~ ~σ z = −ê1 ê2 + ê2 ê1 = −i~~σy ; ~~σ y · ~~σ x = −iê1 ê1 + iê2 ê2 = −i~~σ z ~ ~1 ; ~σ y · ~ ~σ y = ê1 ê1 + ê2 ê2 = ~ ~~σ y · ~~σ z = iê1 ê2 + iê2 ê1 = i~~σ x ~ ~σ z · ~ ~σ x = ê1 ê2 − ê2 ê1 = i~ ~σ y ; ~~σ z · ~~σ y = −iê1 ê2 − iê2 ê1 = −i~~σx (7.181) ~ ~1 ~σ z · ~ ~σ z = ê1 ê1 + ê2 ê2 = ~ Las ecuaciones (7.181) se pueden escribir en forma compacta ası́: ~ ~1δij + i ~σ i · ~ ~σ j = ~ 3 X ǫijk ~ ~σ k (7.182) k=1 donde ǫij es el tensor de Levi-Civita completamente antisimétrico. Se puede ver directamente que las ~ ~σ i obedecen las relaciones de conmutación siguientes: ~ ~σ i · ~ ~σ j − ~ ~σ j · ~ ~σ i = 2i 3 X ǫijk ~~σ k (7.183) k=1 y de anticonmutación: ~ ~1δij ~σ i = 2~ ~σ j · ~ ~σ j + ~ ~σ i · ~ ~~ Ejemplo 7.8.2 Mostrar que Q θ puede escribirse simbólicamente como: (7.184) 238 / Mecánica clásica avanzada ~~ i~ ~ σx (θ/2) Q θ = e (7.185) 2 donde el exponencial denota una serie infinita de términos. Como según (7.181) ~~σ x ≡ 2n 2n+1 ~ ~ ~ ~σ x · ~ ~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto: x x θ ≡ cos ~ ~σ x 2 2n 1 θ ~~σ x θ (−1)n = ~~1 cos (2n)! 2 2 n=0 θ ~ sen ~σ x ≡ 2 2n+1 1 θ θ n ~ (−1) = ~~σ x sen ~σ x (2n + 1)! 2 2 n=0 ∞ X ∞ X (7.186) ~~ Con lo cual Q θ puede expresarse en la forma: θ θ θ θ ~ ~~ ~ ~ + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) Q θ = 1 cos 2 2 2 2 (7.187) † Como ~ ~σ i son hermı́ticos, ~~σ i = ~~σ i , se sigue que: ~~ † −i~ ~ σx (θ/2) Q θ = e (7.188) Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria, definida por los ángulos de Euler. ~~ Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del homomorfismo con el grupo de rotaciones: ~ ~ ~ ~~ † Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2) (7.189) ~~ Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el operador de rotación está asociado con el respectivo eje de rotación. Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente ~ ~σ µ1 será, de acuerdo con la ecuación (7.160): ~ ~ ~ ~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2) (7.190) Como por otra parte: ~1 cos ei~σµ1 (θ/2) = ~ ~ θ θ + i~~σ µ1 sen 2 2 (7.191) ~~ Se sigue, usando la ecuación (7.190) y la unitariedad Q φ: ~ ~ ~ ~ ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2) (7.192) Cinemática del cuerpo rı́gido / 239 ~~ Por tanto Q toma la foma: ~ ~ ~ ~~ Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2) (7.193) Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se obtiene de µ3 = z por medio de Ãθ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z como: ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~ ~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2) (7.194) Usando (7.192): ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) · e −i~ ~ σ x (θ/2) ·e −i~ ~ σ z (φ/2) ·e (7.195) −i~ ~ σ z (ψ/2) ~~ ~~ Notando que ~ ~σ z y Q φ conmutan y que Qφ es unitario: ~ ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2) (7.196) Se sigue entonces que: ~ ~ ei~σ z (ψ/2) = ~ ~ ~ ~ ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) · ~ (7.197) ~ e−i~σz (φ/2) · e−i~σz (ψ/2) O sea: ~ ~ ~ ~ ~ ~ ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2) (7.198) ~~ Reemplazando (7.198) en (7.193) obtenemos para Q: ~ ~ ~ ~ ~ ~ ~ ~~ Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2) (7.199) ~~ Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.200) ~~ Hemos conseguido expresar a Q en términos de rotaciones alrededor de los ejes ~~ del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q en ~~ términos de rotaciones respecto a los ejes fijos al cuerpo rı́gido Q de donde toma la forma: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.201) Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los parámetros de Euler que describen dos rotaciones A y A′ , entonces los parámetros de la rotación A” = A′ A están expresados en términos de los parámetros de las rotaciones A, A′ , por: 240 / Mecánica clásica avanzada e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1 e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2 (7.202) e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3 e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3 Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los parámetros de CayleyKlein que describen dos rotaciones A y A′ , entonces los parámetros (α′′ , β ′′ , γ ′′ , δ ′′ ) de la rotación A′′ = A′ A están expresados en términos de los parámetros de A, A′ , por: α′′ = αα′ + γ ′ β β” = αβ ′ + βδ ′ γ ′′ = γα′ + δ ′ γ δ” = γβ ′ + δδ ′ (7.203) Ejercicio 7.8.3 Interpretación geométrica del homomorfismo entre SO(3) y SU (2). Sea una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T . La proyección estereográfica de F en el plano es P . Al punto T se le llama vértice de la proyección. T n F P Figura 7.10 Figura geométrica F dentro de una esfera Al rotar la esfera alrededor de n̂, en la figura, F se cambia en F ′ y su proyección estereográfica P se cambia en P ′ . Entonces a cada rotación de la esfera le corresponde cierta transformación en el plano, llamada transformación homográfica. Estas transformaciones cambian cı́rculos en el plano por cı́rculos en el plano. Sea z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z mediante la transformación homográfica. (a) Mostrar que: z′ = az + b cz + d (7.204) Cinemática del cuerpo rı́gido / 241 donde a, b, c y d son constantes reales o complejas. (b) Mostrar que el resultado de dos homografı́as sucesivas: z′ = α′ z + β ′ γ ′z + δ′ y z ′′ = α′′ z ′ + β ′′ γ ′′ z ′ + δ ′′ (7.205) Es una homografı́a: z ′′′ = α′′′ Z + β ′′′ γ ′′′ Z + δ ′′′ (7.206) donde la relación entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ ) está dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone~~ xión entre las rotaciones y las transformaciones homográficas, y que por tanto las Q del grupo SU (2) corresponden a transformaciones homográficas, donde los parámetros de Cayley-Klein son los parámetros que caracterizan la transformación homográfica correspondiente a una rotación de un sólido rı́gido (véase el texto de L.V. Ahlfors, Análisis de variable compleja, Aguilar, 1966). 7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones Las coordenadas rı́gidamente unidas al cuerpo rı́gido permiten representar cualquier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo que ningún punto se puede desplazar con relación al origen. Es decir: ~r˙ = 0 (7.207) Los desplazamientos del cuerpo son detectables en el sistema de coordenadas espacial relacionado con el del cuerpo rı́gido por medio de la matriz de rotación ÃT , ~r = ÃT ~r. Como el cuerpo rı́gido se desplaza respecto al sistema de coordenadas espacial, ÃT habrá de ser función del tiempo, con lo cual: ~r(t) = ÃT (t)~r (7.208) Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual implica que: ÃT (0) = I˜ (7.209) Podemos decir que el cuerpo rı́gido en el tiempo t estará descrito por la transformación ÃT (t) que evoluciona de manera continua a partir de la transformación identidad. Además es posible suponer que para un tiempo infinitesimal, ÃT (∆t) difiere de la identidad I˜ por términos del orden de ∆t. 242 / Mecánica clásica avanzada Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del cuerpo se habrá desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 , respecto a los ejes espaciales. Por lo tanto: ~r(∆t) = ~r0 + ∆~r (7.210) Existe alguna matriz, con componentes infinitesimales, ǫ̃(∆t), tal que: ∆~r = ǫ̃(∆t)~r0 (7.211) Por lo cual: ~r(∆t) = (I˜ + ǫ̃)~r0 = (I˜ + ǫ̃)~r(0) (7.212) La matriz I˜ + ǫ̃ describe cómo están relacionadas las componentes del vector de posición de un punto del cuerpo rı́gido en los sistemas de coordenadas espacial y del cuerpo rı́gido, según la interpretación pasiva de la matriz de rotación cuando los ejes fijos al cuerpo rı́gido han rotado alrededor de un eje n̂ un ángulo δΦ en el sentido de la mano derecha. Desde el punto de vista activo, I˜ + ǫ̃ describe cómo cambia el vector de posición de un punto del cuerpo rı́gido, en el sistema de coordenadas espacial, cuando se rota el cuerpo rı́gido alrededor del eje n̂ por un ángulo δΦ según la regla de la mano izquierda. De acuerdo con esta última interpretación, para Φ infinitesimal, à = I˜ + ǫ̃ estará dada por la ecuación (7.138): 1 C3 δΦ −C2 δΦ −C δΦ 1 C δΦ I˜ + ǫ̃ = (7.213) 3 1 C2 δΦ −C1 δΦ 1 donde C1 , C2 y C3 son los cosenos directores del eje de rotación. De acuerdo con (7.210), (7.137) y (7.211), podemos escribir: ∆~r = ǫ̃~r0 = (~r0 × n̂)δΦ = −(n̂δΦ) × ~r0 (7.214) Usando el tensor de Levi-Civita para expresar el producto vectorial: 3 X ǫij x0j = 3 X 3 X ǫijk x0j Ck δΦ (7.215) j=1 k=1 j=1 Como ~r0 es arbitrario, se debe cumplir: ǫij = 3 X ǫijk Ck δΦ (7.216) k=1 Es decir, la matriz ǫ̃ es completamente antisimétrica: ǫ̃T = −ǫ̃ y proporcional a δΦ. Las rotaciones infinitesimales próximas a la identidad tienen la propiedad conmutativa: (I˜ + ǫ̃a )(I˜ + ǫ̃b ) = I˜ + ǫ̃a + ǫ̃b + ǫ̃a ǫ̃b (I˜ + ǫ̃b )(I˜ + ǫ̃a ) = I˜ + ǫ̃b + ǫ̃a + ǫ̃b ǫ̃a (7.217) Cinemática del cuerpo rı́gido / 243 Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan. En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotación finita con una infinitesimal: Ã(I˜ + ǫ̃) = à + Ãǫ̃ (I˜ + ǫ̃)à = à + ǫ̃à (7.218) La rotación inversa a I˜ + ǫ̃ es I˜ − ǫ̃, al primer orden en δΦ: (I˜ + ǫ̃)(I˜ − ǫ̃) = I˜ − ǫ̃2 (7.219) O sea que: ~r0 = (I˜ − ǫ̃)~r (7.220) Por tanto al primer orden en δΦ, ǫ̃~r = ǫ̃~r0 = ∆~r. Generadores infinitesimales del grupo de rotaciones. La matriz ǫ̃ puede escribirse en la forma siguiente, según (7.213): 0 0 −1 0 0 0 δΦ + C2 0 0 0 δΦ 0 0 1 ǫ̃ = C1 1 0 0 0 −1 0 (7.221) 0 1 0 δΦ −1 0 0 +C3 0 0 0 o también: ǫ̃ = 3 X i=1 Ci G̃i δΦ = (C1 ê2 ∧ ê3 + C2 ê3 ∧ ê1 + C3 ê1 ∧ ê2 )δΦ (7.222) Las matrices G̃i se llaman los generadores infinitesimales del grupo de rotaciones. Satisfacen: 1 ~~ G i = ǫijk êj ∧ êk 2 (7.223) El conmutador de dos generadores obedece la siguiente propiedad: G̃i G̃j − G̃j G̃i = 3 X k=1 ǫijk G̃k (7.224) 244 / Mecánica clásica avanzada Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta notación podemos escribir a (7.214) como: 3 X d~r Ci G̃i ~r = dΦ i=1 (7.225) Estas fórmulas, como hemos dicho, están dentro de la interpretación activa de las rotaciones. Velocidad angular. Se define el vector velocidad angular como: d~r dΦ ⇒ = −~ω × ~r (7.226) dt dt El vector ~ ω está situado en el eje de la rotación. Esta dirección se conoce como eje instantáneo de rotación: el eje n̂ no cambia al realizar la rotación infinitesimal por un ángulo dΦ. Sin embargo el desplazamiento del cuerpo rı́gido puede involucrar el cambio del eje n̂. Por esta razón ~ω no es en general la derivada temporal de algún vector; en otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no cambien con el tiempo. ω = n̂ ~ Cálculo de d~r/dt cuando n̂ también cambia con el tiempo. En este caso partimos directamente de la expresión: ~r(t) = Ã(t)~r0 (7.227) donde de la matriz à convierte al vector ~r0 en el vector ~r. El vector ~r˙ estará dado por: ˙ r = à ˙ ÃT ~r ~r˙ = Ã~ 0 (7.228) Por otra parte, ~r0 = ÃT ~r nos da: ˙ T ~r = −Ãà ˙ T ~r ˙ T ~r + ÃT ~r˙ ⇒ ~r˙ = −(ÃT )−1 à 0 = à (7.229) Definimos la matriz Ω̃ ası́: ˙ T = à ˙ ÃT Ω̃ = −Ãà (7.230) De (7.228) y (7.229) vemos que ~r = Ω̃~r0 . Además: ˙ T = −(à ˙ ÃT )T = −Ω̃ Ω̃ = −Ãà (7.231) Por tanto Ω̃ es una matriz antisimétrica. Sus elementos son entonces de la forma: Ωij = 3 X ǫijk ωk (7.232) k=1 Entonces (7.228) se puede escribir como: ẋi = (Ω~r)i = 3 X 3 X j=1 k=1 ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i (7.233) Cinemática del cuerpo rı́gido / 245 Por tanto: ~r˙ = −~ ω × ~r (7.234) Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por ǫijl y sumamos sobre i, j: 3 3 X X ǫijl Ωij = 3 X 3 X ǫijl ǫijk ωk (7.235) i=1 k=1 i=1 j=1 Ahora usamos la siguiente propiedad de la densidad de Levi-Civita: 3 3 X X ǫijl ǫijk = 2δlk (7.236) i=1 j=1 con lo cual llegamos a: 3 ωl = 3 1 XX ǫijl Ωij 2 i=1 j=1 (7.237) Usando la definición de Ω̃, (7.230), obtenemos: 3 ωl = 3 3 1 XXX Ȧik Ajk ǫijl 2 i=1 j=1 (7.238) k=1 donde ~ ω es la velocidad angular de rotación del cuerpo rı́gido en el sistema de coordenadas espacial, de acuerdo con la interpretación activa de las rotaciones que estamos utilizando. La ecuación (7.238) permite hallar las componentes de ω en términos de la representación que se tenga de la matriz Ã. En términos de los parámetros Ci y Φ, usamos la expresión (7.138) para Ã. Notamos que los elementos de à son de la forma: Aij = δij cos Φ + Cj Ck (1 − cos Φ) + 3 X ǫjkl Cl senΦ (7.239) l=1 Con lo cual Ȧik es: Ȧik = −δik senΦ Φ̇ + 3 X d d [Ci Ck (1 − cos Φ)] + ǫjkm (Cm senΦ) dt dt m=1 (7.240) 246 / Mecánica clásica avanzada Como ATkj = Ajk , podemos escribir: 3 X k=1 Ȧik Ajk = −δik senΦ cos Φ Φ̇ + cos Φ 3 X ǫijm cos Φ m=1 Cj d [Ci Cj (1 − cos Φ)]+ dt d (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ̇+ dt d [Ci n̂(1 − cos Φ)] · n̂(1 − cos Φ)+ dt 3 X d ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)− dt m=1 3 X ǫjil Cl sen2 Φ Φ̇ + l=1 3 X 3 X l=1 ǫjkl d [Ci Ck (1 − cos Φ)]Cl senΦ+ dt (δji δlm − δjm δli )Cl senΦ l,m=1 (7.241) d (Cm senΦ) dt P3 donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm = δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n̂.n̂˙ = 0 y n̂ × n̂ = 0 y P3 ~ ~ k=1 ǫijk Ai Bj = (A × B)k . Luego, al multiplicar por ǫikl y sumar sobre i y sobre j, notando además que ǫijk se anula cuando tiene subı́ndices repetidos, obtenemos finalmente para ~ ω: ω = n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) + n̂˙ senΦ ~ (7.242) En términos de los parámetros de Euler, definidos en (7.139): ω = 2e0~e˙ − 2ė0~e + 2~e˙ × ~e ~ (7.243) Con la interpretación activa de las rotaciones, la velocidad angular que hemos obtenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo el vector de posición de un punto arbitrario del cuerpo rı́gido. La velocidad angular en la interpretación pasiva de las rotaciones. En esta interpretación, ~r(t) es el vector de posición de un punto en el sistema de coordenadas espacial, y ~r en el sistema de coordenadas del cuerpo rı́gido. En este caso: ~r(t) = ÃT (t)~r (7.244) y ~r˙ estará dado por: ~r˙ = Ω̃~r = −~ ω × ~r (7.245) Cinemática del cuerpo rı́gido / 247 ahora ~ ω es la velocidad angular de los ejes unidos al cuerpo rı́gido en el sistema de coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a à por ÃT : ˙ = à ˙ T à Ω̃ = −ÃT à (7.246) donde ÃT se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estará dada en términos de à por: 3 ωl = 3 3 1 XXX T Ȧik Akj ǫijl 2 i=1 j=1 (7.247) k=1 Se obtiene entonces que: ω ~ = −n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) − n̂˙ senΦ (7.248) y en términos de los parámetros de Euler: ω ~ = −2ė0~e + 2e0~e˙ + 2~e˙ × ~e (7.249) ahora n̂ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo rı́gido, y Φ es el ángulo de rotación en el sentido de la regla de la mano derecha (contrario a las agujas del reloj). ~ ω puede también ser evaluada en términos de los ángulos de Euler. Para ello hay varias posibilidades de cálculo. (a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones sucesivas que definen los ángulos de Euler: ω ~ = φ̇êz + θ̇êµ1 + ψ̇êz (7.250) Obviamente (7.250) permite hallar a ω ~ respecto a los ejes espaciales (x, y, z) o respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta expresar a ~eµ1 y êz en términos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos escribir: êµ1 = (êµ1 · êx )êx + (êµ1 · êy )êy + (êµ1 · êz )êz = cos φ êx + senφ êy (7.251) êz = (êz · êx )êx + (êz · êy )êy + (êz · êz )êz = senθ senφ êx + senθ cos φêy + cos θêz donde en (7.251) hemos usado la ecuación (7.122). Las ecuaciones (7.251) permiten escribir a (7.250) en la forma: ω = (φ̇ + cos ψ̇)êz + (θ̇senθ − ψ̇ senψ cos φ)êy + ~ (θ̇ cos φ + ψ̇ senθ senφ)êx (7.252) 248 / Mecánica clásica avanzada De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo rı́gido: ~ω = (ψ̇ + φ̇ cos θ)êz + (φ̇ senθ cos ψ − θ̇ senψ)êy (7.253) +(φ̇ senθ senψ + θ̇ cos ψ)êx (b) La otra posibilidad de cálculo consiste en usar la ecuación que define a Ω̃, (7.246). à se puede expresar como producto de tres rotaciones según (7.131). Por tanto: ˙ ˙ ˙ à à + à à Ω̃ = ÃTφ ÃTθ ÃTψ (à ψ θ Ãφ + Ãψ Ãθ Ãφ ) ψ θ φ (7.254) Usando la ortogonalidad de las matrices Ã: ˙ ˙ + ÃT ÃT à ˙ à + ÃT ÃT ÃT à Ω̃ = ÃTφ à φ θ φ θ ψ ψ Ãθ Ãφ φ θ φ (7.255) ˙ , ... Si llamamos Ω̃φ = ÃTφ à φ Ω̃ = Ω̃φ + ÃTφ Ω̃θ Ãφ + ÃTφ ÃTθ Ω̃φ Ãθ Ãφ Usando las definiciones (7.127) se llega fácilmente a: 0 0 0 0 1 0 Ω̃φ = φ̇ −1 0 0 Ω̃θ = θ̇ 0 0 1 0 −1 0 0 0 0 0 1 Ω̃ψ = ψ̇ −1 0 0 0 0 (7.256) (7.257) 0 0 con lo cual (7.256) conduce al resultado (7.252). (c) Otra vı́a es expresar a ~ω en términos de los ángulos de Euler usando (7.249) y (7.142), lo cual se deja como ejercicio al lector. Las ecuaciones (7.252) y (7.253) muestran que no hay una relación simple entre las componentes de ~ ω expresadas respecto a los ejes fijos al sólido rı́gido y respecto a los ejes espaciales. La ecuación (7.247) da las componentes de ω ~ respecto a los ejes espaciales. Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al sólido rı́gido. Para hallar ~ empecemos por notar que ~r˙ = Ω̃~r, de (7.245). Como ~r = ÃT ~r, tenemos que: ω ~r˙ = Ω̃ÃT ~r (7.258) De transformar ~r˙ a las coordenadas del sólido rı́gido obtenemos: Ã~r˙ = ÃΩ̃ÃT ~r (7.259) Cinemática del cuerpo rı́gido / 249 Claramente Ã~r˙ no es ~r˙ , puesto que esta última es cero. Usando (7.246) y la or˙ T , matriz que llamaremos Ω̃ que es Ω̃ togonalidad de à obtenemos que à Ω̃ à = Ãà transformada a las coordenadas fijas al sólido rı́gido. La matriz Ω̃ es antisimétrica: T ˙ ÃT = −ÃΩ̃ÃT = −Ω̃ ˙ ÃT = Ã(ÃT Ã) Ω̃ = à (7.260) por tanto puede expresarse como: Ωij = 3 X ǫijk ω k (7.261) k=1 Esto conduce a: ~ × ~r Ã~r˙ = Ω̃~r = −ω (7.262) Entonces se sigue que: 3 3 3 1 XXX ωl = ǫijk Aik ȦTkj 2 i=1 j=1 (7.263) k=1 ~ y ~ω en el punto de vista activo de Comparando a (7.238) y (7.263) vemos que ω las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243): ~ = −2e0~e˙ + 2~eė0 − 2~e˙ × ~e ω (7.264) Usando (7.264) y (7.142) se obtiene el resultado (7.253). No existen en general, funciones λi (φ, θ, ψ) tales que: ωi = d λi (φ, θ, ψ) dλ (7.265) Por ejemplo, si ω1 = λ̇1 se deberı́a cumplir que: dλ1 dλ1 dλ1 φ̇ + θ̇ + ψ̇ = θ̇ cos θ + ψ̇ senθ senφ dφ dθ dψ (7.266) y por tanto: dλ1 dλ1 =0; = cos φ ; dφ dθ dλ1 = senθ senφ dψ (7.267) λ1 no existe puesto que: ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = −senφ ∂θ ∂φ ∂φ∂θ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = cos θ senφ ∂ψ ∂θ ∂θ∂ψ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = sen θ cos φ ∂ψ ∂φ ∂φ∂ψ (7.268) 250 / Mecánica clásica avanzada La ecuación (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0. Las componentes de ω ~ son combinaciones no integrables de φ̇, θ̇, ψ̇ (o de las derivadas temporales de los parámetros usados para describir la rotación), llamadas las derivadas de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones de movimiento cuando se usan seudocoordenadas para describir el sistema (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 10). El cálculo de ωi implica considerar desplazamientos infinitesimales alrededor de una posición dada del sólido rı́gido. Pero hay maneras diferentes de realizar esos desplazamientos. Como una rotación finita no conmuta con una infinitesimal, depende del orden en que se efectúen las transformaciones. Es de esperarse que ωi sea una derivada total respecto al tiempo sólo en el caso en que el desplazamiento infinitesimal sea alrededor del mismo eje de rotación en que se hizo la rotación finita. Por ejemplo, si à = Ãφ y ǫ̃ = ǫ̃φ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ̇. Tasa de cambios temporales de un vector. Seguimos con el punto de vista ~ cambia con el tiempo en el sistema de pasivo de las rotaciones. Un vector arbitrario G ~ respecto a los ejes espaciales proviene coordenadas fijo al cuerpo rı́gido. El cambio de G de dos efectos: de la rotación del sistema de ejes del sólido rı́gido y de la rotación ~ Es decir: intrı́nseca de G. ~ ~˙ dG = G dt cuerpo ~ dG rotacional cuerpo = ~ −~ω × G (7.269) espacio dt En (7.269) ~ ω está dada por (7.248), que es el negativo de la velocidad angular que usan algunos autores para describir las rotaciones desde el punto de vista pasivo y para ~ ~ los cuales dG = −~ω × G dt. rotacional espacio ~ visto en los ejes espaciales es: Entonces el cambio en G ~ dG espacio ~ = dG cuerpo ~ − ~ω × Gdt (7.270) o también: ~ dG dt ! ~ dG dt = espacio ! cuerpo ~ − ~ω × G (7.271) ~ es: La segunda derivada temporal de G ~ d2 G 2 dt ! espacio = ~ d2 G 2 dt ! cuerpo − 2~ω × ~ −ω ~ +~ω × (~ω × G) ~˙ × G ~ dG dt ! espacio (7.272) Cinemática del cuerpo rı́gido / 251 La ecuación (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando los ejes espaciales y del cuerpo rı́gido coinciden instantáneamente. Para una posición arbitraria del cuerpo rı́gido se cumple: ~ = G ~ ÃG ~˙ = G ˙G ~ + ÃG ~˙ à ~¨ = G ¨ ¨G ˙G ~ + 2à ~˙ + ÃG ~ à (7.273) ~˙ y G ~¨ se pueden Las (7.273) pueden expresarse en función de ~ω . Los vectores G escribir respecto a los ejes espaciales ası́: ˙G ~˙ = G ~ y ~˙ + ÃT à ÃT G ¨~ ¨G ˙G ~¨ = G ~ ~˙ + ÃT à ÃT G + 2ÃT à (7.274) ˙ obtenemos: Usando la definición Ω̃ = −ÃT Ã, Ω̃˙ = 2 Ω̃ = ˙ T à ˙ − ÃT à ¨ −à ˙ T à −ÃT à ˙ = −à ˙ T à ˙ ⇒ Ω̃˙ = Ω̃2 − ÃT à ¨ à (7.275) De (7.275) se sigue que: ~˙ = G ~˙ − Ω̃G ~ ÃT G (7.276) ¨~ ˙ G ~¨ = G ~˙ + (Ω̃2 − Ω̃) ~ − 2Ω̃G ÃT G Usando (7.245) obtenemos: ~ = −~ ~ Ω̃G ω×G (7.277) ˙ T = d(Ω̃T )/dt = −Ω̃ ˙ se sigue también que: Como Ω̃ ~ = −~ ~ Ω̃˙ G ω˙ × G Además se cumple que: ~ = Ω̃ −~ ~ = −~ ~ Ω̃2 G ω×G ω × −~ω × G (7.278) (7.279) De (7.277) y (7.278) se obtiene para (7.276): ~˙ = G ~˙ + ~ ~ ω×G ÃT G ¨~ ~¨ = G ~˙ + ω ~ + ~ω˙ × G ~ + 2~ ω×G ~ × (~ω × G) à G T (7.280) 252 / Mecánica clásica avanzada Explı́citamente las ecuaciones (7.280) se pueden escribir ası́: ! ! i h dG ~ ~ d2 G ~ + ω ~ × G = à dt2 dt espacio cuerpo ~ d2 G 2 dt ! cuerpo h d2 G ~ = à 2 dt ! espacio + 2~ω × ~ dG dt ! (7.281) espacio i ~ + ~ω˙ × G ~ +~ω × (~ω × G) ˜ esto es, cuando Vemos que (7.271) y (7.272) coinciden con (7.281) cuando à = I, escogemos los ejes de modo que coincidan instantáneamente. En particular, para el vector de posición de una partı́cula moviéndose en el sistema de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al ˜ sistema de ejes espacial, (7.281) nos da para à = I: ~¨r = ~¨r + 2~ ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r (7.282) = ~¨r + 2~ ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r Como para la Tierra ~ω = −n̂Φ̇ podemos escribir: ~¨r = ~¨r − 2Φ̇n̂ × ~r˙ − Φ̇2 n̂ × (n̂ × ~r) (7.283) ~ = m~¨r y F~ = m~¨r se sigue que: Como F ~ = F~ − 2mΦ̇n̂ × ~r˙ − mΦ2 n̂ × (n̂ × ~r) F (7.284) En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es F~ = m~g sino que hay otros dos términos de naturaleza inercial. El segundo es la fuerza de Coriolis y el tercero es la fuerza centrı́fuga. La discusión completa de estos efectos puede verse en el texto Classical mechanics de Goldstein, sección 4-9, o en el texto Fı́sica, vol. I de Alonso-Finn, sección 6.5. 8 Dinámica del cuerpo rı́gido El fin de la dinámica del cuerpo rı́gido es describir la evolución del cuerpo rı́gido, o sea, hallar las coordenadas generalizadas de rotación en función del tiempo cuando son conocidas: (i) La distribución de masa del cuerpo rı́gido en reposo y (ii) Las fuerzas y ligaduras que actúan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen un conjunto adecuado de coordenadas generalizadas independientes. Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio de las ecuaciones de movimiento de Euler. Cuál forma se utiliza es algo que depende del problema particular. 8.1. El tensor de inercia Un cuerpo rı́gido puede considerarse como un sistema de partı́culas sometido a las ligaduras de que cualquier par de partı́culas permanece siempre a la misma distancia una de la otra. En muchos casos es útil considerar una distribución continua de materia, de acuerdo con cierta función de densidad de masa ρ(~r). La masa total, para distribuciones discreta y continua respectivamente, es: M= N X mi ; M= i=1 Z ρ(~r)d3~r (8.1) Las correspondientes expresiones para la energı́a cinética y el momento angular son: T = N X 1 i=1 ~ = L N X i=1 2 2 mi~r˙ i ; mi~ri × ~r˙ i ; T = Z ~ = L 1 ρ(~r)~r˙ 2 d3~r 2 (8.2) Z (8.3) ρ(~r)~r × ~r˙ d3~r 253 254 / Mecánica clásica Similarmente el torque total es: ~ = K N X i=1 ~ri × F~i ; ~ = K Z ~r × F~ (~r) d3~r (8.4) donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2), (8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable expresarlas en función de las coordenadas del cuerpo rı́gido. ~ la Supondremos que el cuerpo rı́gido se translada a la vez que rota, siendo V velocidad de translación del origen de coordenadas fijo al cuerpo y ω ~ la velocidad angular de rotación. Las fórmulas de transformación para la posición y la velocidad de un punto arbitrario son, según las fórmulas (7.5), (7.244) y (7.245): ~ + AT ~r˙ − ~ω × ~r ′ ~r˙ = V ~r = V~ t + AT ~r ; (8.5) ~ constante. El vector ~ω está dado por (7.248). Por simplicidad hemos tomado a V Si el punto en consideración es del cuerpo rı́gido entonces se cumple que ~r˙ = 0. Constancia de ω respecto a diferentes sistemas de coordenadas fijos al cuerpo rı́gido. Sean O1 y O2 dos puntos del cuerpo rı́gido en los cuales se toma el ~1 y R ~ 2 son los vectores de origen de dos sistemas de coordenadas fijos al cuerpo rı́gido. R ~ ~2 −R ~ 1 es el vector posición de O1 y O2 respecto a los ejes espaciales, de modo que R = R de posición de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo rı́gido ~2 = R ~ +R ~1 y R ~1 = R ~2 − R ~ se con origen en O1 y ~ ω2 respecto a O2 . De las fórmulas R sigue que: ~2 dR dt = esp ~1 dR dt = esp ~1 dR dt ~2 dR dt + esp esp − ~ dR dt ~ dR dt = esp = esp ~1 dR dt ~2 dR dt + esp esp − ~ dR dt ~ dR dt 1 2 ~ −ω ~1 × R (8.6) ~ +ω ~2 × R (8.7) en donde usamos los resultados de (7.269) y siguientes. Por tratarse de un cuerpo rı́gido se sigue que: ~ dR dt = 1 ~ dR dt =0 (8.8) 2 Entonces obtenemos de (8.6) y (8.7): ~1 dR dt = esp ~1 dR dt esp ~ + ~ω2 × R ~ −ω ~1 × R (8.9) Por tanto: ~ =0 (~ ω2 − ω~1 ) × R (8.10) Dinámica del cuerpo rı́gido / 255 ~ siendo λ arbitraria. Como esta expresión debe cumplirse Entonces ~ ω2 − ω~1 = λR, en el caso lı́mite en que el cuerpo rı́gido esté en reposo, λ debe anularse, por lo que se llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo rı́gido que se tome como origen del sistema de coordenadas fijo al cuerpo rı́gido. Energı́a cinética. La energı́a cinética respecto a los ejes espaciales, ecuación (8.2), puede descomponerse usando (8.5): h i 1X ~ 2 − 2V ~ · (~ ω × ~ri ) + (~ω × ~ri ′ )2 mi V 2 i=1 N T = (8.11) Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo rı́gido (que coincide con el origen de las coordenadas ~r ′ , según la figura 7.2) en el centro de masa, se cumple que: N X ′ ~ CM mi~ri ′ = M R =0 (8.12) i=1 Entonces se sigue que: N T = 1 ~2 1X mi (~ ω × ~ri ′ )2 MV + 2 2 i=r (8.13) Cuando los ejes del cuerpo rı́gido coinciden instantáneamente con los espaciales, ~r = ~ri ′ , en vez de (8.13) podemos escribir: N T = 2 1 ~2 1X ω × ~r i mi ~ MV + 2 2 i=r (8.14) La energı́a cinética, pues, consta de dos partes independientes: la energı́a cinética del centro de masa y la energı́a cinética de rotación respecto al centro de masa. Como ~ω depende de la orientación del cuerpo rı́gido, según (7.252), se sigue que la energı́a cinética de rotación depende de los ángulos de Euler y sus derivadas temporales: T = Ttraslacional + Trotacional (φ, θ, ψ, φ̇, θ̇, ψ̇) (8.15) Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresión para el producto cruz en términos del tensor de Levi-Civita: 2 ω × ~ri = ǫmnp ωn rip ǫmst ωs r it ~ (8.16) donde los ı́ndices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y, z, y usamos la convención de Einstein. El tensor de Levi-Civita tiene la propiedad: ǫmnp ǫmst = δns δpt − δnt δps de la cual se sigue que: 2 2 ~ · ~r i ω × ~ri = ω 2 r 2i − ω ~ (8.17) (8.18) 256 / Mecánica clásica La ecuación (8.18) permite escribir a Trotacional como: Trotacional = N X 1 mi r2i δst − ris r it ωs ωt 2 i=1 (8.19) Definimos el tensor de inercia ası́: Ist = N X i=1 mi (r 2i δst − r is r it ) (8.20) o usando la notación diádica, ecuación (7.45), N ~~ X mi r 2i ~~1 − ~r i r~i I= (8.21) i=1 ~ donde ~1 es el diádico unidad; vemos entonces que: 1 ~~ 1 ~ω · I · ~ω = ωs Ist ωt (8.22) 2 2 ~ ~ En la definición de I~ tomamos los ejes del cuerpo rı́gido; I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Sin embargo, cuando ~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el V origen de coordenadas no esté en el centro de masa. Trotacional = Momento angular. El momento angular en el sistema de coordenadas espacial, ecuación (8.3), puede descomponerse en una parte del centro de masa y una parte respecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instantáneamente, el momento angular de rotación alrededor del centro de masa es: ~ rotacional = L N X i=1 N h 2 X i mi~r i × ω mi ~ω~ri − r i ω ~ × ~ri = ~ .~r i (8.23) i=1 Desarrollando el triple producto vectorial llegamos a una expresión que contiene el tensor de inercia: ~ rotacional = ~I~ · ~ω L (8.24) ~ rotacional son, usando los resultados de la sección 7.3: o sea que las componentes de L ~ (Lrotacional )s = ~es · I~ · ~ω ; s = 1, 2, 3 (8.25) ~ donde I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Momentos de inercia y productos de inercia. Los elementos diagonales del tensor de inercia reciben el nombre de momentos de inercia: N 2 X ~~ mi ~r i − r 2is ; s = 1, 2, 3 Iss = ~es · I · ~es = (8.26) i=1 Dinámica del cuerpo rı́gido / 257 ~ Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a veces el de momentos centrı́fugos respecto a los planos coordenados): Ist = − N X mi r is rit ; s 6= t = 1, 2, 3 i=1 (8.27) ~~ I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una transformación de semejanza realizada por una matriz ortogonal, sus valores propios son reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del álgebra de matrices.1 Momento de inercia respecto al eje de rotación. Por simplicidad tomaremos el caso en que el eje de rotación instantáneamente está fijo, de modo que ~ω está dada por la fórmula (7.226), ω ~ = ωn̂. Entonces de acuerdo con (8.22), Trotacional puede escribirse como: T = 1 2 Iω 2 (8.28) donde el número I está definido ası́: I = n̂ · I · n̂ = I n̂n̂ = N X i=1 h 2 i mi r 2i − ~ri · n̂ (8.29) I se denomina el momento de inercia respecto al eje de rotación. De manera similar puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto será diferente del I dado en (8.29). La componente de Lrotacional en la dirección de n̂ es: ~ · n̂ = n̂ · ~I~ · n̂ Ln̂ = L ω = Iω (8.30) ~ rotacional al cuadrado es: La magnitud de L ~ ~ L2 = ~ ω · I~ · I~ · ω ~ 6= I 2 ω 2 (8.31) ~ será distinto de Ln̂ ; en otras palabras, en general L ~ y ~ω no son o sea que en general L paralelos. De acuerdo con la definición elemental, el momento de inercia del cuerpo rı́gido respecto al eje n̂ depende de las distancias Ai de las partı́culas al eje: In = N X A2i mi (8.32) i=1 De acuerdo con su definición: A2i = (~r i × n̂)2 = ~r i · n̂ × ~ri × n̂ 1 Véase (8.33) por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40, Pergamon Press, 1964. 258 / Mecánica clásica Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18): n̂ × ~r i × n̂ = ~ri − n̂ n̂ · ~r i (8.34) Reemplazando (8.34) en (8.32) llegamos a: In = N X i=1 h 2 2 i mi ~r i − ~r i .n̂ (8.35) ~ Si n̂ es el eje de rotación vemos que In coincide con I = n̂ · I~ · n̂. Teorema de Steiner. Es un teorema que permite relacionar los momentos de inercia respecto a ejes diferentes. Se llama también el teorema de los momentos de inercia respecto a ejes paralelos. Si ~r es el vector de posición de la partı́cula i respecto a los ejes del cuerpo rı́gido con origen en el centro de masa y ~ri ′ respecto a los ejes ~ respecto al centro de masa, del cuerpo rı́gido con un origen diferente O′ , colocado en R entonces: ~ + ~r i ′ ~r i = R (8.36) Manipulaciones simples nos conducen a la relación: I ′ = I + M a2 (8.37) donde a2 es: ~ × n̂)2 a2 = (R (8.38) y I ′ es el momento de inercia respecto a un eje paralelo a n̂ que se separa de él una cantidad a. El teorema de Steiner para el tensor de inercia mismo es: ~~ ′ ~~ ~R ~ I = I + M R2~~1 − R (8.39) ~ ~ donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia ~ respecto a unos ejes del cuerpo rı́gido con origen en R respecto al centro de masa. ~ ~~ Ejemplo 8.1.1 Expresar a I~ en términos de R i definida ası́: 0 z i −y i ~~ o sea : R 0 x −z R̃i = i i i = ǫmnl xil êm ên y i −xi 0 (8.40) Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la ~~ ~~ siguiente expresión par R i · Ri : ~~ ~~ ~ r i~r i − r 2i ~1 R i · Ri = ~ (8.41) Dinámica del cuerpo rı́gido / 259 ~~ Se sigue entonces la siguiente expresión para I: N X ~ ~ ~~ mi R i · R i I =− (8.42) i=1 Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular rı́gida horizontal que está colocada sobre cuatro resortes iguales, para el caso en el cual el centro de la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede desplazarse verticalmente y girar de modo que el centro permanezca fijo. Entonces las correspondientes energı́as cinéticas son: 1 1 ~~ M Ż 2 ; Trotacional = ~ω · I.~ ω (8.43) 2 2 Para una placa rectangular homogénea rı́gida usamos la fórmula correspondiente a (8.21) para una distribución uniforme de masa: Z ~~ M 2~ ~ I= r I − ~r~r d2~r (8.44) A Ttraslacional = donde A es el área de la placa y d2~r el elemento diferencial de área. Tomando el plano x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de la placa (dirección x) y 2b la anchura (dirección y), (8.44) toma la forma: Z Z M ~ ~~ (r2 I~ − ~r~r) dx dy (8.45) I= 4ab Con la elección de coordenadas que hemos hecho, los productos de inercia se anulan ~~ (I es diagonal). Los momentos de inercia son: 1 1 1 M b2 ; Iyy = M a2 ; Izz = M (a2 + b2 ) (8.46) 3 3 3 En vez de tomar como coordenadas generalizadas de rotación a los ángulos de Euler ordinarios, con lo cual la velocidad angular estarı́a dada por las fórmulas (7.252) o (7.253), tomaremos los ángulos de rotación alrededor de los tres ejes perpendiculares fijos a la placa. Esta es la llamada convención “xyz” de los ángulos de Euler; ver el final de la sección 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas que definen los ángulos de Euler en la convención “xyz” son: Ixx = ω ~ = φ̇ êz + θ̇ êµ2 + ψ̇ êµ′1 (8.47) Con lo cual se obtiene para las componentes de la velocidad angular respecto a los ejes del cuerpo rı́gido:2 ~ω = (ψ̇ − φ̇ senθ)êx̄ + (θ̇ cos ψ + φ̇ cos θ senψ)êy (8.48) +(−φ̇ senψ + φ̇ cos θ cos ψ)êz̄ 2 Las componentes respecto a los ejes espaciales son (ψ̇ cos θ cos φ − θ̇ senφ, φ̇ cos θ senφ + θ̇ cos φ, φ̇ − ψ̇ senθ). Véase apéndice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980. ¯ 260 / Mecánica clásica En las fórmulas dinámicas hemos supuesto que los ejes espacial y de cuerpo rı́gido coinciden instantáneamente. Por esto debemos tomar nulos los valores de los ángulos de ~ coinciden instantáneamente: Euler, con lo cual ω ~ yω ω = φ̇ êz + θ̇ êy + ψ̇ êx ~ (8.49) Entonces Trotacional será: Trotacional = 1 1 1 2 ψ̇ Ixx + θ̇2 Iyy + φ̇2 Izz 2 2 2 (8.50) Con la convención ordinaria para los ángulos de Euler aparecerán términos en φ̇ψ̇. La energı́a potencial en función de z y de los ángulos de Euler es: V = 1 1 1 1 (4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2 2 2 2 2 (8.51) En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la constante asociada a los desplazamientos horizontales, en que no se estiran los resortes y por lo tanto k ′ no se puede expresar en función de k. El lagrangiano buscado es: L= M 2 2 1 |b ψ̇ + a2 φ̇2 + (a2 + b2 )φ̇2 | + M ż 2 − 2kz 2 6 2 2 2 2 2 ′ 2 2 (8.52) 2 −2ka θ − 2kb ψ − 2k (a + b )φ Vemos que z, φ, θ, ψ, son coordenadas normales. 8.2. Diagonalización del tensor de inercia El tensor de inercia es simétrico, Ist = Its , con lo cual sus valores propios son reales y los vectores propios correspondientes a valores propios diferentes son ortogonales. En ~ depende general los productos de inercia no son nulos, o sea que cada componente de L de todas las componentes de ω ~: Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ; s = 1, 2, 3 (8.53) ~ será proporcional a la si se anulan los productos de inercia, cada componente de L respectiva velocidad angular y T será una forma cuadrática en las componentes de ~ω sin términos cruzados. ~ Como I~ es simétrico, siempre es posible hallar un sistema de coordenadas fijo al cuerpo rı́gido en que sea diagonal. Esto se logra resolviendo el problema de valores ~~ propios y vectores propios para I: ~~ ~ ~α ; I · Xα = Iα X α = 1, 2, 3 (8.54) o en términos de las componentes: 3 X t=1 Irt Xαt = Iα Xαr ; r, α = 1, 2, 3 (8.55) Dinámica del cuerpo rı́gido / 261 Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆ satisface: 3 X ⋆ ⋆ ⋆ Xβr = Iβ⋆ Xβt ; t, β = 1, 2, 3 (8.56) Itr r=1 ⋆ Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando los resultados obtenemos: 3 X 3 3 X 3 3 X X X ⋆ ⋆ ⋆ ⋆ ⋆ Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ r=1 t=1 t=1 t=1 r=1 (8.57) − 3 X ⋆ Xαt Xβt t=1 como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede escribirse como un producto escalar ordinario, quedando: ~α · X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58) (Iα − Iβ⋆ )X β ~α ·X ~ ⋆ es real y positivo, que I ⋆ = Iα , Para α = β se sigue de (8.58), debido a que X α α ~α y X ~ β corresponden a valores propios o sea que los valores propios son reales. Cuando X ~ α normalizados diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ ~ β puede no ser a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ 1, X ~2 y X ~ 3 , forman cero, pero que puede escogerse cero, obtenemos de esta manera que X una trı́ada ortonormal de vectores unitarios: ~α · X ~ β = δαβ ; X α, β = 1, 2, 3 (8.59) Analicemos más en detalle el caso en que ocurran valores propios degenerados, Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 , ~1 · X ~2 = X ~1 · X ~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X ~ 3 = 0. que X ~ Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par de vectores ortogonales, lo cual nos está a su vez indicando que el sólido rı́gido posee ~ 1. simetrı́a de rotación alrededor del eje X ~α Los ejes principales y la transformación principal. Los vectores propios X constituyen un sistema de tres ejes cartesianos fijos al cuerpo rı́gido, respecto a los cuales el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores propios Iα se llaman momentos principales de inercia. En cualquier caso es posible hallar una transformación de coordenadas que nos permita pasar a los ejes principales. Tal transformación se llama transformación principal y consiste en una rotación. De acuerdo con las fórmulas (7.30) y (7.60), las fórmulas de transformación para los vectores unitarios y para el tensor de inercia serán: ~r = X 3 X s=1 αrs ês ; ′ Irs 3 X t,u αrt αsu Itu ; r, s = 1, 2, 3 (8.60) 262 / Mecánica clásica donde αrs son los cosenos directores de la transformación. Vemos que las componentes de los nuevos vectores unitarios coinciden con los cosenos directores: Xrs = αrs ; r, s = 1, 2, 3 (8.61) Es decir, con los elementos de los vectores propios formamos una matriz que coincide con la matriz de la transformación principal siendo las filas de tal matriz formadas con las componentes de los vectores propios. Esta matriz es ortogonal. ~ r · ês y las Los cosenos directores también pueden escribirse en la forma αrs = X ~~ ~ ~ ′ ~ componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = êt · I~ · êu , con lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente: 3 X ~ s) ~ r · ~I~ · X ~s = ~ r · êt ) êt · ~I~ · êu (êu · X (8.62) X (X t,u=1 Como ′ Irs es diagonal, podemos escribir: ′ ~ r · ~I~ · X ~ s = Is δrs ; =X Irs r, s = 1, 2, 3 (8.63) ~ 3 = ~~1, obtenemos ~2 + X ~ 3X ~1 + X ~ 2X ~ r, X ~ 1X Usando la completidad de los vectores X ~ r y sumando sobre r la ecuación de valores propios para ~I. ~ al multiplicar a (8.63) por X En términos de componentes la ecuación de valores propios es (8.55): 3 X t=1 (Irt − Iα δrt )Xαt = 0 ; r, α = 1, 2, 3 (8.64) El anterior es un sistema de tres ecuaciones homogéneas en las incógnitas Xαt , que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el determinante de la matriz de los coeficientes: ~~ ~ ~ det I − Iα 1 = 0 (8.65) que en forma explı́cita es: Ixx − Iα Ixy Ixy Iyy − Iα det Ixz Iyz Ixz Iyz Izz − Iα =0 (8.66) La ecuación (8.66) es cúbica en Iα , que tendrá tres raı́ces reales según hemos visto; esta ecuación se llama ecuación secular. Un cuerpo rı́gido cuyos tres momentos principales de inercia son diferentes es asimétrico. Si por ejemplo I1 = I2 6= I3 , el ~ 3 . Por simetrı́a de rotación cuerpo tiene simetrı́a de rotación alrededor del eje principal X entendemos una rotación que deja inalterado el tensor de inercia; tal rotación puede ~~ representarse mediante cierto diádico ortogonal R. ~~ ~~ ~~ −1 ~~ R ·I ·R = I (8.67) Dinámica del cuerpo rı́gido / 263 Mediante (8.67) la ecuación de valores propios para I1 puede escribirse como: ~~ ~~ ~~ −1 ~ ~~ ~ ~ ~1 = R · I · R · X1 = I1 X I · X1 = I1 X (8.68) ~~ o por la ortogonalidad de R: ~~ −1 ~ ~~ ~~ −1 ~ · X1 ) I · R X1 = I · (R (8.69) ~~ ~ ~1 y R Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores ~~ propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son ortogonales pero sı́ son linealmente independientes y permiten escribir cualquier vector ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo en el plano perpendicular al eje de simetrı́a X ~~ rı́gido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del cuerpo rı́gido con origen en el centro de masa. Ejemplo 8.2.1 Sea un cuerpo rı́gido formado por once masas discretas iguales distribuidas como se muestra en la figura 8.1. Las ocho masas del plano están sobre una circunferencia de radio a, con un ángulo entre sı́ de 45o . Las masas del eje están a una distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo 2π/8, coincide consigo mismo; se dice que posee un eje de simetrı́a de orden 8. Sobre el plano hay también cuatro ejes de simetrı́a de orden 2. Calcular las componentes del tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia son iguales. z y x Figura 8.1 Cuerpo rı́gido formado por once masas discretas iguales. Podemos elegir los ejes del cuerpo rı́gido de modo que coincidan con la posición de algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z 264 / Mecánica clásica a lo largo del eje de simetrı́a. Con esta elección se anulan los productos de inercia o sea que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán también momentos principales de inercia. Los valores de los Iα son: I1 = Ixx = 6ma2 ; I2 = Iyy = 6ma2 ; I3 = Izz = 8ma2 (8.70) Vemos que ninguno de los tres momentos principales de inercia es mayor que la suma de los otros dos y que los momentos principales respecto a los ejes del plano de simetrı́a son iguales. Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese plano, perpendiculares o no entre sı́, el tensor de inercia resulta diagonal, siempre que un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetrı́a del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre sı́ un ángulo que sea un múltiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo. Usando el lenguaje de la teorı́a de grupos, decimos que el cuerpo rı́gido posee un grupo de simetrı́as de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor del eje de simetrı́a de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales. Además posee un conjunto de simetrı́as de reflexión en planos horizontales y verticales. El conjunto de los vectores propios correspondientes al valor propio degenerado I1 constituye una representación irreductible del grupo de simetrı́as D4 .3 El elipsoide de inercia. Sea n̂ el vector unitario que define una dirección cualquiera. El momento de inercia respecto al eje n̂ es: 3 X ~ I = n̂ · I~ · n̂ = nr Irs ns (8.71) r,s=1 donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un punto cualquiera sobre el eje, estará descrito respecto al centro de masa por el vector de posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados en (8.71) obtenemos: In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz (8.72) Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de coordenadas fijo al cuerpo rı́gido4 se obtiene la ecuación estándar para un elipsoide: x2 y2 z2 + 2 + 2 =1 2 a b c (8.73) 3 Véase el capı́tulo de teorı́a de la simetrı́a en el libro de Mecánica cuántica no relativı́stica de LandauLifshitz. 4 Que coincide instantáneamente con el sistema de coordenadas espacial. Dinámica del cuerpo rı́gido / 265 La ecuación (8.73) se identificará con (8.72) si se satisfacen las relaciones: a2 = In r2 ; I1 I1 = Ixx ; b2 = In r2 ; I2 I2 = Iyy ; c2 = In r2 ; I3 I3 = Izz ; (8.74) Irs = 0 si r 6= s Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales ortogonales del cuerpo rı́gido y que I1 , I2 , I3 , coinciden con los momentos principales de inercia. Cuerpo rígido r n Elipsoide de inercia: In r 2 = constante Figura 8.2 Superficie elipsoidal El elipsoide de inercia es una superficie de la forma: F (x, y, z) = 0 (8.75) La normal a F en un punto es el gradiente de F en ese punto. En los ejes principales de un elipsoide el gradiente es paralelo al eje: ∂F = K n̂ ∂~r En forma explı́cita (8.76) es: (8.76) ∂F = 2xIxx + 2yIxy + 2zIxz = Knx ∂x ∂F = 2xIxy + 2yIyy + 2zIyz = Kny ∂y (8.77) ∂F = 2xIxz + 2yIyz + 2zIzz = Knz ∂z Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante 266 / Mecánica clásica K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de ecuaciones: (Ixx − In )nx + Ixy ny + Ixz nz = 0 Ixy nx + (Iyy − In )ny + Iyz nz = 0 (8.78) Ixz nx + Iyz ny + (Izz − In )nz = 0 O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los momentos principales de inercia, ya que los ejes principales de inercia coinciden con los ejes principales del elipsoide de inercia. La construcción del elipsoide de inercia permite interesantes análisis cualitativos del movimiento del cuerpo rı́gido. Es la base de la representación de Poinsot para el estudio del movimiento de un cuerpo rı́gido no sometido a torques. Ejemplo 8.2.2 ¿Cuál es la relación entre el diámetro y la altura de un cilindro circular recto tal que el elipsoide de inercia en el centro del cilindro es una esfera? Tomamos el origen en el centro de masa. En virtud de la simetrı́a de rotación, cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes principales. El momento de inercia Izz = I3 , siendo z el eje del cilindro, es: Z Z Z M I3 = (y 2 + x2 ) d3~r (8.79) V donde M es la masa total y V el volumen. Tomando el elemento de volumen como un anillo cilı́ndrico de radios ρ y ρ + dρ y altura dl: d3~r = 2πρ dρ dl (8.80) Entonces una integración elemental nos lleva a: I3 = 1 M R2 2 siendo R el radio de la circunferencia de la base del cilindro. El momento de inercia Ixx = I1 es: Z Z Z M I1 = (z 2 + y 2 ) d3~r V (8.81) (8.82) En las dos integrales que aparecen en (8.79) y (8.82) es cómodo tomar respectivamente los siguientes elementos de volumen: p (8.83) d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy Entonces obtenemos para I1 , que además será igual a I2 : 2 1 l I1 = M + R2 4 3 (8.84) Dinámica del cuerpo rı́gido / 267 El elipsoide de inercia será una esfera si I1 = I2 = I3 , de acuerdo con las fórmulas (8.74). De (8.81) y (8.84) se sigue entonces que: l2 = 3R2 (8.85) Ejemplo 8.2.3 Tres masas iguales están en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a), hallar los momentos principales de inercia y un conjunto de ejes principales respecto al origen de coordenadas. Los elementos del 5 0 ~~ 0 3 I= 0 −2 tensor de inercia para este problema son: 0 −2 2ma2 3 El valor del determinante secular, ecuación (8.66), es: ~~ ~ ~ det I − I 1 ⇒ (5 − i)[(3 − i)2 − 4] = 0 (8.86) (8.87) donde hemos llamado: i= I 2ma2 (8.88) Las tres raı́ces de la ecuación secular son entonces i = 5, 5, 1, con lo cual los tres momentos principales de inercia valen: I1 = 2ma2 ; I2 = 10ma2 ; I3 = 10ma2 (8.89) ~ ~ ~ Las ecuaciones de valores propios son ~i · X α = iα Xα , que explı́citamente son: (5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0 ~ 1: X (8.90) Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio X11 = 0 ; X12 = X13 (8.91) ~ 1 normalizado a la unidad es entonces: El vector propio X ~ 1 = 0, √1 , √1 X 2 2 (8.92) Para la raı́z doble i2 = i3 = 5 las relaciones entre los componentes de los vectores ~ 2, X ~ 3 , son: propios X 0.Xα1 = 0 ; Xα2 = −Xα3 ; α = 2, 3 (8.93) Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de normalización sólo nos permite expresar a Xα2 en función de Xα1 . Este comportamiento es caracterı́stico de los problemas de valores propios cuando hay degeneración. Una pareja 268 / Mecánica clásica posible de vectores propios normalizados y ortogonales correspondientes al valor propio degenerado i2 = i3 = 5 es: 1 1 ~ 3 = (1, 0, 0) ~ √ √ ; X (8.94) X2 = 0, − , 2 2 La matriz de la correspondiente transformación principal es: 1 1 √ √ 0 2 2 1 ÃT = 0 − √1 √ 2 2 1 0 (8.95) 0 ~ 1 se puede construir Es claro que con cualquier par de ejes perpendiculares a X igualmente un sistema de ejes principales respecto al origen de coordenadas (véase figura 8.3). Otro problema serı́a hallar los momentos principales y los ejes principales respecto al centro de masa que está localizado en el punto: ~ = a , a, a R (8.96) 3 z m m x2 x1 x m y x3 Figura 8.3 Ejes principales de sistema de masas puntuales 8.3. Las ecuaciones de movimiento de Euler Vamos a suponer que el cuerpo rı́gido no tiene ligaduras adicionales a la de poderse mover sólo de modo que un punto permanezca fijo; entonces los ángulos de Euler son coordenadas generalizadas para la descripción del movimiento del cuerpo rı́gido. Dinámica del cuerpo rı́gido / 269 El lagrangiano del cuerpo rı́gido. La energı́a cinética es puramente rotacional y está dada por la ecuación (8.22). La energı́a potencial dependerá de la orientación del cuerpo, con lo cual la lagrangiana será: L(φ, θ, ψ; φ̇; θ̇, ψ̇) = 1 (I1 ωx2 + I2 ωy2 + I3 ωz2 ) − V (φ, θ, ψ) 2 (8.97) donde se supone que los ejes fijos al cuerpo rı́gido son ejes principales. Las fuerzas generalizadas de este problema son: Fφ = − ∂V ; ∂φ Fθ = − ∂V ; ∂θ Fψ = − ∂V ∂ψ (8.98) Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z, el torque alrededor de la lı́nea de nodos y el torque alrededor del eje principal del cuerpo rı́gido z. Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento. La ecuación de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo rı́gido es: ∂T ∂V d ∂T − =− = Kz dt ∂ ψ̇ ∂ψ ∂ψ (8.99) ~ obtenemos que: Recordando las fórmulas (7.253) para las componentes de ω ∂T ∂ωx ∂T ∂ωy ∂T = + = ωx ωy (I1 − I2 ) ∂ψ ∂ωx ∂ψ ∂ωy ∂ψ (8.100) Por otra parte: ∂T ∂T ∂ωz ∂T = I3 ωz = = ∂ω ∂ω ∂ ψ̇ z ∂ ψ̇ z (8.101) Entonces la ecuación de Lagrange (8.99) toma la forma: I3 ω̇z − ωx ωy (I1 − I2 ) = Kz (8.102) La ecuación (8.102) no depende de las coordenadas generalizadas especı́ficas que se usen para describir el movimiento; en particular no depende de la convención usada para definir los ángulos de Euler, ya que esta sólo influye en las expresiones para las ω. Si hubiéramos usado convenciones para los ángulos de Euler en que componentes de ~ se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones de movimiento serı́an en vez de (8.102), las siguientes: I2 ω̇y − ωx ωz (I3 − I1 ) = Ky I1 ω̇x − ωy ωz (I2 − I3 ) = Kx (8.103) Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales independientes que no dependen de la convención usada para definir los ángulos de Euler. En la convención adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones 270 / Mecánica clásica de lagrange para φ y θ, en tanto que (8.102) es la ecuación de Lagrange para ψ. No vale tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque alrededor de z, Kz , y el torque alrededor de la lı́nea de nodos, Kµ1 , respectivamente. Una deducción más simple de las ecuaciones de Euler es la siguiente: el torque total ~ respecto a los ejes espaciales: es igual a la rata de cambio temporal de L ~ ~ = dL K dt (8.104) esp ~ respecto a los ejes rotantes se introduce mediante la fórmula: La derivada de L ~ dL dt = esp ~ dL dt rot ~ + ~ω × L (8.105) donde hemos tomado los ejes coincidiendo instantáneamente. Las ecuaciones (8.104) y (8.105) nos dan: dLr + ǫr st ωs ωt Lt = Kr ; dt r = 1, 2, 3 (8.106) Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler: Ir ω˙r + ǫr st ωs ωt Is = Kr ; r = 1, 2, 3 (8.107) Principales casos en que las ecuaciones de Euler se pueden reducir a cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores arbitrarios de las constantes de movimiento en los siguientes casos: (a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del cuerpo rı́gido libre. Para el cuerpo rı́gido asimétrico (I1 6= I2 6= I3 ) el problema se reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Euler en 1758. Para el cuerpo rı́gido simétrico (I1 = I2 6= I3 ) la solución está dada en términos de funciones trigonométricas. Para el cuerpo libre esférico (I1 = I2 = I3 ) la solución es trivial. (b) El caso en que dos momentos principales de inercia alrededor de un punto del cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo simétrico con un punto fijo). Tanto el punto fijo como el centro de masa están sobre el eje de simetrı́a. No hay torques de fricción en el punto fijo y el único torque es producido por un campo gravitatorio homogéneo. El problema se reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Lagrange en 1788. (c) En 1887 la señora S.V. Kovalevski halló otro ejemplo soluble. Es el caso en que dos momentos principales de inercia alrededor del punto fijo que no coincide con el centro de masa son iguales entre sı́, y dos veces más grandes que el tercero (I1 = I2 = 2I3 ). Además, el centro de masa está sobre el plano formado por los ejes principales correspondientes a los momentos principales iguales, y el único torque externo es el de la gravedad. La solución está expresada en términos de las funciones hiper-elı́pticas. Dinámica del cuerpo rı́gido / 271 Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular fija ω ~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo rı́gido que se mueve respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0. El lagrangiano del sistema, considerado como un sistema de partı́culas, es: N L= 1 X ˙2 mi~ri 2 i=1 (8.108) Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes, usando fórmulas de la sección 7.8. Llamemos à a la matriz de rotación de los ejes rotantes respecto a los ejes espaciales, más adelante usaremos la notación Ã′ para denotar la matriz de rotación de los ejes del cuerpo rı́gido respecto a los ejes rotantes. La velocidad angular total es Ω̃′ + Ã′ Ω̃ Ω̃′T y por esto no podemos decir a priori que el vector velocidad angular sea ω ~ +~ ω0 . Si ~r ′ es el vector de posición en los ejes rotantes, sabemos que: ~r ′ = Ã~r ; ˙ T ~r˙ ′ + ÃT ~r˙ ′ ~r˙ = à (8.109) de modo que: 2 ˙ à ˙ T ~r ′ ˙ ÃT ~r˙ ′ + ~r˙ ′T Ãà ˙ T ~r ′ + ~r ′T à ~r˙ = ~r˙ ′T ÃÃT ~r˙ ′ + ~r ′T à (8.110) Usando la siguiente definición de Ω̃′0 y las propiedades de Ã: ÃÃT = I˜ ; ˙ ÃT + Ãà ˙ T = 0; à ˙ ÃT ; Ω̃′0 = à ˙ ˙T Ω̃′2 0 = −Ãà (8.111) llegamos a: 2 r′ ~r˙ = ~r˙ ′2 + 2~r ′T Ω̃′0 ~r˙ ′ − ~r ′T Ω̃′2 0 ~ (8.112) Expresando ahora la matriz antisimétrica Ω̃′0 en términos del vector velocidad angular respecto a los ejes rotantes: Ω̃′0~r ′ = −~ ω0′ × ~r ′ ; Ω̃20~r ′ = ω ~ 0′ × (ω0′ × ~r ′ ) (8.113) Entonces podemos escribir a (8.112) como: 2 2 ~r˙ = ~r˙ ′ − 2~ ω0′ · (~r˙ ′ × ~r ′ ) − ω ~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ] La ecuación (8.114) puede llevarse a la forma: 2 2 ~r˙ = ~r˙ ′ + 2~ ω0′ · (~r ′ × ~r˙ ′ ) + ω ~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′ (8.114) (8.115) con lo cual llegamos a la siguiente expresión para L: ~ ~′ + 1ω ~ ′ · I~ · ~ω0 L = T′ + ω ~ 0′ · L 2 0 (8.116) 272 / Mecánica clásica ~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de donde L inercia respecto a dichos ejes. Si ahora el cuerpo rı́gido se mueve respecto a los ejes primados con velocidad angular ~ ω , es claro que: T′ = 1~ ~ ω · ~I · ~ω 2 (8.117) ~ donde ~I es el momento de inercia respecto a los ejes del cuerpo rı́gido, que podemos tomarlos como ejes principales. Ahora se cumple que: ~r ′ = Ã′T ~r ; ~r = Ã′~r ′ ; ˙ ′ Ã′T ; ˜ = Ã Ω ˜ r = −~ω × ~r Ω~ (8.118) ˜ la matriz Ω̃′ respecto a los ejes del cuerpo rı́gido: Llamamos además Ω 0 0 ˜ ′ Ã′T ˜ = Ã′ Ω Ω 0 0 (8.119) Entonces el segundo término de la derecha en (8.112) puede escribirse ası́: T ˙ ′T ~r = 2(ω ˜ ′ à ~ 0 × ~r) · (~ω × ~r) 2~r ′T Ω̃′0~r˙ ′ = 2~r Ã′ Ω 0 El tercer término de (8.115) puede escribirse como: ~ ~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − Ã′T ~r ~rÃ′ = Ã′T ~~1r2 − ~r ~r Ã′ (8.120) (8.121) Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo rı́gido. Finalmente, L toma la forma: L= N X ~ ~ 1~ ~ ~ × ~r i + 1 ω ~+ ~0 ~ 0 · ~I · ω mi ~ω 0 × ~ri · ω ω·I ·ω 2 2 i=1 (8.122) que aún puede transformarse en el segundo miembro para dar: L= ~ ~ 1~ ~ ~ + ~ω · ~I · ω ~0 + ω·I ·ω 2 1 ~ ~~ ~ ω0 · I · ω 0 2 (8.123) Vamos a suponer que ω ~ 0′ está en la dirección del eje x′3 , de modo que las componentes de ~ω 0 serán: ~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0 ω (8.124) Entonces los términos que contienen a ~ω0 en (8.123) son de la forma: ~ ~ ~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1 ω 2 +ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3 1 + (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02 2 (8.125) Dinámica del cuerpo rı́gido / 273 La derivada parcial de (8.125) respecto a ψ es: ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1 +ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2 (8.126) = ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 ) +ω02 sen2 θ senψ cos ψ(I1 − I2 ) La derivada de estos términos respecto a ψ̇ es I3 ω0 cos θ de modo que la ecuación de Lagrange para ψ es: (ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ (8.127) +ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ̇ ω0 senθ)I3 = 0 Esta ecuación podemos expresarla en términos de las componentes de ~ω 0 : (ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω̇z + ω̇0z )I3 = 0 (8.128) Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos concluir que las otras dos ecuaciones de Euler son: (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω̇y + ω̇0y )I2 = 0 (ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω̇x + ω̇0x )I1 = 0 (8.129) El resultado exhibe una dependencia “aditiva” con las velocidades angulares. Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo rı́gido se realiza el siguiente cambio de variables: (φ, θ, ψ; φ̇, θ̇, ψ̇) → (φ, θ, ψ; ω 1 , ω 2 , ω2 ) (8.130) encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las ecuaciones de Euler.5 De acuerdo con las fórmulas (7.253), las fórmulas de transformación son: ω 1 = cos ψ θ̇ + senθ senψ φ̇ ; (8.131) ω 2 = −senψ θ̇ + senθ cos ψ φ̇ ; ω 3 = ψ̇ + cos θ φ̇ y las inversas: φ̇ = ψ̇ = 5 Ver senψ ω 1 + cos ψ ω2 ; senθ θ̇ = cos ψ ω1 − senψ ω2 − cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3 el texto de Corben y Stehle, Classical mechanics, sección 77, capı́tulo 13, 1960. (8.132) 274 / Mecánica clásica Si llamamos q̇1 = φ̇, q̇2 = θ̇, q̇3 = ψ̇, estas fórmulas pueden escribirse en forma de matrices: ~ω = α̃~q˙ ; ~ q~˙ = β̃ ω donde α̃ y β̃ son: senθ senψ α̃ = senθ cos ψ cos θ β̃ = (8.133) cos ψ 0 −senψ 0 0 1 senψ senθ cos ψ senθ cos ψ −senψ −senψ cot θ − cos ψ cot θ 0 (8.134) 0 1 Si llamamos L̃(q, ω) a L[q, q̇(ω)] obtenemos que: ∂L ∂ L̃ ∂ L̃ ∂αsu = + q̇u ∂qr ∂qr ∂ωs ∂qr (8.135) d ∂ L̃ d ∂L = αsr dt ∂ q̇r dt ∂ωs (8.136) y que: Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente expresión para las ecuaciones de Lagrange en L̃: ∂ L̃ ∂αsu ∂ L̃ βrt + βrt βuυ ω υ = ∂qr ∂ωs ∂qr βrt d ∂ L̃ ∂ L̃ ∂αsr αsr + βuυ ωυ βrt dt ∂ω s ∂ωs ∂qu (8.137) Usando la propiedad α̃β̃ = I˜ obtenemos finalmente: ∂ L̃ d ∂ L̃ ∂ L̃ βrt − = γtυs ωυ ; ∂qr dt ∂ωt ∂ω s donde: γtυs = ∂αsr ∂αsu − ∂qu ∂qr t = 1, 2, 3 βrt βuυ (8.138) (8.139) Para nuestro caso, el lagrangiano está dado por la ecuación (8.97): L̃(q, ω) = 1 ~ ~~ ~ ω · I · ω − V (q) 2 (8.140) Dinámica del cuerpo rı́gido / 275 y ası́: ∂ L̃ ∂V =− = Kr ; ∂qr ∂qr ∂ L̃ = ωr Ir ∂ωr (8.141) Por tanto obtenemos de (8.138): Kr βrt − ω̇ t It = 3 X γtυs ωυ ω s Is ; t = 1, 2, 3 (8.142) υ,s=1 Notemos que γtυs puede escribirse como Astυ − Atsυ , donde: Astυ = ∂αsm βmt βnυ ∂qn (8.143) que también puede escribirse como: ∂ α̃ β̃ βnυ Astυ = ∂qn st (8.144) De la expresión explı́cita para α̃ obtenemos que: cot θ sen2 ψ cot θ senψ cos ψ 0 ∂ α̃ ∂ α̃ 2 cot θ cos ψ 0 β̃ = 0̃ ; β̃ = cot θ senψ cos ψ ∂q1 ∂q2 −senψ − cos ψ 0 ∂ α̃ β̃ = ∂q3 0 + −1 0 1 0 1 −1 0 0 0 Se sigue entonces que: cot θ sen2 ψ Astυ = cot θ senψ cos ψ −senψ 0 0 (8.145) 0 0 cot θ senψ cos ψ 2 cot θ cos ψ − cos ψ 0 0 (cos ψ, senψ, 0)υ 0 st (8.146) 0 0 (−senψ cot θ, − cos ψ cot θ, 1)t 0 0 sυ Es simple concluir a partir de (8.146) que: γtυs = ǫtυs (8.147) 276 / Mecánica clásica Por tanto las ecuaciones (8.142) son: ω̇t It + 3 X ǫtυs ωυ ω s Is = Kr βrt ; t = 1, 2, 3 (8.148) υ,s=1 Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos de (8.148) son los torques alrededor de los ejes x, y, z. Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de las ecuaciones de Lagrange (8.138). Para este problema tenemos que: ∂ L̃ ~ ∂ω0 ω + ~ω 0 ) · I~ · = (~ ; ∂~q ∂~q ∂ L̃ ~ + ~ω 0 ) · ~I~ = (ω ~ ∂ω (8.149) En términos de componentes, las ecuaciones (8.138) son: 3 X r,m=1 βrt ∂ω0m (ω 0m + ωm )Im − ω̇ 0t + ω̇t It = ∂qr 3 X ǫtυs (ω s + ω0s )Is ω υ (8.150) υ,s=1 O en otra forma: (ω̇ 0t + ω̇t )It = 3 X ∂ω0m βrt − ǫt,m,r ω r (ω 0m + ω m )Im ∂qr r,m=1 Para cualquier función F se cumple que: senψ/senθ cos ψ −senψ cot θ ∂F β̃ = cos ψ/senθ −senψ cos ψ cot θ ∂~q 0 0 1 ∂F/∂φ ∂F/∂θ ∂F/∂ψ ~ 0 , hallamos que: Usando la expresión (8.124) para ω 0 −ω03 ω 02 ∂ ~ω0 ω 0 −ω β̃ = 03 01 ∂~q 0 −ω 02 ω 01 (8.151) (8.152) (8.153) O en forma más explı́cita: ∂ ~ω0m βrt = −ǫmrt ω0r ∂qr (8.154) Dinámica del cuerpo rı́gido / 277 Con lo cual concluimos que (8.151) toma la forma: (ω̇ 0t + ω̇ t )It = 3 X r,m=1 ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im (8.155) que coinciden con las ecuaciones (8.128) y (8.129) 8.4. El movimiento de un cuerpo rı́gido libre En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo que la gravedad no produce torques. El cuerpo rı́gido esférico. Se define por la condición I1 = I2 = I3 = I. ~ yω Es el único caso en el cual los vectores L ~ son paralelos: ~ = I~ L ω (8.156) ~ como ~ω serán constantes en magnitud y dirección. Cada Si no hay torques, tanto L punto del cuerpo rı́gido se moverá sobre trayectoria circular. No hay precesión de ~ω . La representación de Poinsot. Es una construcción geométrica que permite analizar el movimiento de un cuerpo rı́gido libre, el cual puede ser asimétrico. Fue elaborada por Poinsot (Parı́s, 1834) y se basa en el elipsoide de inercia, descrito en la sección 8.2. La ecuación del elipsoide de inercia está dada en (8.73). La normal al elipsoide en un punto cualquiera tiene la dirección del vector gradiente de F , siendo F la superficie (8.75): ∂F = (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 ) ∂~r (8.157) donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z) sobre el eje de rotación, entonces: ω ~ = ω(n1 , n2 , n3 ) (8.158) De modo que (8.149) toma la forma: ∂F 2r 2r ~ = (ω1 I1 , ω2 I2 , ω3 I3 ) = L ∂~r ω ω (8.159) Hay dos puntos donde el eje de rotación corta la superficie del elipsoide de inercia. De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal ~ Cuando no hay torques se cumple que L ~ y por a la superficie está en la dirección de L. ~ son constantes, independientemente de la forma que tenga el movimiento lo tanto ∇F del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo rı́gido. La energı́a cinética se puede escribir en la forma: T = 1 ~ = ω ~r · L ~ ω·L ~ 2 2r (8.160) 278 / Mecánica clásica Cuerpo rígido Elipsoide de inercia b a 0 c r P L ∆ ω F Figura 8.4 Elipsoide de inercia que se puede llevar a la forma: ~ ·L ~ =0 (~r − d) (8.161) donde d~ es un vector definido por la relación: ~ = 2r T d~ · L ω (8.162) ~ entonces adquiere la forma: si escogemos a d~ paralelo a L, ~ L 2r T 2 d~ = ω L (8.163) ~ y es la normal al plano La expresión (8.161) es la ecuación de un plano, donde L y ~r es un punto del mismo. Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues usando las relaciones: Ir2 = constante y T = 1 2 Iω = constante 2 ~ podemos escribir el vector d~ como una expresión que solo depende de T y L: √ 2Ir2 T ~ L d~ = L2 (8.164) (8.165) Dinámica del cuerpo rı́gido / 279 ~ son constantes, el plano es constante y se llama plano invariable. d~ Como d~ y L es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es ~ la lı́nea que contiene a d~ se llama lı́nea invariable. igual a la proyección de ~r sobre L; Línea invariable Polodia Plano invariable 0 r d P Herpolodia r –d ω L Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto donde el eje de rotación corta al elipsoide. El radio vector de O a P, ~r, está sobre el eje instantáneo de rotación; no hay movimiento relativo entre un punto del elipsoide y un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano invariable; en efecto, P está sobre el eje de rotación y por ello es el único punto del elipsoide de inercia que está en reposo instantáneamente (véase figura 8.5). Como ω ~ es ~ es proporcional a d: ~ proporcional a ~r, la proyección de ~ω sobre L ~ ω ~ ·L ~ = 2T L ~ = L 2 L L2 r 2T ~ d Ir2 (8.166) ~ es constante; es decir, ω ~ o sea que la proyección de ~ ω sobre L ~ precesa alrededor de L, pero sin mantenerse constante el ángulo entre estos dos vectores, cuyo coseno está dado por: ~ ω ~ ·L Ir2 ω = ωL L r2 (8.167) ~ también puede Como ω y r pueden cambiar, se sigue que el ángulo entre ~ω y L cambiar, lo cual ocurre cuando el cuerpo es asimétrico. La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano invariable se llama herpolodia (de herpeton, reptil). ~ no es constante, ver ecuación (8.105). De Respecto a los ejes del cuerpo rı́gido L modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente 280 / Mecánica clásica el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo rı́gido la ~ es una constante: magnitud de L d 2 ~ =0 ~ ·L ~˙ = −2L ~· ω ~ ×L (8.168) L = 2L dt Esto implica que respecto a los ejes del sólido rı́gido ~r está además sobre el elipsoide: I12 x2 + I22 y 2 + I32 z 2 = Ir2 L2 2T (8.169) La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de inercia que satisfacen simultáneamente las ecuaciones (8.73) y (8.169); es decir, es el lugar geométrico de la intersección de dos elipsoides cuyos semiejes están dados respectivamente por: a2 : Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2 , ; b2 : , ; c2 : , I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3 (8.170) La existencia de una intersección está asegurada por las desigualdades evidentes: ~ I = ~n · I~ · ~n ≥ I1 ; I ≤ I3 ⇒ 2T I1 < L2 < 2T I3 (8.171) siendo I1 el más pequeño de los tres momentos principales de inercia e I3 el mayor. El cuerpo rı́gido simétrico libre en la representación de Poinsot. Cuando I1 = I2 6= I3 , dos de los semiejes del elipsoide de inercia son iguales, siendo éste un elipsoide de revolución. Las ecuaciones de la polodia son (8.169) y (8.73): I1 (x2 + y 2 ) + I3 z 2 = Ir2 ; I12 (x2 + y 2 ) + I32 z 2 = De estas ecuaciones obtenemos las siguientes: L2 (I1 I3 − I32 )z 2 = Ir2 I1 − 2T 2 2 I1 (I1 − I3 )(x + y ) = Ir 2 L2 − I3 2T Ir2 L2 2T (8.172) (8.173) Vemos que la polodia está situada a una distancia constante del origen, sobre el eje de simetrı́a, y es una circunferencia. El elipsoide rueda sin deslizar sobre el plano siendo la polodia una circunferencia, o sea que ~r es paralelo ~ω (el vector de posición del centro de la polodia). El vector forma el mismo ángulo con ~ω, es decir que está a lo largo del eje de simetrı́a, siempre tienen el mismo ángulo; es decir, el eje de simetrı́a y ~ω forman un ángulo que permanece constante, lo cual significa que ω ~ efectúa un movimiento de precesión alrededor del eje de simetrı́a. La proyección de ~ω sobre el eje z es constante y las proyecciones sobre los ejes x y y ejecutan movimientos armónicos simples con cierta frecuencia Ω. Respecto a los ~ (véase figura 8.6). El vector ~ω ejes espaciales, como se dijo, ~ω precesa alrededor de L precesa en los dos sistemas de ejes generando dos conos. En el sistema espacial ~ω precesa Dinámica del cuerpo rı́gido / 281 Cono del cuerpo rígido 0 Cono fijo ω z L Figura 8.6 El cono del cuerpo rı́gido rueda sin deslizar sobre el cono fijo ~ y en el sistema del cuerpo rı́gido precesa alrededor del alrededor del vector constante L eje de simetrı́a. En conclusión, el movimiento del cuerpo rı́gido puede obtenerse a partir del movimiento del cono del cuerpo rı́gido que rueda sin deslizar sobre el cono fijo. Es claro que para un cuerpo no simétrico la polodia no será una circunferencia, ~ω ~ En el cuerpo rı́gido no será constante, como tampoco el ángulo entre los vectores ~ω y L. asimétrico se presentarán estos tres movimientos: rotación alrededor del eje instantáneo ~ de rotación; precesión del eje instantáneo de rotación alrededor del vector constante L ~ y nutación del eje instantáneo de rotación al cambiar el ángulo entre los vectores ~ω y L. Es claro que la frecuencia de nutación es el doble de la frecuencia de rotación. Solución de las ecuaciones de Euler para un cuerpo rı́gido simétrico libre. Las ecuaciones de Euler para este problema toman la forma: I1 ω̇x = ωy ωz (I1 − I3 ) (8.174) I1 ω̇y = −ωx ωz (I1 − I3 ) (8.175) I3 ω̇z = 0 (8.176) De (8.174) y (8.175) obtenemos las siguientes dos ecuaciones: I12 ω̈x + ωx ωz (I1 − I3 )2 = 0 ; I1 ω̇y = −ωz ωx (I1 − I3 ) (8.177) O sea que la solución a las ecuaciones de Euler puede escribirse como: ωx = A sen(|Ω|t + δ) ; ωy = Ω A cos(|Ω|t + δ) |Ω| (8.178) ωz = constante, donde Ω está definida por: Ω= I1 − I3 ωz I1 (8.179) 282 / Mecánica clásica El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante |Ω|. Como no hay nutación se dice que la precesión es regular. El resultado está de acuerdo con las conclusiones obtenidas mediante la construcción de Poinsot. Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo rı́gido simétrico libre. La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una distribución uniforme de materia. Entonces la masa total puede asumirse que está en el centro de masa, de modo que con esta aproximación los demás cuerpos celestes no realizarán torques. Los momentos principales de inercia respecto al centro para un elipsoide son: 1 1 1 I2 = M (a2 + c2 ) ; I3 = M (a2 + b2 ) (8.180) I1 = M (b2 + c2 ) ; 5 5 5 Con este modelo tenemos que para la Tierra se cumple: I3 ≈ I1 = I2 ; c≈a=b (8.181) La relación entre los diámetros polar y ecuatorial nos da: c = 0, 9672 (8.182) a Tomando el eje z a lo largo del eje polar y sabiendo que la rotación completa alrededor de un eje es un dı́a, obtenemos: 2π = 7, 272 × 10−5 rad/s (8.183) dı́a La magnitud de la precesión, A, dependerá de la medida en que difieran ω y ωz , que es pequeña. La frecuencia de precesión está dada por: I1 − I3 c |Ω| = (8.184) ωz = 0, 00328ωz ωz ≈ 1 − I1 a ωz ≈ El perı́odo de precesión será pues de unos 305 dı́as. Se ha observado que tal precesión se presenta siendo su amplitud pequeña. El “radio” de la polodia es aproximadamente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo ası́ como una nutación. El perı́odo observado es de unos 427 dı́as; es una precesión no atribuible a torques; las discrepancias se deben a la idealización del modelo. Esta precesión es diferente a la precesión de los equinoccios, debida a los torques ejercidos por el Sol y la Luna, pues en realidad el centro de masa de la Tierra no coincide con el centro geométrico, el perı́odo de esta precesión es de 25.800 años. Esta precesión tampoco es la responsable de las estaciones. Éstas se deben a que el plano de la elı́ptica hace un ángulo de 23◦ con el plano ecuatorial de la Tierra. Las funciones elı́pticas de Jacobi. Haremos un resumen de las principales propiedades de estas funciones que, sabemos, aparecen en la solución general para un cuerpo rı́gido libre asimétrico.6 6 Véase el texto de Abramowitz y Stegun, Handbook of mathematical functions, capı́tulos 16 a 18, 1965; y las referencias dadas en él, especialmente el curso de análisis de Whittaker y Watson. Dinámica del cuerpo rı́gido / 283 Si z es una variable compleja, en general una función elı́ptica Fpq (z) es una función que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los puntos de una red rectangular infinita en el plano complejo. En la construcción de esta red se parte de una celdilla elemental constituida por un rectángulo cuyos vértices están en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los números reales K y K ′ están definidos de la siguiente manera en función de un parámetro real m, 0 ≤ m ≤ 1: K= Z π/2 0 dθ √ ; 1 − msen2 θ K′ = Z π/2 0 dθ p 1 − (1 − m)sen2 θ (8.185) K se llama el cuartiperı́odo real e iK ′ el cuartiperı́odo complejo de la función elı́ptica Fpq (z). Estas funciones se llaman funciones elı́pticas de Jacobi y usualmente se denotan en la forma pqz. Hay doce de estas funciones que son sc z, sd z, sn z, cs z, cd z, cn z, ds z, dn z, dc z, ns z, nc z, nd z. La definición de las funciones elı́pticas de Jacobi es: (i) pq z tiene solamente singularidades aisladas; tiene un cero en p y un polo en q; (ii) Las funciones pq z son periódicas. Entre p y q hay un semiperı́odo de la función pq z, siendo 2K, 2iK ′ , 2K + 2iK ′ los perı́odos. Ası́ por ejemplo, las funciones copolares con polo en iK ′ , sn, cn y dn tienen respectivamente los perı́odos 2iK ′ , 2K + 2iK ′ y 2K, o equivalentemente los perı́odos 4K, 4K y 2K. Las funciones elı́pticas de Jacobi pueden definirse también con respecto a ciertas integrales. Si: z= Z φ 0 dθ √ 1 − m sen2 θ (8.186) el ángulo φ es llamado la amplitud y m el parámetro. φ = am z (8.187) Entonces se definen las funciones ası́: sn z = sen φ ; cn z = cos φ ; dn z = p 1 − m sen2 φ (8.188) Todas las otras nueve funciones pueden expresarse en función del trio copolar sn, cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales elı́pticas, que son de la forma: Z R(x, y) dx (8.189) donde R(x, y) es una función racional de x, y, donde y 2 es igual a un polimonio en x de grado 3 o de grado 4. Cuando R(x, y) sólo contiene potencias pares de y, o cuando el polimonio y 2 tiene un factor repetido la integral (8.189) es elemental. En todos los demás casos aparecerán las funciones elı́pticas. Cualquier integral elı́ptica puede expresarse 284 / Mecánica clásica en términos de las integrales elı́pticas de primera, segunda y tercera clase, definidas respectivamente por: Z φp Z φ dθ √ ; 1 − m sen2 θ dθ ; 1 − m sen2 θ 0 0 (8.190) Z φ dθ p (1 − n sen2 θ)(1 − m sen2 θ) 0 Cuando φ = π/2, las integrales (8.190) se llaman integrales elı́pticas completas de primera, segunda y tercera clase. Cuando el parámetro toma el valor cero las funciones elı́pticas coinciden con funciones circulares. Cuando el parámetro es tan pequeño que podemos despreciar términos de orden superior a m2 tenemos las aproximaciones: sn z = 1 sen z − m(z − sen z cos z) cos z + ... 4 cn z = 1 cos z + m(z − sen z cos z) sen z + ... 4 dn z = 1 1 − m sen2 z + ... 2 (8.191) 1 z − m(z − sen z cos z) + ... 4 Cuando m tiende a la unidad, las funciones elı́pticas coinciden con funciones hiperbólicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir de la ecuación diferencial que sirve para definir la función sn podemos obtener buena información del comportamiento de las funciones elı́pticas, para z real. La ecuación (8.186) equivale a la ecuación diferencial: 2 dφ = 1 − msen2 φ (8.192) dx an z = Mediante la sustitución y = sen φ, (8.192) se transforma en: 2 dy = (1 − y 2 )(1 − my 2 ) dx (8.193) 2 Claramente y = sen x es la solución cuando m = 0 (véase figura 8.7). (dy/dx) √ es igual a una función continua de y que se anula en y = ±1 y √ en y = ±1/ m; en m la derivada vale y = ±1 la derivada de esa función vale ±2(m − 1) y en y = ±1/ √ ∓2(m − 1)/ m. De (8.193) podemos deducir las siguientes propiedades de la solución, y = s nx: (i) Si y(x) es una solución, y(x + c) es una solución ya que ni y ni dy/dx cambian en una translación en el eje x. (ii) y(x) está siempre contenida √ entre los valores y = −1 y y = +1 puesto que para valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como también lo es para valores de y mayores que 1/ m. Dinámica del cuerpo rı́gido / 285 (iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula, se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la pendiente se anule dentro del intervalo. (iv) Sólo hay una curva y(x) que toca una de las lı́neas y = −1 o y = +1 en un punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuestión, se sigue integrando (8.193): Z y dy p x − x0 = − 2 (1 − y )(1 − my 2 ) −1 (8.194) Z y dy p x − x0 = (1 − y 2 )(1 − my 2 ) −1 según que dy/dx sea negativa o positiva respectivamente. y y=1 dn x sn x x0 x 2K cn x y = –1 Figura 8.7 Funciones circulares cuando se desprecian términos de orden superior a m2 Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la única curva y(x) que satisface la condición de tangencia. (v) La curva y(x) es inalterada mediante una reflexión en el origen. Basta con conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para construir la curva total. (vi) La distancia en x entre dos sucesivos contactos de y(x) con las lı́neas y = −1 y y = +1 está dada por: Z +1 dy p (8.195) 2K = 2 (1 − y )(1 − my 2 ) −1 286 / Mecánica clásica (vii) De la simetrı́a de la curva respecto a la normal en el punto de contacto con una de las lı́neas y = −1 o y = +1, se sigue que y(x) es periódica con perı́odo 4K. Podemos entonces definir a sn x por las siguientes propiedades: 2 dsn x = (1 − sn2 x)(1 − msn2 x) ; sn0 = 0 dx (8.196) dsn x = 1 ; sn(x + 4K) = sn x dx x=0 Podemos definir las funciones cn x y dn x por las ecuaciones: cn2 x = 1 − sn2 x ; dn2 x = 1 − msn2 x (8.197) con la condición de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1, dnx siempre puede tomarse positiva. El perı́odo de cn x es 4K y el de dn x es 2K. Se sigue de (8.196) que: dsn x = cn x dn x dx (8.198) de (8.196) y (8.197) se sigue entonces que: dcn x = −sn x dn x ; dx ddn x = −m sn x cn x dx (8.199) La figura 8.7 muestra las funciones elı́pticas de Jacobi sn, cn y dn, para m = 1/2. Con las funciones elı́pticas es posible hallar fórmulas análogas a las de la trigonometrı́a ordinaria. Por ejemplo, la fórmula de adición para la función sn es: sn(u ± υ) = sn u cn υ dn υ ± sn υ cn u dn u 1 − m sn2 u sn2 υ (8.200) Algunos valores notables de sn son: sn 0 = 0 ; sn K = 1 ; 1 sn(K + iK ′ ) = √ ; m sn iK ′ = ∞ sn K 1 =p √ 2 1 + m1 (8.201) Con estas fórmulas podemos hallar la siguiente relación últil: 1 ±√ = ±sn(u ± iK ′ ) m sn u (8.202) dada por la fórmula 16.8.1 del libro de Abramowitz, Op. cit. Relacionadas con las funciones elı́pticas están las funciones θ, denotadas por θ1 (z, q), θ2 (z, q), θ3 (z, q), θ4 (z, q), cuyas definiciones están en la sección 16.27 del libro de Abramowitz. Otros autores usan la notación siguiente para las mismas funciones: θ11 , θ10 , θ00 , θ01 , como en el Tratado de mecánica analı́tica de Wittaker, o en el texto de mecánica de Dinámica del cuerpo rı́gido / 287 Landau (ver bibliografı́a). Nos interesará la función θ4 que tiene la siguiente expresión como un producto infinito (fórmula 16.37.4 del del libro de Abramowitz): 1/2 Y ∞ m θ4 (v) = θ4 (0) (1 − 2q 2n−1 cos 2v + q 4n−2 ) (8.203) 16qm21 n=1 donde m y m1 = 1 − m tienen la misma significación que en las funciones elı́pticas, y ϑ y q están definidas por: ′ πu ; q = e−πK /K (8.204) v= 2K La siguiente expresión para θ4 (v) como un producto infinito es más útil: θ4 (v) = constante ∞ Y (1 − q 2n−1 e2iv )(1 − q 2n−1 e−2iv ) (8.205) n=1 Tomando logaritmos en esta expresión y derivando respecto a v llegamos a la siguiente fórmula para la derivada logarı́tmica de θ4 : ∞ θ4′ (v) X −2iq 2n−1 e2iv 2iq 2n−1 e−2iv + = (8.206) θ4 (v) n=1 1 − q 2n−1 e2iv 1 − q 2n−1 e−2iv Esta expresión tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es tal que: e±2iv = ei(2n−1)πiK ′ /K (8.207) es decir, cuando u = 2Kv/π, vale: urm = (2r + 1)iK ′ + 2mK ; r, n = 0, ±1, ±2. . . ± ∞ (8.208) Con esta expresión para los polos de θ4′ /θ4 podemos formar la serie de Laurent para esta función: +∞ +∞ X X brm θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm (8.209) donde brm son los residuos de la función que obtenemos de: brm = lı́m (v − vrm ) v→vrm θ4′ (v) θ4 (v) (8.210) Evaluando esta expresión llegamos finalmente a: +∞ +∞ X X 1 θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm (8.211) Solución de las ecuaciones de Euler para un cuerpo rı́gido asimétrico libre.7 Supondremos que I3 > I2 > I1 . De acuerdo con la representación de Poinsot, 7 Este problema fue resuelto por Jacobi en 1849. 288 / Mecánica clásica las ecuaciones de la polodia están dadas por la intersección del elipsoide de inercia con el elipsoide del momento angular: I1 ω21 + I2 ω 22 + I3 ω 23 = 2E (8.212) I12 ω21 + I22 ω 22 + I32 ω23 = L2 De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en función de ω 22 : ω21 = 1 [(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ] I1 (I3 − I1 ) (8.213) ω23 = 1 [(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ] I3 (I3 − I1 ) (8.214) La ecuación de Euler para ω2 , (8.214), toma entonces la forma: ω̇2 = 1 √ (2EI3 − L2 ) − I2 (I3 − I2 )ω 22 · I2 I1 I3 2 (L − 2EI1 ) − I2 (I2 − I1 )ω 22 1/2 (8.215) Al separar variables e integrar obtenemos una expresión que se puede reducir a una integral elı́ptica incompleta de primera clase en la forma normal, llamando: b2 = 2EI3 − L2 ; I2 (I3 − I2 ) a2 = L2 − 2EI1 I2 (I2 − I1 ) (8.216) Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2 y b son positivas. Notamos que al expresar a L y a E en función del momento de inercia alrededor del eje de rotación I, esta condición nos dice que I3 > I > I2 > I1 , con lo cual obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo que ω 2 sea igual a cero, la integral de (8.215) es de la forma: 2 I1 I2 I3 t= (I3 − I2 )(L2 − 2EI1 ) 1/2 Z 0 ω2 a dω 2 p 2 (a − ω 22 )(b2 − ω 22 ) (8.217) Mediante la fórmula 17.4.45 del Handbook of mathematical functions de Abramowitz y Stegun, la integral en (8.217) puede llevarse a la forma de una integral elı́ptica de primera clase con parámetro m dado por: m= I2 − I1 2EI3 − L2 b2 = 2 a I3 − I2 L2 − 2EI1 (8.218) Esta integral puede expresarse en términos de la función elı́ptica sn de acuerdo con (8.188). En efecto, haciendo en (8.217) la sustitución señalada en la fórmula del Handbook: ω2 = b sn v (8.219) Dinámica del cuerpo rı́gido / 289 y teniendo en cuenta que, según (8.198): dω 2 = b cn v dn v dv (8.220) obtenemos en el lugar de la integral de (8.217): Z v dn v dv ω2 √ = v = sn−1 2 b 1 − msn v 0 (8.221) Si llamamos: 1/2 (I3 − I2 )(L2 − 2EI1 ) c= I1 I2 I3 (8.222) entonces (8.217) se reduce, llamando b2 = b, a: ω 2 = b2 sn ct (8.223) Reemplazando a ω2 (t) en (8.213) y (8.214) obtenemos para ω 1 y ω 3 : ω1 = b1 sn ct ω3 = b3 sn ct (8.224) donde b1 y b3 están dadas por: b21 = 2EI3 − L2 ; I1 (I3 − I1 ) b23 = L2 − 2EI1 I3 (I3 − I1 ) (8.225) Al reemplazar la solución (8.224) en las ecuaciones de Euler, éstas resultan compatibles si el producto b1 b2 b3 es negativo. ω1 y ω2 son periódicas con perı́odo 4K y ω3 es periódica con perı́odo 2K, donde K es la integral elı́ptica completa de primera clase. El perı́odo que nos interesa es con respecto al tiempo que está dado por: T = 4K c (8.226) ~ De acuerdo con la construcción de Poinsot, al cabo de un tiempo T el vector ω completa un ciclo de precesión alrededor del eje z, es decir, ω 1 y ω 2 coinciden consigo mismas, en tanto que al cabo de un tiempo T /2, ω 3 coincide consigo misma. El problema no termina hallando a ω r (t), pues interesa describir el movimiento absoluto del cuerpo rı́gido en el espacio, o sea hallar los ángulos de Euler en función del tiempo. Reemplazando las expresiones (8.224) y (8.225) en (8.131), obtenemos tres ecuaciones diferenciales para θ, φ y ψ, cuya solución es complicada cuando los ejes espaciales se toman arbitrariamente, pero se simplifica un poco tomando el eje z en la dirección de ~ Como el ángulo polar y el ángula lı́nea invariable definida por el vector constante L. ~ lo acimutal del vector L, que coincide con el eje z, son respectivamente θ y π/2 − ψ, podemos sin más escribir: L1 = L senθ senψ ; L2 = L senθ cos ψ ; L3 = L cos ψ (8.227) 290 / Mecánica clásica Como Lr = Ir ω r obtenemos que: 1/2 I3 (L2 − 2EI1 ) I3 ω 3 = dn ct cos θ = L L2 (I3 − I1 ) tan ψ = I1 ω 1 I1 (I3 − I2 ) = I2 ω 2 I2 (I3 − I1 ) 1/2 (8.228) cn ct sn ct θ y ψ al igual que las componentes de ~ω son funciones periódicas, con perı́odo igual al de la función dn, o sea T /2. En efecto, dn z y cn z/sn z = cs z son coperiódicas con perı́odo 2K. El ángulo φ se puede obtener de (8.132) y (8.228). El resultado para φ̇ en función de las componentes de ~ω solamente es: φ̇ = I1 ω 21 + I2 ω 22 L I12 ω 21 + I22 ω22 (8.229) φ̇ es periódica con perı́odo T /2. En general, φ no se incrementará por un múltiplo de 2π en un perı́odo y por ello el movimiento del cuerpo rı́gido como un todo no es periódico, o sea que el cuerpo rı́gido en general no vuelve nunca a su posición inicial. En efecto, reemplazando en (8.229) las expresiones (8.224) y (8.225) obtenemos: φ̇ = L (I3 − I2 ) + (I2 − I1 )sn2 ct I1 (I3 − I2 ) + I3 (I2 − I1 )sn2 ct (8.230) Ahora, podemos definir una cantidad real β por medio de estas expresiones que son mutuamente consistentes: 1/2 1/2 I(I3 − I1 ) I3 (I − I1 ) ; cn iβ = sn iβ = i I1 (I3 − I) I1 (I3 − I) (8.231) 1/2 I2 (I3 − I1 ) dn iβ = I1 (I3 − I2 ) I que no es el momento de inercia respecto al eje de rotación, está dado por: L2 2E de modo que la expresión para m toma la forma: I= m= I3 − I I2 − I1 I − I1 I3 − I2 (8.232) (8.233) φ̇ toma la siguiente forma al reemplazar a (8.231) en (8.230): φ̇ = L I2 + (I1 dn2 iβ − I2 )sn2 ct I1 I2 1 − m sn2 iβ sn2 ct (8.234) Esta expresión es de la forma (Ax + Bsn2 ct)/(Cx + Dsn2 ct) o sea es el cociente de dos funciones lineales de x. Al efectuar el cociente llegamos a: 1 dn2 iβ sn2 ct 1 L +L − (8.235) φ̇ = I1 I2 I1 1 − m sn2 iβ sn2 ct Dinámica del cuerpo rı́gido / 291 Examinemos la estructura analı́tica del segundo término en (8.235). Tiene singularidades en los valores de ct tales que se anula el denominador: ±1 sn ct = √ = sn (±iβ + iK ′ ) m sn iβ (8.236) donde hemos usado la fórmula (8.202). Usando la propiedad de la función sn de ser doblemente periódica, con perı́odos 2iK ′ , 4K y 4K + 4iK ′, podemos concluir de (8.236) que snu = (−1)r sn (u + 2mK + 2riK ′ ) y por lo tanto: (−1)r ct = ±iβ + (2r + 1)iK ′ + 2mK ; r, m = 0, ±1, ±2, ... (8.237) Estos ceros del denominador son simples, o sea que la función puede expandirse en series de Laurent de la forma (8.209): " X +∞ +∞ X 1 1 arm L − I2 I1 r=−∞ m=−∞ (−1)r ct + iβ − urm (8.238) # brm − + constante (−1)r ct − iβ − urm Para evaluar los residuos, expandimos el denominador en (8.235) en serie de Taylor alrededor de los ceros, (8.237): 1 − m sn2 iβ sn2 ct = 1 − m sn2 iβ sn2 (±iβ + iK ′ ) + [(−1)r ct − (±iβ + urm )] 2m sn2 iβ sn(±iβ + iK ′ )· (8.239) cn(±iβ + iK ′ ) dn(±iβ + iK ′ ) donde hemos usado la periodicidad de las funciones elı́pticas. Usando (8.236) y luego las expresiones (8.231), llegamos a que arm y brm valen respectivamente: ± 1/2 dn iβ 1 I1 I2 (I3 − I2 )(I − I1 ) =± 2m sn iβ cn iβ 2i II3 (I2 − I1 ) (8.240) Los residuos del segundo término de (8.235) son entonces: ±i c 2 (8.241) Por tanto el segundo término del lado derecho de (8.235) es: " +∞ +∞ 1 c X X i r 2 r=−∞ m=−∞ (−1) ct + iβ − urm − # 1 + constante (−1)r ct − iβ − urm (8.242) 292 / Mecánica clásica Es fácil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los términos con r impares tengan la misma forma de los términos con r pares. Entonces (8.242) es igual a una expresión que no contiene el (−1)r . Usando la expresión (8.226) para c y luego multiplicando numeradores y denominadores por π/(2K), obtenemos: " +∞ +∞ π X X 1 i T r=−∞ m=−∞ π (ct + iβ) − vrm 2K (8.243) # 1 + constante − π (ct − iβ) − vrm 2K Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expresión para φ̇ en términos de las funciones θ: " L iπ θ4′ [(ct + iβ)π/(2K)] φ̇ = + I1 T θ4 [(ct + iβ)π/(2K)] # θ4′ (iβπ/2K) θ4′ [(ct − iβ)π/(2K)] (8.244) −2 − θ4 [(ct − iβ)π/(2K)] θ4 (iβπ/(2K) La integración ahora es simple: 2π t + iα L i 2πi θ4′ (iα) T φ(t) = t + ln − 2π I1 T θ4 (iα) 2 θ4 t − iα T θ4 (8.245) donde definimos a α = πβ/(2K). De acuerdo con la expresión (8.203), la función θ4 (v) tiene perı́odo π y además es función par de v, de modo que al completarse un perı́odo de θ y ψ, o sea cuando t = T /2, el término logarı́tmico de φ se anula. Entonces: T L T θ′ (iα) φ = − πi 4 (8.246) 2 I1 2 θ4 (iα) Como θ4 tiene la expansión: θ4 (v) = 1 − 2q cos v + 2q 4 cos4 v − ... Entonces: T LT q senh2α − 2 q 4 senh4α + ... φ = + 4π 2 2I1 1 − 2q cosh 2α + 2q 4 cosh 4α − ... (8.247) (8.248) sólo en circunstancias muy especiales esta expresión será un múltiplo entero de 2π; por esta razón el cuerpo rı́gido no vuelve nunca a su posición inicial. Ejemplo 8.4.2 Estudiar la estabilidad de las rotaciones de un cuerpo rı́gido asimétrico libre alrededor de cada uno de los ejes principales. Dinámica del cuerpo rı́gido / 293 Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que además I3 > I2 > I1 . Por efecto de alguna pequeña perturbación el cuerpo adquiere rotaciones alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades pequeñas en comparación con ω1 . La ecuación de Euler para ω1 contendrá el producto ω2 ω3 , o sea que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver fácilmente las otras dos ecuaciones de Euler: I3 − I1 I1 − I2 ω˙2 = ω 1 ω 3 ; ω˙3 = ω1 ω 2 (8.249) I2 I3 De aquı́ obtenemos la siguiente ecuación diferencial para ω2 : (I1 − I3 )(I1 − I2 ) 2 2 ω¨2 + ω1 ω2 = 0 I2 I3 (8.250) Esta ecuación tiene como solución: ω 2 = A sen(Ω1 t + δ) (8.251) donde A es una cantidad pequeña y Ω1 satisface: 1/2 (I3 − I1 )(I2 − I1 ) ω1 Ω1 = I2 I3 (8.252) Como Ω1 es real, entonces ω 2 y ω 3 tendrán movimientos oscilatorios con frecuencia Ω1 . La rotación alrededor de x1 es estable. De manera similar, cuando el cuerpo rota inicialmente alrededor de x3 , el movimiento es estable con frecuencia: 1/2 (I3 − I2 )(I3 − I1 ) ω3 (8.253) Ω3 = I1 I2 Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad, siendo inestable la rotación alrededor del eje correspondiente al momento de inercia intermedio. Para un cuerpo rı́gido simétrico, digamos para el cual I1 = I2 , es fácil mostrar que solamente es estable la rotación alrededor del eje x3 . Ejemplo 8.4.3 Calcular los diferentes perı́odos asociados con el movimiento libre de un elipsoide homogéneo asimétrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m, c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 , asumiendo que I1 < I2 < I3 . De acuerdo con las fórmulas (8.180), los valores de los momentos principales de inercia son: I1 = 0, 010 kg m2 ; I2 = 0, 020 kg m2 ; I3 = 0, 026 kg m2 (8.254) Los valores de las constantes de movimiento 2E y L son: 2E = 2, 036π 2J ; L2 = 0, 040776π 2J2 s2 (8.255) 294 / Mecánica clásica Reemplazando estos valores en (8.232) hallamos que I vale: I = 0, 0200275 kg m2 (8.256) Definiendo el ángulo modular γ como m = sen2 γ, y usando la fórmula (8.218) para m hallamos que m y γ valen: m = 0, 9926866 ; γ = 85, 09◦ (8.257) La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para q, K y K ′ , usando interpolación lineal: K = 3, 8516333 ; K ′ = 1, 5736950 ; q = 0, 2770075 (8.258) La cantidad c, dada por (8.222), vale: c = 4, 8535462 πs−1 (8.259) El perı́odo de los ángulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar el perı́odo de φ debemos calcular el valor de β. La fórmula (8.231) nos da que: dn iβ = 2, 3094003 (8.260) La transformación imaginaria de Jacobi dice que dn iβ = dc1 β, donde el subı́ndice indica que el módulo de la función elı́ptica es m1 . Notando que dc1 = dn1 /cn1 y luego expresando a cn1 y dn en función de sn1 , obtenemos que: sn21 β = 1 − dn2 iβ = 0, 8136155 1 − m − dn2 iβ (8.261) Entonces sn1 β = 0, 9020063. β será igual al valor de la integral elı́ptica incompleta de primera clase con ángulo modular γ1 = 90◦ − 85, 09◦ = 4, 91◦ y amplitud igual a arcsen(0, 9020063) = 64, 45◦. De la tabla 17.5 del manual hallamos el valor mediante interpolación: β = 1, 1258087 (8.262) Entonces α = πβ/(2K) = 0, 459134. Reemplazando este valor en (8.248) obtenemos: T φ = 7, 303 × 2π 2 (8.263) O sea que al movimiento en φ hay asociado otro perı́odo T ′ cuyo valor es T ′ = 0, 069 s, que es el perı́odo precesional alrededor de la lı́nea invariable, o sea el movimiento medio de φ. Este problema pertenece al caso tercero del ejemplo 8.4.2, donde se señaló que Ω22 resulta negativa. En efecto: Ω22 = ω22 (I2 − I1 )(I2 − I3 ) = −227, 759 s−2 I1 I3 a lo cual corresponde un tiempo caracterı́stico de 0, 0662 s. (8.264) Dinámica del cuerpo rı́gido / 295 8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo Whittaker en su tratado de dinámica analı́tica define un trompo como un cuerpo rı́gido simétrico alrededor de un eje, que termina en una punta en un extremo del eje. Aquı́ estudiaremos el movimiento del trompo bajo la acción de la gravedad cuando la punta permanece fija. Este problema fue estudiado por Lagrange en 1788. La figura 8.8 muestra el sistema de ejes empleados. Los ejes x, y, z, son un sistema z z y c.g. l θ mg y 0 ψ x φ x Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes. de ejes principales en el punto fijo O. Si los momentos principales respecto al centro de gravedad son I1c , I2c , I3c , podemos usar el teorema de Steiner para evaluarlos respecto al punto O: I1 = ml2 + I1c ; I2 = ml2 + I2c ; I3 = I3c (8.265) como el cuerpo rı́gido es simétrico entonces I1 = I2 . Las ecuaciones de movimiento. El lagrangiano respecto a los ejes x, y, z, es: L= 1 1 I1 (ωx2 + ωy2 ) + I3 ωz2 − mgl cos θ 2 2 (8.266) Usando las ecuaciones (8.131) que expresan las ωi en función de los ángulos de Euler podemos expresar a L en términos de los ángulos de Euler: L= 1 1 I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 − mgl cos θ 2 2 (8.267) 296 / Mecánica clásica φ y ψ son coordenadas cı́clicas y por lo tanto sus momentos canónicos conjugados son constantes de movimiento: pφ = (I1 sen2 θ + I3 cos2 θ)φ̇ + I3 ψ̇ = Lz ≡ I1 b pψ = I3 (ψ̇ + φ̇ cos θ) = Lz = I3 ωz ≡ I1 a (8.268) a, b y ωz son constantes. El torque de la gravedad produce rotaciones sólo alrededor de la lı́nea de nodos, en tanto que alrededor de z y z no hay torques, razón por la cual Lz y ~ no son constantes pero sı́ la energı́a Lz han de conservarse. Las otras componentes de L total: 1 1 I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 + mgl cos θ 2 2 E= (8.269) Las ecuaciones (8.268) y (8.269) constituyen un conjunto de tres ecuaciones diferenciales simultáneas para θ, φ, ψ; por lo tanto son equivalentes a las ecuaciones de Lagrange para estas cantidades. En efecto, φ̇ y ψ̇ pueden expresarse en función de θ solamente: φ̇ = b − a cos θ sen2 θ ψ̇ = I1 a b − a cos θ − cos θ I3 sen2 θ (8.270) Como E depende sólo de ψ̇, θ̇, φ̇ y θ, puede expresarse en términos de θ̇ y θ dando una ecuación diferencial para θ: 1 1 (b − a cos θ)2 1 I3 ωz2 + I1 θ̇2 + I1 sen2 θ + mgl cos θ 2 2 2 sen4 θ (8.271) 1 1 1 (b − a cos θ)2 E ′ = E − I3 ωz2 = I1 θ̇2 + I1 + mgl cos θ 2 2 2 sen2 θ (8.272) E= o sea que: Vemos que la variación de θ es la misma que se presentarı́a en un sistema dinámico con un grado de libertad para el cual las energı́as cinética y potencial son respectivamente: 1 2 I1 θ̇ ; 2 1 (b − a cos θ)2 I1 + mgl cos θ 2 sen2 θ (8.273) Llamando u = cos θ la ecuación (8.272) toma la forma: u̇2 = (α − βu)(1 − u2 ) − (b − au)2 = f (u) (8.274) donde se definen a α y β como: α= 2E ′ ; I1 β= 2mgl I1 (8.275) Dinámica del cuerpo rı́gido / 297 La energı́a potencial efectiva. Está dada por la segunda expresión en (8.273), que en términos de u toma la forma: 1 (b − au)2 Vef (u) = I1 + βu (8.276) 2 1 − u2 Podemos entonces escribir a f (u) como: f (u) = 2 [E ′ − Vef (u)] (1 − u2 ) I1 (8.277) Las figuras 8.9 y 8.10 muestran las funciones Vef (θ), Vef (u) y f (u). Vef (u) f (u) E′ E′0 u –1 u1 u0 0 u2 +1 u3 Figura 8.9 Funciones Vef (u) y f (u) Vemos que para un valor dado de E ′ habrá dos valores de u, u1 y u2 para los cuales E = Vef (u), o sea para los cuales u̇ = 0 (θ̇ = 0). Éstos son los puntos de retorno de la coordenada θ. Vemos que en general θ oscilará entre θ1 y θ2 esto es, habrá nutación. Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habrá nutación; este caso corresponde a la precesión estable o regular. u1 y u2 corresponden a los ceros de la función f (u) en el intervalo entre u = −1 y u = 1. La función f (u) es un polimonio cúbico en u que tiene el siguiente comportamiento. En u = ±1 la función f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos raı́ces reales u1 y u2 que se sitúan entre −1 y +1, y la tercera raı́z u3 es también real y mayor que +1 (que corresponde a un valor de θ imaginario puro). Llamemos a esas raı́ces cos θ1 , cos θ2 , cosh θ3 , donde hemos convenido en designar con θ3 al módulo del ángulo correspondiente a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 . E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual Vef tiene un mı́nimo. Este caso es análogo al de las órbitas circulares en el problema de ′ 298 / Mecánica clásica Vef (θ) E′ E′0 0 θ2 θ0 θ1 π θ Figura 8.10 Energı́a ptencial efectiva Vef (θ) y Vef (u) las fuerzas centrales entre dos partı́culas. Integración de la ecuación diferencial para θ. Realicemos la siguiente transformación (Whittaker, Op. cit., p. 157): u= α + a2 4 z+ β 3β (8.278) Al sustituir esta expresión en (8.274) obtenemos: ż 2 = 4z 3 − g2 z − g3 = 4s(z) (8.279) Si u1 , u2 y u3 son las raı́ces del polinomio cúbico f (u) entonces las raı́ces del polinomio cúbico s(z) son: zi = β α + a2 ui − = ei ; 4 12 i = 1, 2, 3 (8.280) Los coeficientes g2 y g3 pueden expresarse en función de los ei mediante las fórmulas 18.1 del texto de Abramowitz y Stegun: g2 = 2(e21 + e22 + e23 ) g3 = 4e1 e2 e3 (8.281) La conexión entre z y t está dada en consecuencia por medio de una función elı́ptica Dinámica del cuerpo rı́gido / 299 de Weierstrass, de acuerdo con la fórmula 18.1.6 del libro de Abramowitz:8 zi = P(t + ǫ) (8.282) donde ǫ es una constante de integración. En consecuencia: cos θ = u(t) = 2I1 2E ′ + I1 a2 P(t + ǫ) + mgl 6mgl (8.283) La función elı́ptica de Weierstrass puede expresarse en términos de la función elı́ptica sn de Jacobi, según la fórmula 18.9.11 de dicho manual, para el caso en que e1 , e2 , e3 , son reales y tomando e3 > e2 > e1 : e3 − e1 (8.284) P(x) = e1 + 2 √ sn (x e3 − e1 ) donde el parámetro de la función sn es: e2 − e1 m= e3 − e1 (8.285) Conociendo las raı́ces ei podemos calcular el perı́odo de la función sn y en consecuencia el perı́odo del ángulo θ, llamado el perı́odo nutacional. Integración de las ecuaciones diferenciales para φ y ψ. φ̇ y ψ̇ están dados por las ecuaciones (8.270). Notamos que θ no depende del valor de I3 , puesto que a no es más que una constante de integración. En consecuencia la expresión para ψ̇ difiere de la correspondiente expresión para un trompo esférico sólo por una constante (I1 a/I3 − a). En el cálculo de la parte no trivial de ψ podemos asumir que el trompo es esférico (I1 = I2 = I3 ), para el cual se cumple: φ̇ = b − a cos θ ; sen2 θ ψ̇ = a − b cos θ sen2 θ (8.286) Podemos expresar a φ̇ y ψ̇ en la forma: φ̇ = a−b a+b + 2(cos θ + 1) 2(cos θ − 1) ψ̇ = a+b b−a + 2(cos θ + 1) 2(cos θ − 1) (8.287) Podemos ahora sustituir la expresión para cos θ en función del tiempo, ecuación (8.283). De (8.283) y (8.284) se sigue que el argumento de P debe ser complejo cuando cos θ = 1 y cos θ = −1. Para θ = 0 y θ = π, según (8.283) P vale respectivamente: P(iγ) = mgl 2E ′ + I1 a2 − 2I1 12I1 P(iδ) = mgl 2E ′ + I1 a2 − − 2I1 12I1 (8.288) 8 Véase también el texto de E. T. Whittaker y G. N. Watson, A course of modern analysis, capı́tulo XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, capı́tulo VI, Cambridge University Press, 1960. 300 / Mecánica clásica donde γ y δ son reales. Reemplazando a (8.288) y a (8.283) en las fórmulas (8.287) obtenemos: φ̇ = mgl(a + b) 1 4I1 P(t + ǫ) − P(iδ) − mgl(a + b) 1 ψ̇ = 4I1 P(t + ǫ) − P(iδ) + 1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ) (8.289) 1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ) Cuando θ = 0 y θ = π la ecuación (8.274) nos dice que u̇2 vale: u̇2 θ=0 = −(b − a)2 ; u̇2 θ=π = −(b + a)2 (8.290) En consecuencia Ṗ(iγ) y Ṗ(iδ) valen, usando (8.278): Ṗ(iγ) = i β(b − a) ; 4 Ṗ(iδ) = i β(b + a) 4 (8.291) Este resultado nos permite escribir a (8.290) en la forma: 2iφ̇ = Ṗ(iγ) Ṗ(iδ) − P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ) 2iψ̇ = Ṗ(iγ) Ṗ(iδ) + P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ) (8.292) De acuerdo con (8.284), la función P tiene un polo doble en el origen, o sea que la función: Ṗ(iδ) P(x) − P(iδ) (8.293) tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a estos, es decir, que se obtengan por translaciones en múltiplos enteros de los perı́odos de la función elı́ptica P(x), que son ciertos ω1 y ω2 , análogos a 2K y 2iK ′ en las funciones elı́pticas de Jacobi. Los residuos de la función (8.293) en ésos polos son +1 y −1. En la teorı́a de las funciones elı́pticas de Weierstrass existe una función, de la familia de las funciones θ, que tiene una estructura analı́tica idéntica a la de la función (8.293). En efecto, la función σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a éste, y la función σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1. En consecuencia la función (8.293) puede escribirse en la forma: σ̇(x − iδ) σ̇(x + iδ) σ̇(iδ) Ṗ(iδ) = − +2 P(x) − P(iδ) σ(x − iδ) σ(x + iδ) σ(iδ) (8.294) Dinámica del cuerpo rı́gido / 301 Llamando ς(iδ) = σ̇(iδ)/σ(iδ) y usando el resultado (8.294), las ecuaciones (8.292) pueden ser integradas inmediatamente para dar a φ y ψ en función de logaritmos de la función σ. Finalmente, φ y ψ pueden escribirse en la forma: e2i(φ−φ0 ) = e2[ς(iδ)−ς(iσ)]t σ(t + ǫ − iδ) σ(t + ǫ + iδ) σ(t + ǫ + iδ)σ(t + ǫ − iδ) e2i(ψ−ψ0 ) = e2[ς(iδ)+ς(iσ)]t σ(t + ǫ − iδ) σ(t + ǫ − iδ) σ(t + ǫ + iδ)σ(t + ǫ + iδ) (8.295) donde φ0 y ψ0 son constantes de integración. Expresión para los parámetros de Cayley-Klein de un trompo esférico en función del tiempo. Los parámetros de Cayley-Klein especifican la posición del cuerpo rı́gido y están expresados en función de los ángulos de Euler mediante las fórmulas (7.175) de la sección 7.8: α′ = cos θ i(φ+ψ)/2 e ; 2 θ β ′ = i sen ei(ψ−φ)/2 2 (8.296) θ −i(φ+ψ)/2 θ −i(φ−ψ)/2 ′ ; δ = cos e γ = i sen e 2 2 Para expresar a cos(θ/2) en función de t, notemos que 2 cos2 (θ/2) = 1 + cos θ. Ahora, usando (8.283) y (8.288) llegamos fácilmente al resultado siguiente usando la fórmula 18.4.4 del citado manual: 2I1 θ [P(t + ǫ) − P(iδ)] 2 cos2 = 2 mgl (8.297) 2I1 σ(t + ǫ + iδ)σ(t + ǫ − iδ) = − mgl σ 2 (iδ) σ 2 (t + ǫ) ′ Para 2 sen2 (θ/2) hallamos una expresión similar reemplazando δ por γ. Combinando (8.297) con (8.295), obtenemos: r I1 ei(φ0 +ψ0 )/2 σ(t + ǫ − iδ) tς(iδ) ′ α = i e mgl σ(iδ) σ(t + ǫ) β′ = i γ′ = i ′ δ = i r r r I1 ei(ψ0 −φ0 )/2 σ(t + ǫ − iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) (8.298) I1 ei(φ0 −ψ0 )/2 σ(t + ǫ + iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) I1 e−i(φ0 +ψ0 )/2 σ(t + ǫ + iδ) −tς(iδ) e mgl σ(iδ) σ(t + ǫ) Para un trompo no esférico las fórmulas correspondientes a (8.295) y (8.298) se obtienen simplemente por reemplazar la función ς por ς + i(I3 − I1 )a/(2I3 ). 302 / Mecánica clásica La precesión estable o regular. Es el movimiento que se presenta cuando no hay nutación, o sea cuando θ es constante. En este caso θ̇ y θ̈ son permanentemente cero. Se sigue de las ecuaciones (8.270) que φ̇ y ψ̇ también son constantes. El valor de u0 = cos θ0 se obtiene resolviendo la ecuación algebraica dVef /dt = 0. De acuerdo con (8.276) esto nos da: 2(a − ub)(b − au) − β(1 − u2 )2 = 0 (8.299) De aquı́ obtenemos el valor de u0 , y en consecuencia el valor que debe tomar la constante E ′ para que se produzca la precesión sin nutación. La ecuación (8.299) es la condición para que la “fuerza” en θ sea nula, o sea que es la condición para que θ̈ sea cero, que junto con θ̇ = 0 caracteriza la precesión regular. Esta ecuación debe ser compatible con la ecuación (8.270). Si sustituimos en (8.299) a b − au0 por su valor φ̇0 (1 − u20 ) y a b por φ̇(1 − u20 ) + au0 , obtenemos: φ̇20 u0 − aφ̇0 + β =0 2 (8.300) Esta ecuación nos da para φ̇ los valores: ! s 4mglI1 a 1± 1− u0 φ̇0 = 2u0 p2ψ (8.301) Como φ̇0 debe ser real, debe cumplirse que: −∞ < 4mglI1 u0 2βu0 ≤1 ≤ 1 → −∞ < p2ψ a2 (8.302) Esta expresión limita drásticamente los posibles valores de la velocidad angular del trompo ωz alrededor de su eje de simetrı́a z: 4mglI1 u0 ≤ ωz2 I32 (8.303) φ̇0 es la velocidad angular de precesión alrededor del eje espacial z. La ecuación (8.301) nos dice que hay dos posibles valores de la velocidad angular de precesión que (+) (−) llamaremos φ̇0 (precesión rápida) y φ̇0 (precesión lenta). El trompo rápido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la unidad tenemos el caso del trompo rápido. De (8.303) vemos que la condición de trompo rápido puede escribirse en la forma: I3 1 mgl ≪ (8.304) I3 ωz2 I1 2 Expandiendo al primer orden la raı́z cuadrada en (8.301) obtenemos para las frecuencias de precesión de un trompo rápido: (+) φ̇0 = I3 ωz ; I1 u0 (−) φ̇0 = mgl I3 ωz (8.305) Dinámica del cuerpo rı́gido / 303 Para el caso en que θ0 > π/2 (u0 negativo), la condición de precesión estable (8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga” (+) (−) del punto fijo O. Según (8.305), cuando u0 < 1, φ̇0 y φ̇0 tienen signos opuestos. Precesión con nutación. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1 y θ2 . La frecuencia angular de precesión está dada por (8.270): φ̇ = b − a cos θ b/a − cos θ =a sen2 θ sen2 θ (8.306) Se pueden presentar varios casos en cuanto al signo de φ̇: (a) φ̇ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para todos los valores de θ si: b > cos θ (8.307) a El trompo precesa siempre en la misma dirección alrededor del eje z en tanto que el eje z oscila entre θ1 y θ2 . La precesión es monotónica con φ̇ siempre positivo. Si se toma una esfera fija en el espacio, con centro en O, la “marca” que dejarı́a el eje z sobre la esfera se representa en la figura 8.11. z Z θ2 θ1 θ2 θ1 θ2 θ1 φ a b c Figura 8.11 “Marcas” que dejarı́a el eje z sobre la esfera: a. para b/a > cos θ, b. para cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a (b) φ̇ cambia de signo cuando el eje va de θ2 a θ1 . Si ocurre que: cos θ1 < b < cos θ2 a (8.308) entonces cuando θ = θ1 , φ̇ es positivo y cuando θ = θ2 , φ̇ es negativo. Por lo tanto la precesión no es monotónica, sino que se da un avance neto en forma de rizo como en la figura 8.11b. Es claro que en este movimiento φ̇ no se anula en la media. (c) Puede ocurrir que: cos θ2 = b a (8.309) 304 / Mecánica clásica Esto implica que φ̇ es positivo para todo θ mayor que θ2 y se anula para θ = θ2 . Entonces, como θ = θ2 es un punto de retorno, allı́ θ̇ es igual a cero. En θ = θ2 el eje z se encontrará simultáneamente sin precesión y sin nutación, o sea que se encuentra instantáneamente en reposo. El movimiento se representa en la figura 8.11c. Esta situación corresponde al método más simple de dejar girando un trompo. Primero se hace girar alrededor del eje z y luego se suelta haciendo un ángulo θ2 con la vertical. Las condiciones para t = 0 son entonces θ = θ2 y θ̇ = φ̇ = 0. Las ecuaciones (8.272) y (8.309) nos dicen entonces que la constante E ′ vale: E ′ = mgl cos θ2 (8.310) Como en (8.272) los términos que contienen a I1 son positivos, para tiempos mayores que cero la energı́a potencial debe disminuir o sea θ debe aumentar hasta alcanzar el valor θ1 y según (8.306) entonces φ̇ aumenta a partir de cero hasta alcanzar el valor máximo positivo dado por: φ̇1 = cos θ2 − cos θ1 a sen2 θ1 (8.311) O sea que el trompo al dejarse caer desde θ = θ2 con θ̇ = φ̇ = 0 en t = 0, en un tiempo mayor adquiere precesión y nutación. Ocurre cuando el trompo es rápido y hay rozamiento en el punto O que la nutación se amortigua rápidamente, dando la impresión de que las condiciones iniciales señaladas no dan lugar a precesión con nutación sino a una precesión regular. Los comportamientos descritos en (a), (b) y (c) están contenidos en la expresión analı́tica (8.295). El producto que contiene las funciones σ es puramente periódico, de modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el movimiento precesional neto. La ecuación (8.295) nos dice que ψ tiene un comportamiento análogo al de φ o sea una rotación neta acompañada de fluctuaciones periódicas. La precesión seudoregular. Es el comportamiento usual de un trompo rápido, que de acuerdo con (8.304) se presenta cuando el efecto de la gravedad es pequeño y puede asimilarse a una pequeña perturbación. En la aproximación cero se presentará la precesión regular propia de un cuerpo rı́gido simétrico libre, ecuación (8.179). El efecto de la gravedad es perturbar ligeramente ese movimiento dando lugar a una pequeña nutación. Los valores de las constantes de movimiento para la precesión con nutación en el caso (c), correspondientes a las condiciones iniciales θ(0) = θ2 , θ̇(0) = φ̇(0) = 0, según las ecuaciones (8.268) son: I3 ψ̇(0) cos θ2 = I1 b I3 ψ̇(0) = I1 a E′ = (8.312) mgl cos θ2 que pueden expresarse en términos de la energı́a de rotación, inicialmente dada por: R= 1 1 I3 ωz2 = I3 ψ̇ 2 (0) 2 2 (8.313) Dinámica del cuerpo rı́gido / 305 Entonces: √ 2RI3 I3 a= = ωz ; I1 I1 b = a cos θ2 (8.314) I1 β E = mgl cos θ2 = cos θ2 2 Entonces podemos escribir a f (u) en la forma: ′ f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2 Las raı́ces de f (u) son: s " # a2 4β β u3,1 = 1± 1+ 2 − u2 2β a a2 (8.315) (8.316) a2 /β está dado por: I3 R a2 = β I1 mgl (8.317) O sea que cuando el trompo es rápido podemos escribir a (8.316) en la forma aproximada: 2β 2β 2 a2 2 1 ± 1 − 2 u2 + 4 (1 − u2 ) (8.318) u3,1 = 2β a a lo cual nos da inmediatamente: u3 ≈ a2 ; β u1 ≈ u2 − β (1 − u22 ) a2 (8.319) La magnitud de la nutación está dada por: β sen2 θ2 (8.320) a2 O sea que cuando θ2 = 0, el eje z permanece vertical (trompo “dormido”). Además, la magnitud de la nutación varı́a como R−1 ; cuanto más rápido gire el trompo menor será la nutación. Calculemos ahora la frecuencia de la nutación para un trompo rápido. Llamemos cos θ al promedio de cos θ, o sea a: cos θ2 − cos θ1 ≈ cos θ1 + cos θ2 β (8.321) = cos θ2 − 2 sen2 θ2 2 2a Podemos especificar la magnitud del desplazamiento del eje z en un tiempo t por: cos θ = x = cos θ − cos θ = u − u (8.322) Usando las raı́ces de la función f (u) podemos escribir la ecuación diferencial para u en la forma aproximada: β a2 u̇2 = β(u − u2 ) u − u2 + 2 (1 − u22 ) u − (8.323) a β 306 / Mecánica clásica Como para un trompo rápido se cumple que a2 /β ≫ u, podemos aproximar aún más a (8.323). Luego expresamos a u en términos de x para obtener: β2 2 2 2 (8.324) ẋ = − 4 sen θ2 − x 4a Derivando (8.324) respecto a t llegamos a: ẍ + a2 x = 0 (8.325) La solución que satisface la condición θ(0) = θ2 es, en consecuencia: x= β sen2 θ2 cos at ; 2a2 cos θ = cos θ2 − β at sen2 θ2 sen2 a2 2 (8.326) La frecuencia angular de la nutación es: 1 I3 ωz a= 2 2I1 (8.327) O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor. (8.306) nos da la frecuencia angular de precesión. Como según (8.326) x es del orden de β/(2a2 ), podemos escribir aproximadamente a φ̇ como: φ̇ = u2 − u u2 − u β at a≈ a = sen2 2 2 1−u 1 − u2 a 2 (8.328) β/(2a2 ) = mgl/(I3 ωz ), según (8.305), coincide con la velocidad angular de precesión lenta del trompo rápido, lo cual nos permite escribir a φ̇ como: (−) φ̇ = 2φ̇0 sen2 at 2 (8.329) La frecuencia angular de precesión media durante un ciclo de la nutación es: (−) φ̇ = φ̇0 (8.330) Vemos que mientras mayor sea ωz , menor será la velocidad angular de precesión. Para un trompo rápido el movimiento es una nutación pequeña y una precesión pequeña que coincide con la velocidad angular de precesión lenta de un trompo rápido. Esta precesión se llama precesión seudoregular, pues aunque las condiciones iniciales no son las de la precesión regular, en la práctica se comporta como ésta porque la fricción amortigua rápidamente la nutación y aparentemente el eje z del trompo empieza instantáneamente a precesar, con movimiento normal a la gravedad. Ésta es la paradoja de Klein-Sommerfeld quienes explicaron que esta precesión no implica aceleraciones infinitas sino que se trata de una precesión con una imperceptible nutación. El trompo “dormido”. Es el caso cuando el eje z permanece vertical, sin precesión ni nutación, o sea cuando: θ(t) = 0 ; θ̇(t) = 0 (8.331) Dinámica del cuerpo rı́gido / 307 f (u) u1 = u2 = 1 –1 0 u3 u +1 Figura 8.12 Comportamiento de f (u) para u1 = u2 = 1 f (u) 0 –1 u1 +1 u2 = u 3 = 1 u Figura 8.13 Comportamiento de f (u) para u2 = u3 = 1 Esta situación es un caso lı́mite de la precesión estable cuando el mı́nimo de Vef (u) está en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la función f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13. Para este caso los valores de las constantes de movimiento son: I1 a = I3 (ψ̇ + φ̇) ; b = a; E ′ = mgl (8.332) Se sigue de (8.275) y (8.332) que: α=β (8.333) 308 / Mecánica clásica La ecuación (8.274) tiene entonces la forma: u̇2 = (1 − u)2 α(1 + u) − a2 (8.334) Las raı́ces de f (u) son en consecuencia: 1, 1, a2 −1 α (8.335) Veamos qué condiciones se requieren en cada uno de los casos mostrados en las figuras 8.12 y 8.13. Para ello examinemos la curvatura de f (u) en la raı́z doble: 2 a ′′ f (1) = 2α 1 − −1 (8.336) α Claramente en el caso de la figura 8.12, donde (a2 /α) − 1 es mayor que 1, la curvatura es negativa y en la figura 8.13 la curvatura es positiva. Los resultados de la precesión estable en general se aplican en este caso en que u0 = 1. La condición (8.303) en este caso es: a2 ≥1 2α (8.337) que señala la velocidad angular crı́tica ωc debajo de la cual cesa la precesión regular, o sea: ωc2 = 4mglI1 I32 (8.338) Vemos pues que el caso de la figura 8.12 es en rigor el de precesión regular en tanto que el caso de la figura 8.13 es inestable y mediante una pequeña perturbación degenera en el de precesión con nutación; para este caso ωz < ωc y para el caso de la figura 8.12, ωz > ωc . Cuando ωz sea igual a ωc entonces a2 /α = 2 y según (8.335) las tres raı́ces de f (u) coinciden y el movimiento aún es estable. Ejemplo 8.5.1 A partir de la solución analı́tica hallar los valores de la frecuencia angular de nutación y de la velocidad angular de precesión media para la precesión con nutación de un trompo pesado bajo las condiciones iniciales (8.312), caso (c). De acuerdo con las fórmulas (8.283) y (8.284), el perı́odo de la nutación coincide con el perı́odo de la función elı́ptica ns2 que es 2K. O sea que: √ T e3 − e1 = 2K (8.339) El parámetro de la función, según (8.285) y (8.280) es: √ u2 − u1 λu2 − 1 + 1 + λ2 − 2λu2 2β √ m= = ; λ= 2 u3 − u1 a 2 1 + λ2 − 2λu2 (8.340) donde hemos usado (8.316). Para precisar, asumamos que: u2 = 1 ; 2 λ=1 (8.341) Dinámica del cuerpo rı́gido / 309 Entonces los valores de m y de √ a e3 − e1 = m = 0, 25 ; 2 √ e3 − e1 son: (8.342) De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos: K(0, 25) = 1, 685 (8.343) con lo cual el valor exacto del perı́odo T es: T = 4K 6, 74 = a a (8.344) y el valor exacto de la frecuencia de nutación es: Ωnut = 0, 932 a (8.345) Promediando sobre un perı́odo de las funciones P obtenemos que el término de φ̇ que en (8.292) da lugar a precesión neta es: 2iφ̇ = 2 σ̇(iγ) σ̇(iδ) −2 σ(iδ) σ(iγ) (8.346) Según (8.288) y (8.314) se cumple para este caso que: P(iγ) = βu2 + a2 5λ − 4 2 1 2 β − = a = a 4 12 48 48 P(iδ) = βu2 + a2 7λ + 4 2 11 β =− a = − a2 − − 4 12 48 48 (8.347) Según la expansión en serie para P(x) el término dominante es x−2 de modo que: P(iγ) ≈ − 1 ; γ2 P(iδ) ≈ − 1 δ2 Entonces hallamos que: r √ 48 48 1 ; iγ ≈ −i iγ ≈ a 11 a (8.348) (8.349) Por otra parte, el término dominante en la expansión en serie para ς(x) es x−1 lo cual nos dice que: r 11 1 1 1 ς(iδ) ≈ ≈i a ; ς(iγ) ≈ ≈√ a (8.350) iδ 48 iγ 48 Entonces resulta que φ̇ vale: φ̇ ≈ 0, 48a + 0, 14ai (8.351) El resultado nos indica que para las condiciones iniciales (8.341) no hay precesión neta estable; que el movimiento en φ dura menos de un perı́odo de P, en tanto que 310 / Mecánica clásica (8.346) supone que existe movimiento en φ durante más de un perı́odo. En efecto, para λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La fórmula (8.340) resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si: I1 2mgl < 0, 8 I3 R (8.352) Si tomamos λ = 0, 1 y u2 = 0, 5, mediante idénticos procedimientos llegamos a los siguientes resultados: e1 = −0, 079659a2 ; e2 = −0, 079166a2 ; e3 = 0, 1188257a2 (8.353) En consecuencia: m = 0, 6659781 ; K(m) = 2, 025 (8.354) Entonces un valor para la frecuencia de nutación más exacto que el resultado (8.327) es: Ωnut = 0, 691a (8.355) Sin embargo en el cálculo de la velocidad angular de precesión entran en juego las aproximaciones hechas para evaluar las ς. Para iδ y iγ obtenemos: i iγ ≈ −3, 7032803 ; a iδ ≈ −3, 1957416 i a (8.356) lo cual nos conduce a: φ̇ = 0, 04 a (8.357) que esta vez no tiene la contribución imaginaria. Según (8.330) que es aplicable en este caso pues λ ≪ 1, φ̇ debe valer: φ̇ ≈ 8.6. β = 0, 0025 a 2a (8.358) Movimiento en un sistema de referencia no inercial Ya a lo largo del texto hemos considerado varios casos de sistemas de referencia no inerciales. En el ejemplo 4.1.5, sección 4.1, encontramos las ecuaciones de movimiento para una partı́cula en un sistema de referencia que rota uniformemente con velocidad angular ~ ω . Encontramos que la rotación añade a la energı́a un término que depende sólo de las coordenadas de la partı́cula y es proporcional al cuadrado de la velocidad angular. Este término adicional, −m(~ω × ~r)2 /2 se llama energı́a potencial centrı́fuga. En la ecuación de movimiento aparecen dos términos adicionales de tipo inercial. La fuerza 2m~r˙ × ~ ω se llama fuerza de Coriolis; es una fuerza no disipativa que depende de la velocidad de la partı́cula, pero no da contribución a la energı́a. La fuerza m~ω × (~ω × ~r) se llama fuerza centrı́fuga; está en el plano formado por ~r y ~ω , siendo perpendicular al Dinámica del cuerpo rı́gido / 311 eje de rotación y alejándose de él; el módulo de esta fuerza es mρω 2 siendo ρ la distancia de la partı́cula al eje de rotación. Al final de la sección 7.9 encontramos expresiones más exactas para las ecuaciones de movimiento, en función de la matriz de rotación. Encontramos en la ecuación (7.282) un término adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotación. Consideremos ahora el sistema de referencia no inercial más general. Consiste en un sistema de referencia que rota no uniformemente y cuyo origen se translada con aceleración no ~ del origen de coordenadas y la velocidad anuniforme. Se supone que la aceleración A(t) gular de rotación ω ~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuación de movimiento más general para una partı́cula que se mueve en un sistema de referencia no inercial es: ∂V ~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω) − mA (8.359) m~¨r = − ∂~r Ya hemos considerado el movimiento de un cuerpo rı́gido en un sistema de referencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129). Ejemplo 8.6.1 Resolver el problema del péndulo de Foucault considerándolo como un cuerpo rı́gido y usando las ecuaciones de Euler en un sistema de referencia rotante. En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes rotantes fijos a la Tierra y los ejes fijos al cuerpo rı́gido. Llamaremos x′ , y ′ , z ′ , a los ejes fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo rı́gido. El vector de velocidad angular de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale: ω ~ 0 = ω0~k (8.360) donde ~k está en la dirección de la lı́nea sur-norte que asumiremos fija en el espacio (ver la figura 8.14). El péndulo está suspendido de un punto O fijo respecto a la Tierra. En ese punto tomaremos el origen común de los ejes fijos a la Tierra y al cuerpo rı́gido. Este es un cuerpo rı́gido trivial que consiste en una partı́cula mantenida a distancia fija de O por medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo que la posición de la partı́cula respecto a los ejes fijos al cuerpo rı́gido está en (0, 0, l). Los momentos principales de inercia de este cuerpo rı́gido son: I1 = ml2 ; I2 = ml2 ; I3 = 0 (8.361) Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues este cuerpo rı́gido no permite especificarlos. Podemos, sin perder generalidad, tomar el eje y perpendicular al plano de oscilación del péndulo y el eje x en el plano de oscilación del péndulo y cuando aparezca la velocidad de rotación alrededor del eje z, ψ̇, asumir que es cero, lo mismo que ψ. Las componentes del vector de velocidad angular de la Tierra respecto a los ejes primados son: ω0 ′ = ~ = ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ] ω0 (cos λ, 0, −senλ) (8.362) 312 / Mecánica clásica N i 0 φ j′ j j′ i′ i′ k k′ 0 k k′ θ ω0 l φ λ m S b a Figura 8.14 Péndulo de Foucault considerado como un cuerpo rı́gido: a. Sistema de ejes y b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados. La energı́a potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor de los ejes z ′ y z, y de la lı́nea de nodos, son respectivamente: Kφ = 0 ; Kψ = 0 ; Kθ = −mgl senθ (8.363) Las ecuaciones de Euler en un sistema de referencia rotante fueron halladas en los ejemplos 8.3.1 y 8.3.3, en la sección 8.3. Las ecuaciones requeridas para este problema deben incluir los torques, o sea que a las ecuaciones (8.155) debemos adicionar en el lado derecho: 3 X Kr βrt ; t = 1, 2, 3 (8.364) r=1 donde las Kr están dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364), que llamaremos K1 , K2 , K3 , son en consecuencia: K1 = −mgl senθ cos ψ ; K2 = mgl senθ senψ ; K3 = 0 (8.365) para escribir las ecuaciones (8.155) se requiere además conocer las componentes del vector ~ ω0′ respecto a los ejes fijos al cuerpo rı́gido. Para ello debemos evaluar: ~ 0 = Ã~ ω ω0′ (8.366) donde à es la matriz de rotación entre los ejes con primas y los ejes con barras, dada por la ecuación (7.122) sección 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los Dinámica del cuerpo rı́gido / 313 momentos de inercia (8.361) nos dan: (ω̇z + ω̇0z ) · 0 = 0 (ω̇y + ω̇0y ) = g −(ωx + ω0x )(ωz + ω0z ) + senθ senψ l (ω̇x + ω̇0x ) = g (ωy + ω0y )(ωz + ω0z ) − senθ cos ψ l (8.367) Debido a que I3 = 0 y I1 = I2 , la ecuación (8.367) da un valor indeterminado para ω̇z + ω̇0z y en consecuencia para ωz + ω0z , la indeterminación proviene del hecho ya señalado al definir las coordenadas x, y, z. En efecto, como la masa m es puntual, carece de sentido hablar de rotación alrededor de z, por ello el lagrangiano (8.123) no contiene ni a ψ ni a ψ̇. Entonces, como se señaló, podemos tomar ceros los valores de ψ y ψ̇. De la ecuación (7.122), junto con las ecuaciones (8.366) y (8.131) podemos escribir ~ , cuando ψ = 0 y ψ̇ = 0: para el vector ~ω 0 y ω θ̇ + ω0 cos φ cos λ ~ + ~ω0 = senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ (8.368) ω cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ Las derivadas de este vector respecto al tiempo son: θ̈−ω0 senφ cos λ φ̇ ~ 0 =φ̈ senθ+ θ̇ φ̇ cos θ+ω0 θ̇(senφ senθ ~ω + ω cos λ−cos θ senλ)−ω0 φ̇ cos θ cos φ cos λ (8.369) φ̈ cos θ− θ̇ φ̇ senθ+ω0 θ̇(senφ cos θ cos λ+senθ senλ)+ω0 φ̇ senθ cos φ cos λ Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero. En efecto, las dos últimas igualdades de (8.367) se convierten en: θ̈ − ω0 φ̇ senφ cos λ + g senθ = 0 l (8.370) senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante Si tomamos cero el valor de la constante en (8.370), esta ecuación será consistente con la ecuación ωz + ω0z = 0, cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ = 0 (8.371) solamente si se cumple que: φ̇ = ω0 senλ ; φ=0 (8.372) Esto quiere decir que tomar simultáneamente ceros los valores de ωy + ω0y y ωz + ω0z da lugar a la solución cuando los ejes x′ −y ′ y x−y coinciden instantáneamente. La ecuación 314 / Mecánica clásica (8.372) muestra una rotación uniforme del plano de oscilación del péndulo alrededor del eje z, en sentido positivo. En efecto, si el péndulo oscilara en el polo norte, donde senλ = 1, un observador en la Tierra verı́a rotar el plano del péndulo uniformemente en sentido contrario al de la rotación de la Tierra y con una velocidad angular igual a ω0 ; esto se ve claramente al notar que el plano de oscilación del péndulo en un sistema de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente. Para un péndulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈ −8 −1 10 s , de modo que las ecuaciones (8.367) pueden resolverse fácilmente, sin hacer las suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los términos que contengan a ω02 y ω0 φ̇. El resultado es que el plano de oscilación del péndulo rota uniformemente con una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en que la rotación de la Tierra no tiene efecto sobre la coordenada θ sino con un término centrı́fugo, que es del orden de ω02 . Ejemplo 8.6.2 Un giróscopo es un cuerpo rı́gido simétrico montado sobre anillos de suspensión de cardán de modo que el cuerpo rı́gido se puede mover libremente con el centro de gravedad fijo, por lo cual no hay torque gravitacional. La brújula giroscópica es un giróscopo al cual se le impone la ligadura que consiste en impedir que el eje de simetrı́a se mueva fuera del plano horizontal. Demuéstrese usando las ecuaciones de Euler que cuando la velocidad angular del giróscopo es grande comparada con la de la Tierra, este giróscopo oscilará alrededor de un meridiano, pudiendo utilizarse como brújula (brújula giroscópica de Foucault). Los ejes principales del giróscopo x, y, z, los definimos de modo que el eje de simetrı́a es el eje z, que permanecerá en el plano horizontal. La figura 8.15a muestra los ejes fijos a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z. Línea de nodos (φ = 0) N x′ 0 z ψ j′ k′ x Vertical z′ Norte θ i′ k′ y′ 0 ω0 λ Este Línea del meridiano S y a b Figura 8.15 Ejes principales del giróscopo: a. Ejes x′ , y ′ y z ′ fijos a la Tierra, b. Ejes principales x, y y z del giróscopo. Dinámica del cuerpo rı́gido / 315 La condición de ligadura impuesta a la suspensión de Cardán es: φ=0 (8.373) Ésta implica que φ̇ = 0, o sea que la ligadura impuesta a las velocidades angulares ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es: senψ ωx + cos ψ ωy = 0 (8.374) Usando la notación de la sección 2.8, escribimos la ligadura en la forma a1 ωx + a2 ωy + a3 ωx donde a1 = tan ψ, a2 = 1, a3 = 0. Entonces los componentes de la fuerza de ligadura son: Rx = λ tan ψ ; Ry = λ ; Rz = 0 (8.375) donde λ es un multiplicador indeterminado de Lagrange. Las ecuaciones de movimiento son las ecuaciones de movimiento de Euler en un sistema de referencia rotante, ecuaciones (8.128) y (8.129), donde de acuerdo con los resultados de la sección 2.8, debemos incluir los términos de torque debidos a la ligadura, (8.375). Por lo anterior, tales ecuaciones son: (ω̇z + ω̇0z )I3 = 0 (ω̇y + ω̇0y )I1 = (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) + λ (8.376) (ω̇x + ω̇0x )I1 = (ωy + ω0y )(ωz + ω0z )(I1 − I3 ) + λ tan ψ Las componentes de la velocidad angular de la Tierra en los ejes primados son: ω ~ 0′ = ω0 (senλ, 0, cos λ) (8.377) ~ 0 debemos usar la matriz de rotación Ã, ecuación (7.122) de la Para hallar a ω sección 7.6, tomando φ = 0: senλ cos ψ + cos λ senψ senθ ~ ω 0 = ω0 −senλ senψ + cos λ cos ψ senθ (8.378) cos λ cos θ ~ según (8.131) es: En tanto que ω, ~ = (cos ψ θ̇, −senψ θ̇, ψ̇) ω (8.379) ~ω˙ + ~ω˙ 0 está dada por: θ̈cψ− θ̇sψ(e−ω0 cλ cθ)+ω0 (−sλ sψ+cλ cψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ sψ cθ ~˙ 0 =−θ̈sψ− θ̇cψ(e−ω0 cλ cθ)+ω0 (−sλ cψ−cλ sψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ cψ cθ ~˙ ω ω+ −θ̇ω0 cλ sθ (8.380) 316 / Mecánica clásica donde usamos s y c en vez de sen y cos, y e es el valor de la constante que se obtiene de (8.376) o sea un espı́n axial neto que incluye una componente de la rotación de la Tierra: e = ωz + ω0z (8.381) Reemplazando las ecuaciones (8.378) a (8.381) en las ecuaciones (8.376) obtenemos: θ̈ cψ + θ̇ sψ(−e + 2ω0 cλ cθ + A) +ω0 sψ(−e sλ + ω0 sλ cλ cθ + sλ A) (8.382) +ω0 cψ(e cλ sθ − ω0 c2 λ sθ cθ − A cλ sθ) = Λ tan ψ −θ̈ sψ + θ̇ cψ(−e + 2ω0 cλ cθ + A) +ω0 cψ(−e sλ + ω0 sλ cλ cθ + sλ A) (8.383) +ω0 sψ(−e cλ sθ + ω0 c2 λ sθ cθ + A cλ sθ) = Λ donde Λ es igual a λ/I1 y A está defnida por: A= I1 − I3 e I1 (8.384) Multiplicando (8.382) por cos ψ y (8.383) por senψ y restando las ecuaciones resultantes, obtenemos: θ̈ + ω0 I3 e cos λ senθ − ω02 cos2 λ senθ cos θ = 0 I1 (8.385) Para un lugar que no esté en los polos, cos λ 6= 0, y para una alta velocidad de rotación del giróscopo, e ≫ ω0 , la ecuación (8.385) se puede aproximar a: θ̈ + I3 eω0 cos λ senθ = 0 I1 (8.386) Ésta es una ecuación similar a la de un péndulo simple. Indica que el eje del giróscopo oscila alrededor de la lı́nea del meridiano, siendo el perı́odo de pequeñas oscilaciones: r I1 (8.387) T = 2π I3 eω0 cos λ es decir, el mecanismo indica el norte, por lo tanto sirve de brújula que indica el norte verdadero, a diferencia de una brújula magnética que indica el norte magnético. Para una discusión más detallada que incluye el caso en que el giróscopo está montado sobre un barco, véase el texto de Atkin, Dinámica clásica, John Willey, 1959, o referencias especializadas sobre el giróscopo. La ecuación de ligadura (8.374) permite obtener a ψ(t) al reemplazar el resultado de integrar a (8.386), y la ecuación (8.376) permite entonces hallar a λ, y en consecuencia la fuerza de ligadura. Como la solución de (8.386) es una función elı́ptica, sn, las ecuaciones (8.374), (8.376) y (8.386) permiten expresar a θ, ψ y λ en términos de funciones elı́pticas. Dinámica del cuerpo rı́gido / 317 Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar explı́citamente a θ, ψ y λ en función del tiempo. Analizar los resultados. 318 / Mecánica clásica avanzada 9 Las transformaciones canónicas 9.1. La acción en función de las variables de estado Según el principio de Hamilton, entre todas las trayectorias en el espacio de configuración que parten de un punto (q1 ) en t = t1 y terminan en un punto (q2 ) en t = t2 , el sistema sigue efectivamente a través de la trayectoria que extremaliza la integral de acción o, equivalentemente, por aquella que satisface las ecuaciones de Lagrange. Para expresar la acción en función de las coordenadas, debemos considerar todas las posibles trayectorias reales y circuitosas en el espacio de configuración y no solamente aquellas que pasan por dos puntos dados. Entre un par de puntos dados, (q1 ) en t = t1 y (q2 ) en t = t2 , sólo pasa una trayectoria recta (o real). O sea que a una familia de parejas de puntos [(q1 ) en t = t1 , (q2 ) en t = t2 ], definida de acuerdo con cierta regla, le corresponde una familia de trayectorias en “lı́nea recta” (o reales). Ası́ por ejemplo, para un sistema de dos grados de libertad las trayectorias estarán situadas en un plano. Para precisar, asumamos que se trata de partı́culas en presencia del campo gravitacional, el cual actúa a lo largo de la dirección y. La figura 9.1 muestra la familia de puntos extremos (x1 , y1 en t1 ; x2 , y2 en t2 ), definida de la siguiente manera: r π 2a senθ ; 0 ≤ θ ≤ x1 = a cos θ ; y1 = a senθ ; t1 = g 2 x2 = b ; 1 y2 = a senθ + g 2 b − a cos θ t2 = + vx r b − a cos θ vx 2 (9.1) 2a senθ g Este ejemplo muestra que para a, b, dados se puede definir una familia de trayectorias por hacer variar a θ entre 0 y π/2, con lo cual se varı́an además los tiempos t1 y t2 . Los correspondientes puntos inicial y final están sobre un arco de circunferencia y sobre un segmento de lı́nea recta respectivamente. Obviamente para un par de puntos 319 320 / Mecánica clásica avanzada b 0 θ′ θ a x P1 (x1, y1, t1) P1′ (x1′, y1′, t1′) P2 (x2, y2, t2) P2′ (x2′, y2′, t2′) y Figura 9.1 Familia de trayectorias dependiente de θ entre 0 y π/2 inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 . Haciendo variar la tripleta de parámetros (a, b, θ) sobre todo el rango de sus valores posibles podrı́amos obtener todas las posibles trayectorias “rectas” en el plano x − y; para definir las trayectorias circuitosas requerirı́amos de parámetros adicionales. En general, sea (α) un conjunto completo de parámetros que define una familia de trayectorias rectas en el espacio de configuración. A esa familia de trayectorias le corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada por: t1 = t1 (α) ; qν1 = qν1 (α) t2 = t2 (α) ; qν2 = qν2 (α) (9.2) ν = 1, 2, ...l Debemos definir desplazamientos virtuales entre una trayectoria real y las correspondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra considerando: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo, con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria. Queremos evaluar el cambio en la integral de acción: Z t2 L dt (9.3) S= t1 cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coordenadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α). Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al cambio virtual en el tiempo: ∆qν = δqν + q̇ν δt ; ν = 1, 2, ...l (9.4) ∆t = t(α + ∆α) − t(α) Las transformaciones canónicas / 321 La figura 9.2 muestra dos trayectorias reales en el espacio de configuración que difieren por cantidades pequeñas. C1 y C2 son dos curvas que describen la familia de puntos extremos, o sea definidas por las ecuaciones (9.2). C2 P2 t C1 P1 t1 + ∆t1 t1 t1 + ∆t1 (∆q) t2 (α) t2 + ∆t2 (∆q) q∆t t + ∆t t (q + δq) (q + ∆q) P2′ t2 (α + ∆α) P1′ Figura 9.2 Trayectorias reales en el espacio de configuración A cada una de las dos trayectorias reales le corresponde un valor de la integral de acción (9.3). La diferencia de los valores de S es: S′ − S ∆S = Z = t2 +∆t2 t1 +∆t1 dt L(q + δq, q̇ + δ q̇, t) − Z (9.5) t2 dt L(q, q̇, t) t1 Para ∆t1 y ∆t2 lo suficientemente pequeños se cumple: Z t2 Z t2 +∆t2 L dt + L(t2 ) ∆t2 − L(t1 ) ∆t1 Ldt ≈ (9.6) t1 t1 +∆t1 t t1 t1 + ∆t1 t2 t2 + ∆t2 Figura 9.3 Cambio en el tiempo ∆t al variar (α) Entonces (9.5) se puede escribir como: ∆S = Z t2 t2 L(q + δq, q̇ + δ q̇, t)dt + L(q + δq, q̇ + δ q̇, t)∆t t1 − Z t1 t2 t1 L(q, q̇, t)dt (9.7) 322 / Mecánica clásica avanzada Por otra parte sabemos que: L(q + δq, q̇ + δ q̇, t) − L(q, q̇, t) = l X ∂L ν=1 d δqν + (pν δqν ) − ṗν δqν ∂qν dt (9.8) al primer orden en (δq). Entonces: ∆S = Z t2 t1 l X ∂L ν=1 ∂qν − ṗν δqν + l X t2 t2 pν ∆qν ν=1 (9.9) + L ∆t t1 t1 donde despreciamos todos los términos de orden superior al primero en (δq) y (q̇ ∆t). Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de Lagrange la integral en (9.9) es cero, luego: ∆S = l X pν δqν + L ∆t ν=1 ! t2 (9.10) t1 Debido a que δqν = δqν − q̇ν ∆t, obtenemos: ! t2 l X ∆S = pν ∆qν − H ∆t ν=1 (9.11) t1 Esta expresión nos dice que: pν = ∂S ∂S ∂S ∂S , H=− , H= en t = t2 ; pν = − en t = t1 ∂qν ∂t ∂qν ∂t (9.12) Es claro que ∆S es la diferencia de dos términos infinitesimales, evaluados en t1 y t2 . Ahora, si llamamos t a t2 y escogemos a C1 de modo que se reduzca a un punto, es decir, tomamos fijo el punto p1 : δqν (t1 ) = 0, ∆t1 = 0; ν = 1, 2, ...l (9.13) Obtenemos: ∆S = l X ν=1 pν ∆qν − H ∆t (9.14) Esta expresión nos da la diferencial total de cierta función S de las coordenadas y del tiempo sobre la curva C2 . De P1 sale un haz de trayectorias reales que cortan la curva C2 . La ecuación (9.14) nos da la diferencia en la acción para dos trayectorias reales diferentes cuando cortan la curva C2 . Es claro entonces que: pν = ∂S ; ∂qν ν = 1, 2, ...l; H = − ∂S ∂t (9.15) Las transformaciones canónicas / 323 Siendo S = S(q, t) la acción en función de las coordenadas y del tiempo: Z t2 L dt S(q, t) = (9.16) t1 Si se impone la condición de que las variaciones en el lı́mite superior se anulen, obviamente lo que se obtiene es ∆S = 0, y de ahı́ las ecuaciones de movimiento. A la función S[q(t), t] se le denomina la acción en función de las coordenadas: es el número que se asocia a la trayectoria que comienza en P1 y termina en q(t), t, o sea sobre la lı́nea C2 . Como q y t dependen de (α), S es una función de (α). 9.2. La integral invariante de Poincaré-Cartán En lugar del espacio de configuración l-dimensional, consideramos el espacio de fases 2l-dimensional, en el cual cada punto en el tiempo t se especifica por (q, p). En este espacio definamos dos curvas cerradas, C1 y C2 , cuyos puntos sean el comienzo y el final de una familia de trayectorias rectas en el espacio de fases; es decir, tales que si el sistema inicialmente estaba descrito por un punto de C1 evolucionará de acuerdo con las ecuaciones canónicas hasta llegar a cierto punto final sobre C2 . Las ecuaciones que definen las curvas cerradas C1 , C2 , son análogas a (9.2): t1 = t1 (α); qν1 = qν1 (α) ; p1ν = p1ν (α) t2 = t2 (α) ; qν2 = qν2 (α) ; p2ν = p2ν (α) ; (9.17) α = 1, 2, ...l donde ahora los parámetros (α) son tales que varı́an entre (αi ) y (αf ) de modo que las funciones de (α) definidas por (9.17) son periódicas, es decir toman el mismo valor cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es mostrada en la figura 9.4. (Véase el ejemplo 4.3.1 en la sección 4.3). Es claro que C1 y C2 deben estar sobre la hipersuperficie Ez constante. En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1 y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y sólo un punto sobre C1 , un punto sobre C2 y una trayectoria y sólo una. Cada trayectoria tiene un valor dado de la acción: Z t2 (α) S̃ = L̃ [q(α, t), q̇(α, t), p(α, t), ṗ(α, t), t] (9.18) t1 (α) donde L̃ es definido en (3.77), según: L̃ (q, p, q̇, ṗ, t) = l X ν=1 1 Llamado pν q̇ν − H(q, p, t) también “tubo de lı́neas caracterı́sticas”. (9.19) 324 / Mecánica clásica avanzada Pz C1 θ z C2 Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un cilindro Por un procedimiento análogo al que conduce a (9.9), hallamos para la diferencia de la acción entre dos trayectorias vecinas: ∆S̃ = ( l Z X ν=1 dt " ∂H q̇ν − ∂pν ! δpν # ) d ∂H δqν + (pν ∆qν ) + L ∆t − ṗν + ∂qν dt t2 (9.20) t1 Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas por las ecuaciones de Hamilton, se sigue: ∆S̃ = " l X ν=1 pν δqν + L ∆t # t2 (9.21) t1 Ahora, usando (9.4) en (9.21) obtenemos que ∆S̃ = ∆S, ecuación (9.11): ∆S̃ = " l X ν=1 pν ∆qν − H ∆t # t2 (9.22) t1 ∆S̃ es el cambio en la acción al cambiar infinitesimalmente de una trayectoria de fases real a otra, o sea al variar infinitesimalmente las (α). Podemos integrar cada término en (9.22) respecto a (α), desde (α) = (αi ) hasta (α) = (αf ), o sea sobre todas Las transformaciones canónicas / 325 las trayectorias que comienzan y terminan en las curvas cerradas C1 y C2 : # t2 Z (αf ) "X l pν ∆qν − H ∆t S(αf ) − S(αi ) = (αi ) = Z ν=1 l X (αf ) p2ν ν=1 (αi ) − = Z (αf ) (αi ) I C2 − I C1 l X ν=1 ∆qν2 p1ν 2 − H ∆t2 ∆qν1 ν=1 l X ν=1 l X 1 C1 l X ν=1 ! ! pν ∆qν − H ∆t Hemos demostrado que la integral de lı́nea, ! I X l pν ∆qν − H ∆t I= (9.23) ! pν ∆qν − H ∆t ν=1 ! − H ∆t1 pν ∆qν − H ∆t Como S(αi ) = S(αf ) obtenemos: ! I I l X pν ∆qν − H ∆t − C2 t1 ! =0 (9.24) (9.25) ν=1 no cambia su valor tomada sobre un contorno arbitrario del espacio fásico, a través del cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de trayectorias reales. I es una integral invariante, llamada la integral invariante de Poincaré-Cartán (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 18). Teorema de Poincaré-Cartán. I es una integral invariante a lo largo de un haz de trayectorias arbitrario en el espacio de fase si y sólo si esas trayectorias son solución a las ecuaciones canónicas de Hamilton. Hemos demostrado que si las trayectorias son solución a las ecuaciones de Hamilton, I es una integral invariante. Restarı́a por mostrar que si I es una integral invariante entonces las trayectorias son solución a las ecuaciones de Hamilton. La demostración está en el texto de Gantmacher indicado anteriormente. Como en este teorema se muestra que las ecuaciones de Hamilton son consecuencia de la invariancia de I, ésta puede plantearse como un principio general de la mecánica, que fue hallado por Poincaré en el año 1890. Las ecuaciones de Whittaker. En la integral de Poincaré-Cartán (9.25), podemos ver que hay analogı́a entre las pν y −H, y entre las qν y t. Podemos pensar en un 326 / Mecánica clásica avanzada formalismo en el cual se intercambien los papeles de (−H, t) y una pareja de variables canónicamente conjugadas, digamos (p1 , q1 ),2 en un espacio de fases ampliado 2l + 1dimensional, donde t no es simplemente un parámetro. Sean (S = −H, t) las cantidades que cambiaremos por (p1 , q1 ): s = −H(q, p, t) (9.26) La ecuación (9.26) nos permite expresar a p1 en términos de (q), p2 , ...pl , s, t: p1 = −K(q1 , q2 , ...ql , p2 , p3 , ...pl , s, t) Entonces podemos escribir la integral invariante I como: I I = (s∆t + p2 ∆q2 + pl ∆ql − K ∆q1 ) (9.27) (9.28) En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues, que el movimiento del sistema con las nuevas variables obedece las ecuaciones: dt = dq1 ∂K ; ∂s ∂K ∂s =− dq1 ∂t dqν = dq1 ∂K ; ∂pν dpν ∂K =− ; dq1 ∂qν (9.29) ν = 1, 2, ...l donde ahora q1 es la variable independiente o “tiempo”. Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para el cual H no depende del tiempo). En este caso: H(q, p) = h = constante (9.30) que sabemos, en general no coincide con E = T + V . Ahora, en la integral invariante I tomemos sólo aquellos estados para los cuales la constante h toma un mismo valor, h0 . Todas las trayectorias tendrán la misma energı́a. Entonces: I I H ∆t = h0 ∆t = 0 (9.31) La integral invariante será:3 I= I X l pν ∆qν (9.32) ν=1 Si ahora en (9.30) despejamos p1 obtenemos: p1 = −K(q1 , q2 , ...ql ; p2 , p3 , ...pl , h0 ) (9.33) 2 Véase el texto de Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, capı́tulo XII, numeral 141. 3 La invariancia de I es análoga a un teorema de hidrodinámica que establece que la circulación en cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo. Las transformaciones canónicas / 327 con lo cual (9.32) se puede escribir en la forma: ! I X l pν ∆qν − K∆q1 I= (9.34) ν=2 Esta integral toma la forma de la integral invariante de Poincaré-Cartán, tomando como variables de estado a q2 , p2 , q3 , p3 , ...ql , pl , a q1 como el tiempo, y a K en lugar de H. En virtud del teorema mencionado, se cumple que el movimiento de este sistema obedece las ecuaciones de Hamilton siguientes (2l − 2 en total): dqν ∂K = ; dq1 ∂pν dpν ∂K =− ; dq1 ∂qν ν = 2, 3, ...l (9.35) Las ecuaciones (9.35) son las ecuaciones de Whittaker. O sea que para un sistema generalizado conservativo (para el cual H es constante) se requieren sólo 2l − 2 ecuaciones para definir la trayectoria del sistema. El sistema de ecuaciones hamiltonianas de Whittaker puede ser expresado en forma lagrangiana: ∂M d ∂M = 0; − dq1 ∂qν′ ∂qν ν = 2, 3, ...l (9.36) donde qν′ = dqν /dq1 y M (la función análoga de la lagrangiana) es el generador de la transformación de Legendre de las variables (qν , qν′ ) a las variables (qν , pν ). M y K tienen una relación análoga a L y H, véase (3.16). M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) = l X ν=2 pν qν′ − K(q1 , q2 , q3 , ...ql , p2 , p3 , ...h0 ) (9.37) La integración de las ecuaciones de Whittaker nos conduce a qν , pν , en función de q1 , es decir, a las ecuaciones de la trayectoria en el espacio de fases. La solución de (9.35) contendrá 2l − 2 constantes de integración y dependerá además de la constante h0 : qν = qν (q1 , h0 , C1 , C2 , ...C2l−2 ) (9.38) pν = pν (q1 , h0 , C1 , C2 , ...C2l−2 ) ; ν = 2, , 3, ...l Reemplazando (9.38) en (9.33) llegamos a: p1 = p1 (q1 , h0 , C1 , C2 , ...C2l−2 ) (9.39) Las expresiones (9.38) y (9.39) constituyen las ecuaciones de las trayectorias en el espacio de fases. La dependencia temporal de las coordenadas se recobra de la ecuación q̇1 = ∂H/∂p1 : Z dq1 t= + C2l−1 (9.40) ∂H/∂p1 donde ∂H/∂p1 se puede expresar en términos de q1 por medio de las ecuaciones (9.38) y (9.39). Para sistemas que poseen la constante de movimiento h, se puede resolver el problema mecánico con sólo 2l − 2 ecuaciones del tipo hamiltoniano o con l − 1 ecuaciones del tipo lagrangiano, (9.35) y (9.36) respectivamente. 328 / Mecánica clásica avanzada 9.3. El principio de mı́nima acción y expresiones equivalentes El principio de mı́nima acción de Maupertuis-Euler-Lagrange. Como las ecuaciones (9.36) son de tipo lagrangiano, pueden ser obtenidas de un principio variacional, ∆Σ = 0, donde: Σ= Z q22 q11 M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1 (9.41) La variable Σ es llamada la acción de Lagrange, en tanto que S se llama la acción de Hamilton. ∆Σ = 0 caracteriza las trayectorias que pasan por los puntos definidos por q1 = q11 y q1 = q12 , o sea las soluciones de (9.36) tales que ∆qν (q11 ) = ∆qν (q12 ) para ν = 2, 3, ...l. ∆ representa “desplazamientos virtuales” respecto a q1 , es decir, desplazamientos realizados con q1 fijo y que no cambian los extremos de la trayectoria; en cuanto al tiempo la situación es diferente, pues t1 y t2 pueden variar cuando se pasa de una trayectoria real a una circuitosa. Esto es esquematizado en la figura 9.5, donde B representa una trayectoria real y A una circuitosa, ambas con el mismo valor de la energı́a.4 t2 + ∆t2 (q + ∆q) t + ∆t t P1 1 q1 P2 2 t2 A t1 + ∆t1 q1 (∆q) (q) B t t1 Figura 9.5 Paso de una trayectoria real B a una circuitosa A La función M se puede expresar en términos de L. En efecto, se sigue de (9.27) y (9.37) que: M= l X ν=2 4 Las l pν qν′ + p1 = 1X 1 1 pν q̇ν = (L + H) = (2T2 + T1 ) q̇ ν=1 q̇ 1 q̇ 1 (9.42) trayectorias A y B que se cortan en P1 y P2 en el espacio de configuración, son las proyecciones de dos trayectorias en el espacio de fases ampliado, sobre H = h0 , que no se cortan. Las transformaciones canónicas / 329 En la igualdad (9.42) se ha usado la ecuación (3.127). La integral (9.41) se puede escribir como: Z t2 (L + H)dt = S + h(t2 − t1 ) (9.43) Σ= t1 se ve que ∆Σ = ∆S + h(∆t2 − ∆t1 ), cuando tomamos sólo trayectorias circuitosas con el mismo valor de la energı́a. La expresión ∆Σ = 0 define la ecuación de la trayectoria entre todas las que satisfacen la conservación de la energı́a, con ∆qν = 0 en P1 y P2 . Además, se sigue de (9.41) y (9.43): Z t2 X l Σ= pν q̇ν dt (9.44) t1 ν=1 Para un sistema conservativo ordinario (tal que T + V es constante), T1 = 0 y T = T2 , con lo cual (9.42) nos dice que M = 2T /q1 . Entonces: Z t2 N Z ri2 X mi ṙi dri (9.45) 2T dt = Σ= t1 i=1 ri1 Esto nos dice: “dada la configuración inicial y final de un sistema descrito por un hamiltoniano constante, e igual a la energı́a total, con un valor dado de la energı́a, la trayectoria del sistema en el espacio de configuración es aquella para la cual la integral de la energı́a cinética es estacionaria, cuando se compara con las trayectorias vecinas que satisfacen dichas condiciones”. Este principio es aplicable sólo a sistemas conservativos. Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar pero la energı́a es la misma sobre cada curva. En el principio de Hamilton aplicado a sistemas conservativos, se consideran sólo aquellas trayectorias para las cuales el tiempo de movimiento a lo largo de ellas es el mismo, aunque las energı́as asociadas a ellas pueden diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesariamente con trayectorias posibles del movimiento del sistema, H puede no conservarse sobre ellas. En el principio de mı́nima acción se consideran trayectorias variadas donde el tiempo puede variar pero H sı́ se conserva. En estos dos principios se halla la trayectoria verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas de manera diferente. Otra forma de obtener que ∆Σ = 0 es la siguiente: Z t2 X Z t2 l (L + H) dt = S + h(t1 − t2 ) (9.46) Σ= pν q̇ν dt = t1 t1 ν=1 Tomando variaciones en (9.46) y usando la expresión (9.11) para ∆S: t2 " l # t2 X ∆Σ = ∆S + h(∆t1 − ∆t2 ) = pν ∆qν − h∆t + h∆t ν=1 = l X ν=1 t1 t1 t2 pν ∆qν (9.47) t1 330 / Mecánica clásica avanzada Tomando a ∆qν = 0 en t1 y t2 y ν = 1, 2, ...l, se sigue que ∆Σ = 0. A la función S se le llama acción principal ( o de Hamilton) y a la función Σ se le llama acción reducida (o de Lagrange). Resumen Histórico. Fermat, matemático francés (1601-1665), formuló el principio del mı́nimo tiempo en la óptica de rayos: un rayo de luz se propaga sobre aquella trayectoria para la cual el tiempo de tránsito es mı́nimo. En lenguaje variacional (moderno): Z B Z B dl ∆ dt = 0 ⇒ ∆ =0 (9.48) A A v Maupertuis, especulando con las concepciones filosóficas de Leibnitz, expresó en 1744 la conjetura de que la evolución de una partı́cula material se da de tal manera que el producto m.v.l es mı́nimo, dio ejemplos en los cuales las trayectorias son rectilı́neas y por tanto v es constante. El matemático suizo Euler (1703-1793) enunció en 1744 el principio de mı́nima acción, esta vez como un teorema, basado en sus trabajos sobreRel cálculo de variaciones. Tal enunciado es de la forma: la diferencia entre la integral vdl para una partı́cula, tomada a lo largo de una trayectoria real, y la misma integral sobre una trayectoria vecina (es decir sobre una trayectoria sobre la cual se mueve la partı́cula sin obedecer las leyes de Newton), que pasan por dos puntos dados, es una cantidad infinitesimal de segundo orden; se supone que la partı́cula viaja sobre la trayectoria variada con una velocidad para la cual la energı́a total tiene un valor dado: Z B ∆E=C v dl = 0 (9.49) A donde C es una constante. En 1760 Lagrange (1736-1813) extendió el principio de Euler a sistemas de partı́culas: ∆E=C Z N BX A i=1 m~vi · d~ri = 0 (9.50) Lagrange mostró además que (9.50) se cumple si y sólo si vale la segunda ley de Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Además, Lagrange fue el primero que introdujo las coordenadas generalizadas, con las cuales (9.50) es: ∆E=C Z N BX A pν dqν = 0 (9.51) i=1 Cuando en (9.51) se asume que T es función cuadrática de las velocidades generalizadas se tiene: Z B ∆E=C 2T dt = 0 (9.52) A Lagrange llamó a (9.52) el principio de la más pequeña o más grande fuerza viva. Las transformaciones canónicas / 331 Hamilton, escocés que vivió entre 1805 y 1865, aportó en 1835 la formulación general del principio de mı́nima acción y las ecuaciones de Hamilton. Extiende la formulación al considerar trayectorias circuitosas en que la energı́a no se conserva: Z B Z B ∆ L dt = ∆ (2T − H)dt = 0 (9.53) A A El conjunto de trayectorias es tal que pasa simultáneamente por los mismos puntos inicial y final. Es claro ya por qué a Σ se llama la acción de Lagrange y a S la acción de Hamilton. Los principios de Hamilton y de mı́nima acción son aplicables equivalentemente para sistemas conservativos, sin embargo, el primero es más general pues se aplica además a sistemas holónomos generales, con una generalización a sistemas holónomos con fuerzas no derivables de un potencial, ecuación (3.12). Las ecuaciones de Jacobi. Para el caso de un sistema conservativo ordinario T puede escribirse como: T = T2 = l X aµν q̇µ q̇ν = q12 G(q1 , q2 , ...ql , q2′ , q3′ , ...ql ) (9.54) µ,ν=1 donde: G= l X aµν qµ′ qν′ (q1′ = 1) (9.55) µ,ν=1 Como H = h = T + V , (9.54) conduce a: r h−V q̇1 = G (9.56) Para M , (9.56) nos da: M= p 2T = 2 G(h − V ) q̇1 (9.57) Las ecuaciones diferenciales lagrangianas de Whittaker, (9.36) con M dado por (9.57), que son aplicables a sistemas conservativos ordinarios, se llaman las ecuaciones de Jacobi (1886). Otras formas del principio de acción estacionaria de Maupertuis-EulerLagrange. Definimos en el espacio de configuración los vectores l-dimensionales ρ~ = {q1, q2, ...ql }. Entonces el vector ρ ~ determina la posición del sistema en el espacio de configuración. La energı́a cinética está relacionada con la velocidad del punto representativo del sistema en el espacio de configuración, ρ ~˙ . Para un sistema esclerónomo la energı́a cinética es función cuadrática de las velocidades generalizadas, de acuerdo con (9.54): T = l l 1 X 1 X 2aµν q̇µ q̇ν = mµν dqµ dqν 2 µ,ν=1 2dt2 µ,ν=1 (9.58) 332 / Mecánica clásica avanzada Si definimos en el espacio de configuración la métrica no cartesiana mµν = 2aµν , donde aµν está dada por (3.105), el producto escalar de dos vectores, ρ ~ y ~n, estará dado por: (~ ρ, ~η ) = l X mµν ρµ ην (9.59) µ,ν=1 O sea que es posible asociar al espacio de configuración de un sistema mecánico un espacio riemanniano, dado por la métrica (tensor métrico) mµν (véase el texto de Lichnerowicz, Cálculo tensorial, capı́tulo VI). De las expresiones (9.58) y (9.59), tenemos que: T = 1 ˙2 dρ ρ ~ ⇒ dt = √ 2 2T (9.60) Se sigue que la energı́a cinética de un sistema dinámico siempre coincide con la energı́a cinética del punto representativo en el espacio de configuración, si a ese punto se le asigna una masa m = 1. El principio de acción estacionaria tomará la forma: Z (q2 ) √ Z t2 2T dρ = 0 (9.61) 2T dt = ∆ ∆Σ = ∆ t1 (q1 ) Para sistemas conservativos, tales que h = T + V : Z (q2 ) √ ∆ h − V dρ = 0 (9.62) (q1 ) La ecuación (9.62) se llama la forma de Jacobi del principio de acción estacionaria. Para un movimiento libre, V = 0: Z (q2 ) dρ = 0 (9.63) ∆ (q1 ) La ecuación (9.63) indica √ que la trayectoria es la √ más corta, la lı́nea recta; donde la longitud recorrida es ρ = 2h, donde ρ = (t1 − t2 ) 2h. Para V = 0, el punto representativo del sistema en el espacio de configuración se √ mueve uniformemente con velocidad 2h sobre una trayectoria recta. En general, para V 6= 0, de la forma de Jacobi del principio de acción estacionaria se deduce que la trayectoria del sistema en el espacio de configuración (trayectoria real) es la geodésica. Esta trayectoria también es la “más recta” o sea la de mı́nima curvatura (principio variacional de Hertz de la mı́nima curvatura). 9.4. El teorema de Li Hua Chung Sea la integral invariante de Poincaré-Cartán, I, definida en (9.25). Según (9.24), I tiene el mismo valor sobre cualquier contorno cerrado que envuelva el mismo haz de trayectorias reales en el espacio de fases. Particularicemos para el caso en que los puntos Las transformaciones canónicas / 333 sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del espacio de fases que forma una lı́nea cerrada y que corresponde a estados simultáneos de un sistema de acuerdo con (9.17), las ecuaciones paramétricas de C1 son: qν1 = qν1 (α) ; t1 (α) = constante ; p1ν = p1ν (α) ; ν = 1, 2, ...l (9.64) C2 está definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0, reduciéndose la ecuación (9.24) a: I l X pν ∆qν = C2 ν=1 I l X pν ∆qν = I1 (9.65) C1 ν=1 La integral I1 fue introducida por Poincaré pero fue Cartán quien la extendió a contornos formados por estados no simultáneos con la introducción del término adicional −Ht.5 Sea C un contorno arbitrario en el espacio de fases (véase figura 9.6). Es claro que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l, constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l. Pν Cν Aν qν Figura 9.6 C es un contorno arbitrario en el espacio de fases con proyecciones Cν Se sigue entonces que: I (p1 ∆q1 + p2 ∆q2 + ...pl ∆ql ) = C I I I p2 ∆q2 + ... p1 ∆q1 + pl ∆ql (9.66) El área encerrada por el contorno Cν es Aν , donde: I pν ∆qν = ±Aν (9.67) C1 C2 Cl Cν 5 La mecánica de Hamilton puede desarrollarse postulando un espacio de dimensión par dotado de una estructura definida por la invariancia de I1 . 334 / Mecánica clásica avanzada Se toma el signo más si se evalúa H la integral Hen el sentido de las agujas del reloj y menos en el sentido contrario. Como C pν ∆qν = cν pν ∆qν , el sentido del contorno Cν dependerá del sentido de C. Entonces: I X l l X ±Aν (9.68) pν ∆qν = I1 = C ν=1 ν=1 donde C consta de estados simultáneos. Los contornos C y Cν varı́an durante el movimiento del sistema y las áreas Aν también varı́an, pero la suma algebraica de esas áreas, (9.68), permanece constante. La anterior es pues la interpretación geométrica de la invariancia de la integral de Poincaré I1 . Como H no aparece en I1 , hallamos que la invariancia de I1 no depende del sistema mecánico particular, es decir, I1 es invariante para cualquier sistema hamiltoniano. Por esto se llama a I1 la integral universal invariante. Es válido entonces enunciar el siguiente teorema: si q̇ν = ∂H/∂pν ; ṗν = −∂H/∂qν , ν = 1, 2, ...l, entonces I1 es invariante. Si I1 es invariante para algún sistema de ecuaciones diferenciales q̇ν = Qν = Qν (q, p, t), ṗν = Pν (q, p, t), ν = 1, 2, ...l, entonces ese sistema debe ser hamiltoniano. Para demostrar la segunda parte, sea: I X l dpν dI1 d∆qν = ∆qν + pν dt dt dt ν=1 = I X l (ṗν ∆qν + pν ∆q̇ν ) I X l (ṗν ∆qν + ∆(pν q̇ν ) − ∆pν q̇ν ) I X l (ṗν ∆qν − q̇ν ∆pν ) I X l (Pν ∆qν − Qν ∆pν ) ν=1 = ν=1 = ν=1 = ν=1 (9.69) Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆ exacta de alguna función de (q, p, t) que llamaremos −H: I X l (Pν ∆qν − Qν ∆pν ) = ν=1 I −∆H = − Z X l ∂H ν=1 ∂H ∆qν + ∆pν ∂qν ∂pν (9.70) entonces, Pν = −∂H/∂qν ; Qν = ∂H/∂pν ; ν = 1, 2, ...l, con lo cual se concluye la prueba. Las transformaciones canónicas / 335 Teoremas de Stockes. En la teorı́a de campos vectoriales se muestra que la integral de lı́nea a lo largo de una curva rectificable es igual a la integral de superficie sobre la región encerrada por esa lı́nea del rotacional del vector: I Z Z ~ · dS ~ V~ · d~r = rotV (9.71) C S En términos de las componentes: Z Z X I X 3 3 ∂Vj Vi dxi = dSk ǫijk ∂xi C i=1 (9.72) S i,j,k=1 ~ que determina un donde ǫijk es el tensor de Levi-Civita. dSk es la componente de dS plano perpendicular a la dirección ~ek ; por tanto dSk = dxi dxj con i 6= j 6= k, o sea que: Z Z X I X 3 3 ∂Vj ∂Vi Vi dxi = dxi dxj (9.73) − ∂xi ∂xj C i=1 i<j=1 S En geometrı́a diferencial se llama a una integral sobre un contorno cerrado “integral relativa” y a una integral sobre una región que no es cerrada “integral absoluta”; una integral de lı́nea se llama de “primer orden” y una de superficie se llama “de segundo orden” porque aparecen uno y dos diferenciales respectivamente. En el espacio de fases, el teorema de Stockes toma la forma: Z Z X I X 2l 2l ∂Vj ∂Vi Vi ∆xi = ∆xi ∆xj (9.74) − ∂xi ∂xj C i=1 i<j=1 S donde x1 = q1 , ...xl = ql ; xl+1 = p1 , ...x2l = pl . Ası́, para l = 1, (9.74) es: Z Z I ∂A ∂B ∆q ∆p − (A∆q + B∆p) = ∂q ∂p C (9.75) S En particular, para A = p y B = 0, como es de esperarse: Z Z Z p ∆q = ∆p ∆q C (9.76) S La ecuación (9.74) puede escribirse como: I X l (Aν ∆qν + Bν ∆pν ) = C ν=1 Z Z " X l ∂Aν ∂Aµ ∆qµ ∆qν + − ∂qµ ∂qν µ<ν=1 S l X ∂Aµ ∂Bν ∆qµ ∆pν + − ∂qµ ∂qν µ,ν=1 # l X ∂Bν ∂Aµ ∆pµ ∆pν − ∂pµ ∂pν µ<ν=1 (9.77) 336 / Mecánica clásica avanzada Para Aν = pν y Bν = 0, se cumple: I X Z Z X l l pν ∆qν = ∆pν ∆qν C ν=1 (9.78) S ν=1 En general, una integral relativa de orden 2ν − 1, de orden impar, puede escribirse como una integral absoluta de orden par 2ν, para ν = 1, 2, ...l. Ası́ por ejemplo, se cumple que: Z Z X I X l l pν ∆qν = J2 = ∆qν ∆pν (9.79) I1 = S ν=1 ν=1 I3 = = Z Z Z l X pν ∆qν ∆pµ ∆qµ = J4 µ,ν=1 Z Z Z Z X l ∆qν ∆pν ∆qµ ∆pµ (9.80) µ,ν=1 I2l−1 = = Z Z Z Z Z ... Z ··· Z l X pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l ν1 , ν2 , ...νl =1 l X (9.81) ∆q1 ∆p1 ... ∆ql ∆pl ν1 , ν2 , ...νl =1 Se puede mostrar que I1 , I3 , ...I2l−1 son integrales universales invariantes. O sea que una integral universal invariante relativa de orden impar I2ν−1 puede representarse como una integral invariante absoluta de orden par J2ν . En 1947 Li Hua Chung probó que cualquier integral universal invariante difiere por un factor constante de una de las integrales (9.79), (9.80) o (9.81). Gantmacher presenta la demostración de que cualquier integral universal invariante relativa de primer orden es un múltiplo de I1 , para l = 1. Teorema de Li Hua Chung. Este teorema dice que si: ZZ Z h l X ··· Aµ1 ∆qµ1 ∆pµ2 ∆qµ2 ... I (ν) = Vν µ1 , µ2 , ...µl =1 ∆pµν ∆qµν + Bµ1 ∆pµ1 ∆pµ2 ∆qµ2 ... ∆pµν ∆qµν es una integral universal invariante relativa, entonces: I (ν) = CIν (9.82) i (9.83) donde C es una constante, e Iν es una de las l integrales universales invariantes de Poincaré. Vν es una variedad cerrada de ν dimensiones en el espacio de fases, donde Las transformaciones canónicas / 337 ν = 1, 3, ..,2l − 1. Notación vectorial en el espacio de fases. V~ denotará una matriz columna de l dimensiones con componentes Vν , ν = 1, 2, ...l. M̃ es una matriz cuadrada, l × l, con componentes Mµν . El gradiente de una función F respecto a las coordenadas y a los momentos, se denota respectivamente por: ∂F ∂F , ∂~q ∂~ p (9.84) y es un vector, o sea una matriz columna con componentes ∂F/∂qν y ∂F/∂pν respectivamente; ν = 1, 2, ...l. El gradiente de un vector es una matriz l × l, ası́: ! ! ~ ~ ∂Vµ ∂Vµ ∂V ∂V = = ; ; µ, ν = 1, 2, ...l (9.85) ∂~q ∂qν ∂~ p ∂pν µν µν El producto escalar de dos vectores es: ~ ·V ~ = U l X Uν Vν (9.86) ν=1 ~ , es un vector. y el producto de una matriz por un vector, M̃ V Prueba del teorema de Li Hua Chung para ν = 1. Usando la notación vectorial, se cumple que: I X l h i I ~ · ∆~q + B ~ · ∆~ p) Aν (~ q , p~, t)∆qν + Bν (~q, ~p, t)∆pν = (A I = ′ (9.87) C ν=1 Las ecuaciones de movimiento en el espacio de fases son: ∂H ∂H ˙ ; p~ = − q~˙ = ∂~ p ∂~q (9.88) La solución de las ecuaciones (9.88) es de la forma: q=~ ~ q (~ q0 , ~ p0 , t); p~ = p~(~ q0 , p~0 , t) (9.89) donde ~q0 y p~0 son los valores de ~ q y ~q para t = t0 . En el tiempo t = t0 definimos la curva cerrada C0 , constituida por un conjunto de estados simultáneos, caracterizada por un conjunto de parámetros (α): q0 = ~ ~ q (α); p~0 = ~ p0 (α); (αi ) ≤ (α) ≤ (αf ) (9.90) Los puntos que en t = t0 estaban sobre el contorno C0 , formarán un contorno C en algún otro instante de tiempo t. Los puntos del contorno C se obtienen reemplazando (9.90) en (9.89): q=~ ~ q (α, t); ~ p = p~(α, t); (αi ) ≤ (α) ≤ (αf ) (9.91) 338 / Mecánica clásica avanzada Poniendo (9.91) en (9.87) se obtiene a I ′ en función de t. De la invariancia de I ′ se sigue que dI ′ /dt = 0. Derivando a (9.87): I ′ ~˙ · ∆~q + A ~ · ∆~q˙ + B ~˙ · ∆~ ~ · ∆p~˙ = 0 ˙ A p+B (9.92) I = donde se usó la propiedad d(∆~q)/dt = ∆~q˙ . La ecuación (9.92) también se puede escribir como: I h i ~˙ · ∆~q + ∆(A ~ · ~q˙ ) − ∆A ~ · ~q˙ + B ~˙ · ∆~ ~ · p~˙ ) − ∆B ~ · p~˙ A p + ∆(B (9.93) I˙′ = Se cumple que: I C ~ ·~ ~ · ~q˙ ∆(A q˙ ) = A (αi ) =0 (9.94) (αf ) debido a que ~ q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por otra parte: ~ ~ ~ ~˙ = ∂ A · ~q˙ + ∂ A · ṗ + ∂ A A ∂~q ∂~p ∂t (9.95) ~ ~ ∂A ∂A · ∆~q + · ∆~ p ∂~q ∂~p (9.96) ~= ∆A Usando (9.95) y (9.96), obtenemos: ! I " ~ ~ ~ ∂A ∂A ∂A ′ ˙ ˙ I = · ∆~q − · ~q + · ṗ + ∂~q ∂~p ∂t + ~ ~ ~ ∂B ∂B ∂B · ~q˙ + · ṗ + ∂~q ∂~p ∂t ! · ∆~ p− ! ~ ~ ∂A ∂A · ∆~q + · ∆~ p · ~q˙ ∂~q ∂~p ! # ~ ~ ∂B ∂B · ∆~q + · ∆~ p · ~p˙ ∂~q ∂~p (9.97) Reagrupando términos y expresando a ~q˙ y ~p˙ por medio de (9.88) obtenemos: ! ! # I " ~ ~ ∂H ∂H ∂A ∂B ′ ˙ −Z̃ · ∆~q + −Z̃ · ∆~ p (9.98) I = + + ∂~q ∂t ∂~p ∂t donde la matriz Z̃ se define como: Z̃ = ~ ~ ∂A ∂B − ∂~ p ∂~q (9.99) Como I˙′ = 0, el integrando en (9.98) debe ser el diferencial de alguna función F : ∆F = ∂F ∂F · ∆~q + · ∆~ p ∂~q ∂~p (9.100) Las transformaciones canónicas / 339 comparando (9.98) y (9.100) vemos que: ~ ∂F ∂H ∂A = −Z̃ + ; ∂~q ∂~q ∂t ~ ∂F ∂H ∂B = −Z̃ + ∂~p ∂~p ∂t (9.101) En términos de componentes (9.101) toma la forma: l l λ=1 λ=1 X X ∂F ∂H ∂H ∂Aν ∂Bν ∂F =− Zνλ + =− Zνλ + ; ∂qν ∂qλ ∂t ∂pν ∂pλ ∂t (9.102) Como F ha de ser una función continua de ~q y p~ se debe cumplir: ∂2F ∂2F ∂2F ∂2F ∂2F ∂2F = ; = ; = ∂qµ ∂qν ∂qν ∂qµ ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂qν ∂qν ∂pµ (9.103) De (9.102) y (9.103) se sigue que: − X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂qµ ∂qλ ∂qµ ∂qλ ∂qµ ∂t − X ∂Zµλ ∂H X ∂ 2 Aµ ∂2H − + Zµλ ∂qν ∂qλ ∂qν ∂qλ ∂qν ∂t − X ∂Zνλ ∂H X ∂ 2 Bν ∂2H − + = Zνλ ∂pµ ∂pλ ∂pµ ∂pλ ∂pµ ∂t λ λ λ λ λ λ X ∂Zµλ ∂H X ∂ 2 Bµ ∂2H − − + Zµλ ∂pν ∂pλ ∂pν ∂pλ ∂pν ∂t λ λ − X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂pµ ∂qλ ∂pµ ∂qλ ∂pµ ∂t − X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ − + Zµλ ∂qν ∂pλ ∂qν ∂pλ ∂qν ∂t λ λ (9.104) λ λ En (9.104) consideremos los casos µ = ν y µ 6= ν. Para µ = ν se tiene sólo una relación no trivial, la tercera: X ∂Zνλ ∂H ∂2H ∂2H Zνλ ∂H − − + Zνλ − Zνλ ∂pν ∂qλ ∂qν ∂pλ ∂pν ∂qλ ∂qν ∂pλ λ 2 2 ∂ ∂ Aν ∂ Bν + =0 (9.105) − ∂t ∂pν ∂qν Como H es arbitrario, (9.105) se cumple sólo si: Zνλ = Zνν δνλ ; ∂Zνν ∂Zνν ∂Zνν = 0; = 0; =0 ∂pν ∂qν ∂t (9.106) 340 / Mecánica clásica avanzada Para µ 6= ν y usando (9.106), las relaciones (9.104) quedan: − ∂Zνν ∂H ∂2H ∂ 2 Aν − Zνν + = ∂qµ ∂qν ∂qµ ∂qν ∂qµ ∂t − ∂2H ∂ 2 Aµ ∂Zµµ ∂H − Zµµ + ∂qν ∂qµ ∂qν ∂qµ ∂qν ∂t − ∂2H ∂ 2 Bν ∂Zνν ∂H − Zνν + = ∂pµ ∂pν ∂pµ ∂pν ∂pµ ∂t (9.107) ∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + − ∂pν ∂pµ ∂pν ∂pν ∂pν ∂t − ∂2H ∂ 2 Aν ∂Zνν ∂H − Zνν + = ∂pµ ∂qν ∂pµ ∂qν ∂pµ ∂t − ∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + ∂qν ∂pµ ∂qν ∂pµ ∂qν ∂t Las ecuaciones (9.107) pueden escribirse ası́: − ∂Zνν ∂H ∂Zµµ ∂H ∂2H + + (Zµµ − Zνν ) ∂qµ ∂qν ∂qν ∂qµ ∂qµ ∂qν + ∂ ∂t − ∂Zµµ ∂H ∂2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂pν ∂ + ∂t ∂Aν ∂Aµ − ∂qµ ∂qν ∂Bν ∂Bµ − ∂pµ ∂pν =0 (9.108) =0 − ∂Zµµ ∂H ∂ 2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂qν ∂qν ∂pµ ∂pµ ∂qν + ∂ ∂t ∂Aν ∂Bµ − ∂pµ ∂qν =0 Las transformaciones canónicas / 341 Como H es arbitrario, de (9.108) se sigue que: ∂Zνν ∂Zµµ = 0; = 0 ; Zµµ = Zνν ∂qµ ∂pµ ∂ ∂t ∂ ∂t ∂Aν ∂Aµ − ∂qµ ∂qν ∂Aν ∂Bµ − ∂pµ ∂qν = 0; ∂ ∂t ∂Bν ∂Bµ − ∂pµ ∂pν =0 (9.109) =0 Las relaciones (9.106) y (9.109) nos dan que para todos µ, ν, se cumple: Zνλ = Z δνλ ; ∂Z ∂Z = 0; =0 ∂qν ∂pν ∂Z = 0 ⇒ Z = constante ∂t ∂ ∂Bν ∂Aµ ∂Bµ ∂ ∂Aν = 0; =0 − − ∂t ∂qµ ∂qν ∂t ∂pµ ∂pν ∂ ∂t ∂Aν ∂Bµ − ∂pµ ∂qν (9.110) =0 donde Z = Zνν . Para µ = ν cumple Zµν = 0, o sea: ∂Bµ ∂Aµ = ; ∂pν ∂qν µ=ν reemplazando (9.111) en la última igualdad (9.110) se obtiene: ∂ ∂Aν ∂Aµ =0 − ∂t ∂pµ ∂pν (9.111) (9.112) La ecuación (9.112) y la primera igualdad (9.110) nos dan: ∂ ∂Aν ∂ ∂Aµ ∂ ∂Aν ∂ ∂Aµ = ; = ∂pµ ∂t ∂pν ∂t ∂qµ ∂t ∂qν ∂t (9.113) Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma: Aν = ∂f (q, t) ∂g(p, t) + ∂qν ∂pν (9.114) donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relaciones similares a (9.113), por tanto: Bν = ∂f ′ (q, t) ∂g ′ (p, t) + ∂qν ∂pν (9.115) 342 / Mecánica clásica avanzada ~ y B ~ para Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A que (9.87) sea una integral universal invariante. Se cumple entonces que, para µ 6= ν: ∂Aν ∂Aµ ∂2f ∂2f − = − =0 ∂qµ ∂qν ∂qµ ∂qν ∂qν ∂qµ ∂Bµ ∂ 2g′ ∂ 2g′ ∂Bν − = − =0 ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ (9.116) ∂Bµ ∂Aν ∂Aµ ∂2g ∂2g ∂Aν − = − = − =0 ∂pµ ∂qν ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ Para µ = ν las dos primeras igualdades en (9.116) siguen siendo válidas, en tanto que la tercera se reemplaza por: ∂Aν ∂Bν − = Zνν = C ∂pν ∂qν (9.117) Por tanto, (9.116) y (9.117) nos dan para todos µ, ν: ∂Aν ∂Aµ = ; ∂qµ ∂qν ∂Bν ∂Bµ = ; ∂pµ ∂pν ∂Aν ∂Bµ − = Cδµν ∂pµ ∂qν (9.118) También podemos escribir a (9.118) ası́: ∂Aν ∂Aµ = ; ∂qµ ∂qν ∂Bν ∂Bµ = ; ∂pµ ∂pν ∂ ∂Bµ (Aν − Cpν ) = ∂pµ ∂qν (9.119) Las expresiones (9.119) nos dicen que debe existir cierta función Φ(~q, ~p, t) tal que: ∆Φ = ∂Φ ∂Φ ~ − C~ ~ · ∆~ · ∆~q + · ∆~ p = (A p) · ∆~q + B p ∂~q ∂~p (9.120) puesto que: ∂Φ ∂Φ = Aν − C pν ; = Bν ∂qν ∂pν (9.121) Lo anterior implica que se cumplan las relaciones (9.119) a fin de que Φ sea continua. Se tiene entonces que: I I I ~ ~ (A · ∆~ q + B · ∆~ p) = C~ p · ∆~q + ∆Φ (9.122) La integral universal invariante (9.87) es entonces igual a: I I ′ ~ ~ I = (A · ∆~ q + B · ∆~ p) = C p~ · ·∆~q = CI1 (9.123) lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado ~ yB ~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea que A una integral universal invariante. Esta prueba es una generalización para l grados de libertad de la presentada en Gantmacher para l = 1. Las transformaciones canónicas / 343 9.5. Las transformaciones canónicas En la sección 4.5 se dio la definición de una transformación canónica como una transformación de coordenadas en el espacio de fases 2l-dimensional, que en general puede depender del tiempo y que no cambia la forma de las ecuaciones de Hamilton. Allı́ derivamos las fórmulas de la transformación a partir de la segunda forma del principio de Hamilton. Aquı́ usaremos la invariancia de la integral de Poincaré-Cartán y el teorema de Li Hua Chung. La función generatriz de una transformación canónica. Sean dos espacios de fase 2l dimensionales (q, p), (q, p). La transformación canónica establece una correspondencia biunı́voca entre los puntos de estos dos espacios en cada instante t: q ν = q ν (q, p, t) ; J pν = pν (q, p, t) ; q 1 , q 2 , ...q l , p1 , p2 , ... pl q1 , q2 , ...ql , p1 , p2 , ... pl ν = 1, 2, ...l 6= 0 (9.124) (9.125) Un conjunto de trayectorias rectas en el espacio (q, p) está definido por el sistema de ecuaciones diferenciales: ∂H(q, p, t) dpν ∂H(q, p, t) dqν ; ; = =− dt ∂pν dt ∂qν ν = 1, 2, ...l (9.126) A cada una de las trayectorias definidas por (9.126) la transformación canónica le hace corresponder una trayectoria recta en el espacio (q, p), definida por el sistema de ecuaciones diferenciales: dq ν ∂H(q, p, t) dpν ∂H(q, p, t) = ; =− ; ν = 1, 2, ...l dt ∂pν dt ∂q ν (9.127) Sea un “tubo” de trayectorias en el espacio de fases y sea C un contorno arbitrario que rodea ese tubo de trayectorias en el espacio (q, p). En el espacio (q, p) en virtud de la transformación habrá otro tubo de trayectorias rectas y C es un contorno que corresponde a C. C0 y C 0 son los contornos definidos por un conjunto de estados simultáneos, t = constante, y que se corresponden mediante la transformación. C0 y C 0 están dadas por ecuaciones paramétricas del tipo de (9.64), y C y C por ecuaciones como (9.17). Es decir, C 0 y C0 obedecen a: C : t= t(α) ; qν = qν (α) ; pν = pν (α) (9.128) C0 : t = t(α) = constante ; qν = qν (α) ; pν = pν (α) ; ν = 1, 2, ...l y análogamente para C 0 y C. Como las trayectorias son hamiltonianas en (q, p) y en (q, p), se sigue de la invariancia de la integral de Poincaré-Cartán, (9.25), que: ! I I l l X X pν ∆qν (9.129) pν ∆qν − H ∆t = C ν=1 C0 ν=1 344 / Mecánica clásica avanzada I C l X ν=1 pν ∆q ν − H ∆t ! = I l X C 0 ν=1 pν ∆q ν (9.130) Como t es invariante bajo una transformación canónica, se sigue que el lado derecho de (9.129) está evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la H Pl integral universal invariante ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de la transformación canónica (9.124), obtenemos: I l X C 0 ν=1 pν ∆q ν = I l X C0 ν=1 " l X µ=1 ∂qµ pµ ∂qν ! l X ∆qν + µ=1 ∂q µ pµ ∂pν ! ∆pν # (9.131) La ecuación (9.131) es de la forma de (9.87): es una cierta integral universal invariante de primer orden en el espacio (p, q). Por el teorema de Li Hua Chung, el invariante obtenido puede diferir de I1 sólo por un factor constante C, ecuación (9.123): I l X C 0 ν=1 pν ∆q ν = C I X l pν ∆qν (9.132) C ν=1 de las ecuaciones (9.129), (9.130) y (9.132) se sigue entonces que: ! ! I I l l X X pν ∆qν − H ∆t pν ∆q ν − H ∆t = C C C ν=1 (9.133) ν=1 Si en la primera integral expresamos a (q, p) en función de las (q, p), la trayectoria de integración C será reemplazada por C, por lo cual podemos escribir a (9.133) como: ! !# I " X l l X pν ∆q ν − H ∆t − C pν ∆qν − H ∆t =0 (9.134) C ν=1 ν=1 C es un contorno arbitrario en el espacio (q, p), o sea que el integrando en (9.134) debe ser la diferencial exacta ∆ de alguna función de (q, p, t), que llamaremos −F (q, p, t). Por tanto podemos escribir: ! ! l l X X pν ∆q ν − H ∆t (9.135) ∆F = C pν ∆qν − H ∆t − ν=1 ν=1 donde además se tiene que: ∆F = l X ∂F ν=1 ∂F ∆qν + ∆pν ∂qν ∂pν + ∂F ∆t ∂t (9.136) Pl Como ν=1 pν ∆q ν − H ∆t no es un diferencial exacto, o sea no es igual a −∆F , se sigue que C nunca es cero. La función F se llama la función generatriz y la constante C Las transformaciones canónicas / 345 la valencia de la transformación canónica (9.124). La transformación canónica se llama univalente, o simplemente transformación canónica cuando C = 1. Algunos autores llaman las transformaciones canónicas con C 6= 1 transformaciones canónicas extendidas. En conclusión, una condición necesaria y suficiente para que la transformación (9.124) sea canónica es la existencia de una función generatriz F y alguna constante C para las cuales la ecuación (9.135) se satisfaga idénticamente en virtud de la transformación (9.124). Es de notarse que la ecuación (9.135) vale para toda transformación canónica independientemente de cuál sea la función H: vale para todo sistema hamiltoniano, o sea F no depende de H. Esto se prueba fácilmente para un hamiltoniano arbitrario H1 definiendo a H 1 de modo que H 1 − H = C(H1 − H), con lo cual se llega a que (9.135) vale también para H 1 y H1 . Formas alternas de definir la función generatriz de una transformación canónica. El principio de Hamilton modificado también puede expresarse como: ! Z t2 l X − qν ṗν − H dt = 0 (9.137) δ t1 ν=1 puesto que las ecuaciones de Euler-Lagrange correspondientes al principio variacional (9.137) son las ecuaciones de Hamilton o ecuaciones de movimiento en el espacio de fases. En lugar de (9.22) podemos escribir: ∆S̃ = − l X ν=1 qν ∆pν − H∆t ! t2 (9.138) t1 Consecuentemente se obtiene la siguiente forma para la integral invariante de Poincaré-Cartán, (9.25): I= I − l X ν=1 qν ∆pν − H∆t ! (9.139) Es fácil ver que (9.139) se puede derivar directamente de (9.25) mediante la transformación canónica ~ q → −~ p, p~ → q~. Se sigue entonces que además de (9.129) son posibles las siguientes relaciones: ! I I l l X X − qν ∆pν − qν ∆pν − H∆t = C I C C0 ν=1 − l X q ν ∆pν − H∆t ν=1 ! = I ν=1 (9.140) C0 − l X q ν ∆pν ν=1 P Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con el teorema de Li Hua Chung, podemos obtener además de (9.132) las siguientes tres 346 / Mecánica clásica avanzada relaciones, que nos darán otras tres expresiones para la función generatriz completamente equivalentes (9.135): I I I C0 C0 l X pν ∆q ν = C l X q ν ∆pν = C C 0 ν=1 − − ν=1 l X q ν ∆pν = C ν=1 I I I C0 − l X qν ∆pν ν=1 l X (9.141) pν ∆qν C0 ν=1 C0 − l X qν ∆pν ν=1 Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qué ser la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la función generatriz de la transformación canónica por un procedimiento igual al que conduce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones (9.141) son equivalentes a: ! ! I I l l X X qν ∆pν − H∆t (9.142) − pν ∆q ν − H∆t = C C I C I C C ν=1 − l X − l X ν=1 ν=1 q ν ∆pν − H∆t ! q ν ∆pν − H∆t ! =C ν=1 I l X C =C ν=1 I − C pν ∆qν − H∆t l X ν=1 ! qν ∆pν − H∆t (9.143) ! (9.144) de (9.144) se sigue que: ∆F = C ∆F = C − l X ν=1 l X ν=1 ∆F = C − qν ∆pν − H∆t ! − qν ∆pν − H∆t ! pν ∆qν − H∆t l X ν=1 ! − l X ν=1 − − l X ν=1 − pν ∆q ν − H∆t ! (9.145) q ν ∆pν − H∆t ! (9.146) l X ν=1 q ν ∆pν − H∆t ! (9.147) Las transformaciones canónicas libres. En el conjunto de todas las transformaciones canónicas hay una clase que se puede caracterizar por la siguiente propiedad: su función generatriz puede expresarse como una función de un conjunto de (2l) variables independientes que pueden ser (q q), (q p), (p q) o (p p). A estas transformaciones las llamaremos transformaciones canónicas libres de la primera, segunda, tercera y cuarta Las transformaciones canónicas / 347 clase respectivamente. Es posible que una transformación canónica dada sea a la vez canónica libre de más de una clase. En (3.20) encontramos transformaciones canónicas libres de la primera clase. Ejemplo 9.5.1 Demostrar que la transformación canónica (4.134), para l = 1, es libre de primera clase: 1 p p2 2 p = mω q + ; q = −tan−1 (9.148) 2 mω 2 mωq Las fórmulas de transformación pueden escribirse en la forma: p = mωq tan q ; p= 1 mωq 2 sec2 q 2 o sea que es libre de la primera clase. También se puede escribir como: s r mωq 2 2p −1 q = cos ; p = −mω − q2 2p mω (9.149) (9.150) o sea que también es libre de la segunda clase. Es fácil ver que también es libre de tercera y cuarta clase. Ejemplo 9.5.2 Demostrar que la transformación identidad es canónica de segunda y tercera clase pero no es de primera ni de cuarta clase. La transformación identidad es: q ν = qν ; pν = pν ; ν = 1, 2, ...l (9.151) Esta transformación puede escribirse en cualquiera de las formas siguientes: qν = qν ; pν = pν qν = q ν ; pν = pν ; (9.152) ν = 1, 2, ...l o sea que sólo es posible tomar independientes a (q, p) o a (q, p). Esta transformación es canónica de segunda y tercera clase pero no es de primera ni de cuarta clase. Ejemplo 9.5.3 Mostrar que la transformación que intercambia coordenadas y momentos y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera clase: qν = pν = 1 p β ν αpν ; qν = βqν ; 1 pν = q ν ; α (9.153) ν = 1, 2, ...l Ejemplo 9.5.4 Mostrar que la transformación canónica q = −αp/q, p = q 2 /2α, con l = 1, es una transformación canónica libre de primera y de cuarta clase pero no de segunda ni de tercera clase: 348 / Mecánica clásica avanzada q= αp ; −√ 2αp p= q2 ; 2α q= p 2αp (9.154) qq p=− α Las transformaciones canónicas libres de primera clase se caracterizan porque (p, p) se pueden expresar en función de (q, q). Esto dice que las (p) dependen de (q), o sea que: q 1 , q 2 , ...q l 6= 0 (9.155) J p1 , p2 , ...pl En este caso la función generatriz F (q, p, t) puede representarse mediante una función de (q, q) que llamaremos F1 : F (q, p, t) = F1 (q, q, t) (9.156) De (9.135) y (9.156) se sigue que: ∆F1 (q, q, t) = C l X ν=1 pν ∆qν − H∆t ! − l X ν=1 pν ∆q ν − H∆t ! (9.157) Como para estas transformaciones ∆qν y ∆q ν son todos independientes se sigue entonces que: ∂F1 = Cpν ; ∂qν ∂F1 = −pν ; ∂qν ν = 1, 2, ...l ∂F1 = H − CH ∂t (9.158) (9.159) Las ecuaciones (9.158) definen la transformación canónica bajo consideración, esto es, ellas pueden reducirse a la forma (9.124). Con ello probaremos que toda transformación canónica libre de primera clase define una función F1 (q, q, t) y que a cada función F1 (q, q, t) le corresponde una transformación canónica libre de primera clase. Debemos mostrar que es posible resolver las ecuaciones (9.158) para expresar a (q, p) en función de (q, p). Empecemos por mostrar que todas las derivadas parciales ∂F1 /∂qν son independientes. Supongamos que no lo fueran, es decir, que pudiéramos encontrar una expresión para una de ellas en función de las demás. Ello requerirı́a que exista una función Ω diferente de cero tal que: ∂F1 ∂F1 ∂F1 (9.160) , , ... , q1 , q2 , ...ql = 0 Ω ∂q1 ∂q2 ∂ql donde en (9.160) los (q) son tomados como parámetros. De (9.158) se sigue: Ω(Cp1 , Cp2 , ...Cpl , q1 , q2 , ...ql ) = 0 (9.161) como (q, p) son cantidades independientes, se sigue de (9.161) que Ω ≡ 0 y en consecuencia las ∂F1 /∂qν son independientes, consideradas como funciones de las variables Las transformaciones canónicas / 349 q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l cantidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es idénticamente cero: 2 ∂ F1 ∂F1 /∂~q 6= 0 (9.162) = det J q ~ ∂~q ∂~q De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l) pueden expresarse en función de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuación (9.162) también permite que en (9.158) las l últimas ecuaciones sean resueltas para qν en función de las q ν , pν . En conclusión, las ecuaciones (9.158) definen una transformación canónica libre de primera clase con función generatriz y valencia dadas, F1 y C 6= 0, en tanto que la fórmula (9.159) permite relacionar las funciones hamiltonianas H y H, que serán proporcionales sólo en el caso en que la transformación canónica no dependa explı́citamente del tiempo. Podemos decir que la clase de las transformaciones canónicas libres de primera clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la condición (9.162) y las diferentes valencias C 6= 0, y usando las fórmulas (9.158). Para las transformaciones canónicas libres de primera clase univalentes (C = 1), (9.158) y (9.159) toman la forma más simple: ∂F1 ∂F1 ∂F1 = pν ; = −pν ; ν = 1, 2, ...l ; H = H + ∂qν ∂qν ∂t (9.163) La última ecuación (9.163), dice que H − H no depende del sistema hamiltoniano especı́fico que se tenga sino simplemente de cuál es la transformación canónica, que puede ser definida sin hacer referencia a la forma del hamiltoniano. La discusión de los otros tipos de transformaciones canónicas libres es completamente análoga a la de las transformaciones canónicas libres de primera clase. Las fórmulas son las siguientes, que se obtienen usando las formas (9.145), (9.146) y (9.147) para la función generatriz. En las Transformaciones Canónicas (T.C.) libres de segunda clase (q, p) son independientes, luego: ! ~p J 6= 0 (9.164) p~ Como (q, p) son independientes, (9.146) permite escribir: ∂F2 ∂F2 = Cpν ; = q ν ; ν = 1, 2, ...l ∂qν ∂pν (9.165) ∂F2 = H − CH ∂t (9.166) donde F2 es función de (q, p, t) y satisface la condición: 2 ∂ F2 6= 0 det ∂~q ∂~p (9.167) 350 / Mecánica clásica avanzada En las T.C. libres de tercera clase (p, q) son independientes, luego: ! ~q 6= 0 J q ~ (9.168) como (p, q) son independientes, (9.145) permite escribir: ∂F3 ∂F3 = −Cqν ; = −pν ; ν = 1, 2, ...l ∂pν ∂qν (9.169) ∂F3 = H − CH ∂t (9.170) donde F3 es función de (p, q, t) y satisface la condición: 2 ∂ F3 6= 0 det ∂~ p ∂~q En las T.C. libres de cuarta clase (p, p) son independientes, luego: ! ~p J 6= 0 q ~ (9.171) (9.172) Como (p, p) son independientes, (9.147) permite escribir: ∂F4 = −Cqν ; ∂pν ∂F4 = qν ; ∂pν ν = 1, 2, ...l ∂F4 = H − CH ∂t donde F4 es función de (p, p, t) y satisface la condición: 2 ∂ F4 6= 0 det ∂~ p ∂~p (9.173) (9.174) (9.175) Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, además de (q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q), (p, p). En cada uno de estos cuatro casos decimos que la transformación canónica es libre. Una transformación canónica arbitraria es no libre y obedece fórmulas de transformación en términos de una función generatriz que veremos más adelante y de las cuales (9.158) y (9.164) a (9.175) no son más que casos particulares. Ejemplo 9.5.5 Hallar la función generatriz del tipo F2 para la transformación canónica (9.148). Usando (9.146) y (9.150) obtenemos: ∆F2 = C(p ∆q − H ∆t) − (−q ∆p − H ∆t) = Cp ∆q + q ∆p (9.176) Las transformaciones canónicas / 351 La última igualdad en (9.176) se sigue de que la transformación no depende del tiempo. También: s r 2p mωq 2 −1 ∆F2 = C(−mω)∆q − q 2 + ∆p cos (9.177) mω 2p Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la transformación es univalente, o sea C = 1. La función generatriz es: s r mωq 2 2p 1 −1 F2 (q, p) = p cos − mωq − q2 (9.178) 2p 2 mω Para esta misma transformación se cumple que: q=− p p2 cot q ; p = csc2 q mω 2mω (9.179) Entonces para una función generatriz del tipo F3 se cumple: p p2 ∂F3 ∂F3 = cot q ; =− csc2 q ∂p mω ∂q 2mω (9.180) donde hemos usado (9.169) con C = 1. Es claro que: ∆F3 = = 1 (2p cot q ∆p − p2 csc2 q ∆q) 2mω 1 2 ∆ p cotq 2mω (9.181) con lo cual: F3 = p2 cot q 2mω (9.182) similarmente hallamos para F4 : F4 = p2 p p 2mωp − p2 + p sen−1 √ 2mω 2mωp (9.183) En sı́ntesis, las funciones generatrices de la transformación canónica (3.107) son: 1 F1 = − mωq 2 tan q 2 s r mωq 2 2p 1 2 −1 − mωq −1 F2 = p cos 2p 2 mωq 2 p2 cot q F3 = 2mω r s p2 2mωp p2 −1 − 1 + F4 = p sen 2mω p2 2mωp (9.184) 352 / Mecánica clásica avanzada Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformación canónica identidad. Sabemos que no existen funciones del tipo F1 o F4 . La transformación no depende del tiempo, luego, de (9.146) y (9.152): ∆F2 = C l X pν ∆qν + ν=1 l X q ν ∆pν = C ν=1 l X pν ∆qν + ν=1 l X qν ∆pν (9.185) ν=1 de la condición ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformación debe ser univalente, en consecuencia: ∆F2 = l X (pν ∆qν + qν ∆pν ) = ∆ ν=1 l X q ν qν (9.186) ν=1 Por tanto: F2 = l X pν qν (9.187) ν=1 Similarmente: F3 = − l X q ν pν (9.188) ν=1 Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformación canónica de cambio de escala e intercambio de coordenadas y momentos (9.153). Sabemos que F2 y F3 no existen para esa transformación. El resultado es: C = −α β ; C = −α β ; F1 = −β F4 = α l X q ν qν (9.189) ν=1 l X pν pν (9.190) ν=1 Ejemplo 9.5.8 Hallar las funciones generatrices de la transformación de cambio de escala: q ν = αqν ; pν = βpν C = α β ; F2 = α l X pν qν (9.191) ν=1 C = α β ; F3 = −β l X ν=1 q ν pν (9.192) Las transformaciones canónicas / 353 Ejemplo 9.5.9 Sea una transformación canónica libre de primera clase (q, p) → (q, p) con generatriz F1 (q, q, t). Mostrar que la transformación inversa (q, p) → (q, p) también es canónica, y hallar la correspondiente función generatriz. La transformación original satisface: ! l X ∆F1 = C pν ∆qν − H ∆t − ν=1 l X ν=1 pν ∆q ν − H ∆t ! ∂F1 ∂F1 ∂F1 = Cpν ; = −pν ; ν = 1, 2, ...l ; = H − CH ∂qν ∂qν ∂t (9.193) (9.194) La desigualdad (9.162) garantiza que las dos últimas ecuaciones (9.194) se pueden resolver para (q) en función de (p), tomando (q) como parámetros, con lo cual se pueden expresar (p, q) en función de (q, p), o sea que las ecuaciones (9.124) se pueden invertir. Esto prueba que la transformación inversa existe, la cual además es canónica. Para la transformación inversa: ! ! l l X X i i pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.195) ∆F1 = C ν=1 ν=1 ∂F1i ∂F1i = C i pν ; = −pν ; ∂q ν ∂qν ν = 1, 2, ...l ; ∂F1i = H − CiH ∂t (9.196) comparando (9.194) y (9.196) vemos que: − ∂F1i 1 ∂F1 = ; ∂qν C ∂qν − ∂F1 1 ∂F1i = i ∂qν C ∂qν Ci ∂F1 ∂F1i + ∂t ∂t = (−CC i + 1)H C ∂F1i ∂F1 + ∂t ∂t = (−CC i + 1)H (9.197) De (9.197) se sigue que: F1 = −CF1i ; F1i = −C i F1 ; Ci = 1 C (9.198) 1 F1 (q, q, t) ; C Ci = 1 C (9.199) o más explı́citamente: F1i (q, q, t) = − Para una transformación canónica libre univalente de primera clase se cumple simplemente: F1i (q, q, t) = −F1 (q, q, t) (9.200) 354 / Mecánica clásica avanzada o sea que la función generatriz de la transformación canónica inversa es el negativo de la función generatriz de la T.C. original. Para una transformación canónica arbitraria, se cumplen las expresiones siguientes para las funciones generatrices F y F i , aunque no se cumplen las fórmulas (9.194) y (9.196): ! ! l l X X ∆F (q, p, t) = C pν ∆q ν − H ∆t (9.201) pν ∆qν − H ∆t − ν=1 i ∆F (q, p, t) = C i l X ν=1 ν=1 pν ∆q ν − H ∆t ! l X − ν=1 pν ∆qν − H ∆t La ecuación (9.202) también se puede escribir como: ! l 1 X 1 i − i ∆F (q, p, t) = pν ∆qν − H ∆t − C C i ν=1 l X ν=1 ! (9.202) ! pν ∆q ν − H ∆t(9.203) de donde se llega al resultado general: F i (q, p, t) = − 1 1 F (q, p, t) ; C i = C C (9.204) Ejemplo 9.5.10 Mostrar que el resultado de dos transformaciones canónicas sucesivas es una transformación canónica. El generador de la transformación resultante es la suma de los generadores de las transformaciones separadas. Si las transformaciones son libres de primera clase: (a+b) F1 (a) (b) (q, q, t) = F1 (q, q, t) + F1 (q, p, t) (9.205) donde a es la transformación (q, p) → (q, p) y b es la transformación (q, p) → (q, p); a + b representa la transformación combinada (q, p) → (q, p). Ejemplo 9.5.11 Mostrar que la realización de tres transformaciones canónicas sucesivas es asociativa. Para transformaciones libres de primera clase esto se expresa ası́: (a+b)+c a+(b+c) q, q, t q, q, t = F1 F1 lo que se sigue de la propiedad (9.205): a+(b+c) (a) (b+c) q, q, t = F1 (q, q, t) + F1 F1 q, q, t = (a) F1 (q, q, t) + donde c es la transformación (q, p) → (q, p). (b) F1 q, q, t + (c) F1 q, q, t (9.206) (9.207) Las transformaciones canónicas / 355 Las ecuaciones (9.205), (9.206) y (9.207) valen también para transformaciones canónicas arbitrarias. Significado de la valencia de una transformación canónica. Sea la transformación de cambio de escala (9.191) y una transformación canónica univalente arbitraria. Si esas dos transformaciones se realizan en sucesión, las respectivas funciones generatrices se pueden escribir como: ∆Fc.e. = αβ l X ν=1 ∆Fµ.v. = l X ν=1 pν ∆qν − H ∆t pν ∆q ν − H ∆t ! ! − − l X ν=1 l X ν=1 pν ∆q ν − H ∆t pν ∆q ν − H ∆t ! ! (9.208) (9.209) Entonces la propiedad (9.205), permite escribir para la función generatriz de la transformación completa: ∆Fµ.v. = αβ l X ν=1 pν ∆qν − H ∆t ! − l X ν=1 pν ∆q ν − H ∆t ! (9.210) O sea que cualquier transformación canónica no univalente puede suponerse compuesta de una transformación de cambio de escala donde c = αβ seguida de una transformación univalente. Lo anterior permite que en la práctica se usen sólo las transformaciones canónicas univalentes. El grupo de las transformaciones canónicas. El conjunto de todas las transformaciones canónicas de un sistema de l grados de libertad es un conjunto infinito no contable. Este conjunto posee la estructura algebraica de grupo: (i) Hay una ley de composición interna, mediante la cual a dos transformaciones canónicas se les puede asociar una tercera; es decir, está definida la suma de dos transformaciones canónicas para dar una transformación canónica, ecuación (9.205). (ii) Existe la transformación canónica identidad, ecuación (9.189). (iii) La transformación inversa de una transformación canónica dada existe y es canónica, (9.204). (iv) La realización de transformaciones canónicas sucesivas es asociativa, (9.206). Por todo lo anterior podemos decir que la forma de las ecuaciones canónicas es invariante con respecto al grupo de las transformaciones canónicas. La integral de Poincaré-Cartán, las integrales invariantes de Poincaré, los corchetes de Poisson y otras cantidades también poseen esta propiedad de invariancia bajo el grupo de las transformaciones canónicas. Relación entre las diferentes funciones generatrices de transformaciones canónicas libres. Interpretación en términos de transformaciones de Legendre. En la sección (4.1) se definió la transformación de Legendre. Sea una transformación 356 / Mecánica clásica avanzada canónica libre de primera clase, univalente, las fórmulas de transformación se obtienen de: pν = ∂F1 ∂F1 ; −pν = ; ν = 1, 2, ...l ∂qν ∂qν (9.211) Usando la notación de la sección 4.1, sea (x) = (q); (α) = (q, t); (y) = (p) y X = F1 . Entonces (9.211) se pueden escribir como: yν = ∂X ∂X ∂X(x, α) ; −pν = ; H −H = ∂xν ∂q ν ∂t (9.212) Podemos interpretar, pues, a F1 , como el generador de la transformación de Legendre (q) → (p). El generador de la transformación de Legendre inversa, (y) → (x) es Y (y, α), tal que: Yν = l X ν=1 xν yν − X ; xν = ∂Y ∂yν (9.213) donde además se satisface: ∂Y ∂X ∂Y ∂X =− → =− ; ∂αi ∂αi ∂q ν ∂qν ∂X ∂Y =− ∂t ∂t (9.214) ∂Y ∂t (9.215) se cumple, pues, que: qν = ∂Y ; ∂pν −pν = − ∂Y ; ∂qν H −H =− Si llamamos Y = −F 3(p, q, t), las ecuaciones (9.215) quedan ası́: qν = − ∂F3 ; ∂pν pν = − ∂F3 ; ∂qν H −H =− ∂F3 ∂t (9.216) que coinciden con las fórmulas (9.168) a (9.171). En conclusión, F1 y F3 están relacionadas mediante una transformación de Legendre: F3 = F1 − l X pν qν (9.217) ν=1 Con argumentos completamente análogos llegamos a: F2 = F1 + l X q ν pν l X q ν pν − (9.218) ν=1 F4 = F1 + ν=1 l X qν pν (9.219) ν=1 Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4 a partir de F1 para un oscilador armónico lineal. Comparar con las fórmulas (9.184). Las transformaciones canónicas / 357 Ejemplo 9.5.12 Verificar las expresiones (9.187) y (9.188) usando la transformación de legendre: F3 = F2 − l X ν=1 q ν pν − l X pν qν (9.220) ν=1 Usando (9.187) obtenemos: F3 l X = ν=1 l X = ν=1 (pν qν − q ν pν − pν qν ) (pν q ν − q ν pν − pν q ν ) = l X ν=1 −q ν pν (9.221) en efecto, (9.221) coincide con (9.188). Notación de las funciones generatrices. Corben-Stehle usan la siguiente notación para las funciones generatrices de las T.C. libres F1, 2, 3, 4 de Goldstein: F1 = φ(q, q, t) F2 = ψ ′ (q, p, t) (9.222) F3 = ψ(q, p, t) F4 = φ′ (q, p, t) Landau usa F1 = F y F2 = Φ. Las transformaciones puntuales. Una transformación de coordenadas llamada transformación puntual, puede escribirse como una transformación canónica. Las nuevas coordenadas son funciones de las viejas coordenadas pero no de los viejos momentos. Entonces en una transformación puntual pueden tomarse como independientes (p, q) o (p, q), o sea que una transformación puntual es libre de segunda y de tercera clase. Puede expresarse en las siguientes formas: q ν = fν (q, t) ; pν = ∂F2 ; ∂qν qν = − ∂F3 ; ∂pν pν = gν (q, p, t) qν = ∂F2 ∂pν pν = − ∂F3 ∂q ν (9.223) (9.224) (9.225) Se requiere entonces que F2 y F3 sean de la forma: F2 = l X ν=1 fν (q, t)pν (9.226) 358 / Mecánica clásica avanzada F3 = − l X fν−1 (q, t)pν (9.227) ν=1 donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para pν y pν : pν = l X ∂fµ (q, t) pν ∂qν µ=1 pν = l X ∂fµ−1 (q, t) pµ ∂q ν µ=1 (9.228) (9.229) Según lo anterior es claro que (p) y (p) estarán conectados por una transformación lineal que depende de las coordenadas que llamaremos T̃ de modo que en forma de matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma: p = T̃ (q, t)~p ; ~p = T̃ −1 (q, t)~ ~ p Tµν = −1 ∂fµν ∂fν −1 ; Tµν = ∂qµ ∂qµ (9.230) (9.231) Por poderse expresar en términos de funciones generatrices, la transformación puntual es canónica. Entonces, tanto las ecuaciones de Hamilton como las de Lagrange son covariantes bajo transformaciones puntuales. Las ecuaciones (9.223) y (9.228) pueden tomarse como las fórmulas de una transformación canónica puntual. Ejemplo 9.5.13 Sea un sistema de tres grados de libertad y la transformación de coordenadas cartesianas a coordenadas esféricas. Expresar esta transformación como transformación canónica. La transformación es: p r = x2 + y 2 + z 2 = fr (q) z θ = cos−1 p = fθ (q) 2 x + y2 + z 2 φ = tan−1 (9.232) y = fθ (q) x x = r senθ cos φ = fx (q) y = r senθ senφ = fy (q) z = r cos θ = fz (q) (9.233) Las transformaciones canónicas / 359 donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Además usamos la notación (fν−1 ) = (fx , fy , fz ). La función generatriz F2 , de acuerdo con (9.226) y (9.232) es: F2 (q, p) = = pr f r + pθ f θ + pφ f φ p z x2 + y 2 + z 2 + p2θ cos−1 p 2 x + y2 + z 2 −1 y +pφ tan x pr (9.234) Similarmente para F3 (q, p) tenemos: F3 (q, p) = = −px fx − py fy − pz fz (9.235) −px r senθ cos φ − py rsenθ senφ − pz r cos θ Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes fórmulas para la transformación de los momentos: y xz x pr − 2 pθ p +p px = p 2 φ 2 2 2 2 2 x + y x +y +z x + y (x2 + y 2 + z 2 ) x y yz pr + 2 pθ py = p pφ + p 2 x +y x2 + y 2 + z 2 x2 + y 2 (x2 + y 2 + z 2 ) (9.236) p x2 + y 2 pr − 2 px = p pθ 2 2 2 x + y2 + z 2 x +y +z z y similarmente: pr = px senθ cos φ + py senθ senφ + pz cos θ pθ = px r cos θ cos φ + py r cos θ senφ − pz r senθ pr = −px r senθ senφ + py rsenθ cos φ (9.237) Notemos que: p~2 = p2x + p2y + p2z = p2r + p2φ p2θ + r2 sen2 θ r2 Expresadas en términos de r, θ, φ, las matrices T̃ y T̃ −1 son: senφ 1 cos θ cos φ − senθ cos φ r r senθ cos φ 1 senθ senφ cos θ senφ T̃ (q) = r r senθ 1 0 cos θ − senθ r (9.238) (9.239) 360 / Mecánica clásica avanzada T̃ −1 senθ cos φ (q) = r cos θ cos φ −r senθ senφ cos θ senφ r cos θ senφ r senθ cos φ cos θ −r senθ 0 (9.240) ˜ Sin embargo T̃ −1 6= T̃ T , o sea que Se ve, como debe ser, que T̃ T̃ −1 = T̃ −1 T̃ = I. la transformación de los momentos no es ortogonal. Transformación puntual lineal. En este caso se tiene: qν = l X Sνµ qµ + bν = fν (q, t) (9.241) ν=1 donde asumimos que Sνµ y bν pueden depender explı́citamente del tiempo, aunque obviamente no dependen de (q) ni de (p). La transformación inversa es: qν = l X ν=1 −1 Sνµ q µ − bµ = fν−1 (q, t) (9.242) −1 donde Sνµ es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la transformación, y −F2 (q, p, t) = F3 (q, p, t) de la transformación inversa son: F2 (q, p, t) = l X Sµν pµ qν + µ,ν=1 F2 (q, p, t) = − l X l X b ν pν (9.243) ν=1 µ,ν=1 −1 Sµν q µ − b µ pν (9.244) La relación entre los momentos también será lineal: pν = l X Sµν pµ ; pν = l X −1 Sµν pµ (9.245) µ=1 µ=1 La “representación” de las coordenadas y la “representación” de los momentos. La transformación (q, p) → (p, −q) es canónica. De acuerdo con (9.189) puede ser generada por las funciones generatrices. F1 (q, q) = l X ν=1 q µ qν ; F4 (p, p) = l X pµ pν (9.246) ν=1 Como la transformación no depende del tiempo, H = H: H(q, p, t) = H(q, p, t) = H(−p, q, t) (9.247) Las transformaciones canónicas / 361 Ası́ por ejemplo, para un oscilador armónico lineal: H(q, p, t) = 1 2 k 2 q + p 2m 2 (9.248) Ciertamente en el formalismo hamiltoniano las ecuaciones de movimiento son covariantes. El contenido de esta transformación es el siguiente: en el espacio de configuración el estado del sistema se puede representar mediante dos puntos, o equivalentemente, mediante las coordenadas y velocidades generalizadas; la transformación nos dice que en el espacio de momentos también está toda la información requerida para describir el estado; en el espacio de momentos el estado se puede representar entonces mediante los momentos generalizados y sus derivadas temporales. Hallemos las ecuaciones de lagrange en el espacio de los momentos. Partimos de P l L = ν=1 pν q̇ν − H y usamos la transformación canónica generada por (9.246): ! l l l l X X X X pν q̇ν + pν q̇ ν − H − pν q̇ ν (9.249) L= pν q̇ν − H = ν=1 ν=1 ν=1 ν=1 El nuevo lagrangiano L estará entonces relacionado con L por: L= l X ν=1 pν q̇ ν − H = L − l X ν=1 l d X pν qν pν q̇ν − pν q˙ν = L − dt ν=1 (9.250) Como L y L difieren por una derivada total respecto al tiempo, el principio de Hamilton nos dice que las ecuaciones de movimiento son: d ∂L(p, ṗ, t) ∂L(p, ṗ, t) − = 0 ; ν = 1, 2, ...l ∂pν dt ∂ ṗν (9.251) lo cual coincide con el resultado (4.48) que se obtuvo con base en consideraciones sobre las transformaciones de Legendre. El paso del formalismo lagrangiano al hamiltoniano, sección 3.1, se realiza mediante la transformación pν = ∂L(q, q̇, t)/∂ q̇ν , que se expresa en términos de transformaciones de Legendre. Esta transformación tiene la forma de cierta transformación (p, q) → (p = q̇, q) en el espacio de fases. Podrı́amos investigar si es una transformación canónica donde los nuevos momentos sean las (q̇). También la transformación puede escribirse en una forma tal que q ν = q̇ν ; que es más útil en el contexto de las transformaciones canónicas pues permite interpretar a L(q, q̇, t) = L(q, q, t) como la función generatriz del tipo F1 de cierta transformación canónica. Es decir, L genera la transformación: pν = ∂L(q, q, t) ∂L(q, q, t) ∂L(q, q, t) ; pν = − ; H −H = ∂qν ∂q ν ∂t (9.252) que equivale a la transformación (q, ṗ) ↔ (−p, q̇). H es el hamiltoniano en las variables canónicas (q, ṗ) y H en las variables (−p, q̇). Si quisiéramos expresar esta transformación mediante una función generatriz del tipo F4 (p, p, t), dada de acuerdo con (9.219) por Pl Pl L(q, q, t)+ ν=1 (q ν pν −qν pν ) = L(q, q̇)− ν=1 (pν q̇ν +qν ṗν ), notamos que ese generador, de acuerdo con (9.250), serı́a precisamente la función que llamamos L(p, ṗ, t). 362 / Mecánica clásica avanzada Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que corresponden a los conjuntos de variables canónicas (q, ṗ) y (−p, q̇). Ejercicio 9.5.3 Analizar la transformación (q, p) ↔ (q, q̇) como una transformación en el espacio de fases, e investigar si es canónica. De serlo hallar la correspondiente función generatriz. La función generatriz de una transformación canónica arbitraria. En general, una transformación canónica es no libre, o sea que no se puede describir mediante funciones generatrices del tipo F1, 2, 3, 4 . Ası́ por ejemplo para un sistema de dos grados de libertad la transformación: q 1 = q1 , p1 = p1 , q 2 = p2 , p2 = −q2 (9.253) es canónica pero no se puede describir mediante una función generatriz de una transformación canónica libre, pues involucra una mezcla de los cuatro tipos. El tratamiento de estas transformaciones se basa en el lema de Carathéodory, cuya demostración está dada en el texto de Gantmacher, Lectures in analytical mechanics, sección 29. El enunciado del lema es el siguiente. Lema. Si hay 2l funciones independientes q 1 , q 2 , ...q l , p1 , p2 , ...pl de las 2l cantidades independientes q1 , q2 , ...ql , p1 , p2 , ...pl , entonces del conjunto de 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) siempre es posible escoger 2l cantidades independientes de tal manera que no hay ni un sólo par de cantidades conjugadas (qν , pν ) o (q ν , pν ) entre ellas. Tenemos entonces que de las 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) que están conectadas mediante la transformación canónica: ~q , ~p ) 6= 0 (9.254) q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l ; J( q, p es posible tomar las siguientes 2l cantidades independientes: q1 , q2 , ...qr , pr+1 , pr+2 , ...pl , q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl (9.255) 0 ≤ r ≤ l, 0 ≤ s ≤ l donde, de acuerdo con el lema de Carathéodory no hay ni un par de variables canónicamente conjugadas. Como la transformación es canónica existe cierta función F (q, p, t) tal que: ! ! l l X X ∆F = C pν ∆q ν − H ∆t (9.256) pν ∆qν − H ∆t − ν=1 ν=1 de acuerdo con (9.136). Es claro que igualmente podrı́amos haber usado cualquiera de las expresiones (9.145), (9.146) o (9.147), obteniéndose cuatro expresiones para F que sólo difieren por una transformación de Legendre. La expresión (9.256) usando (9.255) se puede separar ası́: ∆F = C r X ν=1 pν ∆qν +C l X ν=r+1 pν ∆qν − s X ν=1 pν ∆q ν − s X ν=s+1 pν ∆q ν + H − H ∆t (9.257) Las transformaciones canónicas / 363 Usando las siguientes expresiones: l X l X pν ∆qν = ∆ pν qν ν=r+1 ν=r+1 l X l X pν ∆q ν = ∆ ν=s+1 ! pν q ν ν=s+1 ! − ∆ F+ ν=s+1 C r X q ν pν − C pν ∆qν − ν=1 l X − qν pν ν=r+1 l X qν ∆pν ν=r+1 ν=s+1 l X q ν ∆pν (9.258) ν=s+1 ! = ! l l X X + − pν ∆q ν + q ν ∆pν ν=1 qν ∆pν ν=r+1 podemos escribir a (9.257) como: l X l X ! + H − CH ∆t (9.259) según (9.255), ∆qν (ν = 1, 2, ...r), ∆pν (ν = r + 1, r + 2, ...r), ∆q ν (ν = 1, 2, ...s), ∆pν (ν = s + 1, s + 2, ...l) son independientes y por tanto: C pν = −C qν = qν = −pν = H − CH = ∂U ; ∂qν ∂U ; ∂pν ∂U ; ∂pν ∂U ; ∂qν ν = 1, 2, ...r ν = r + 1, r + 2, ...l ν = s + 1, s + 2, ...l ν = 1, 2, ...s ∂U ∂t (9.260) donde U es función de las cantidades (9.255) y está definida por: U =F+ l X ν=s+1 q ν pν − C l X pν qν (9.261) ν=r+1 Las fórmulas (9.260) son equivalentes a las fórmulas (9.254) y determinan la transformación canónica por medio de la valencia C y la función generatriz U de las variables independientes (9.255). Las fórmulas (9.260) relacionan el conjunto de variables independientes (9.255) con el siguiente conjunto de variables independientes complementarias: p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l (9.262) 0 ≤ r ≤ l, 0 ≤ s ≤ l 364 / Mecánica clásica avanzada El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como: ∂~ps ∂~ps ! ∂~qr ∂~pl−r ~ps , ~q l−s = det J qr , p~l−r ~ ∂~q l−s ∂~q l−s ∂~qr ∂~pl−r 2 ∂2U ∂ U − − ∂~qr ∂~q ∂~pl−r ∂~q s s (9.263) = det ∂2U ∂2U ∂~qr ∂~pl−s ∂~pl−r ∂~pl−s donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado análogo para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones (9.260) de la primera lı́nea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl en función de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Después se reemplazan las expresiones obtenidas en las l ecuaciones de la segunda lı́nea de (9.260) para obtener las ecuaciones de la transformación canónica (9.254). Las fórmulas de la transformación canónica inversa pueden obtenerse de manera análoga mediante una función generatriz que depende de las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y una valencia igual a C −1 . Queda claro que las transformaciones canónicas libres resultan como casos particulares de la transformación canónica arbitraria, al definir apropiadamente los valores de r y s. 9.6. La ecuación de Hamilton-Jacobi En la sección 3.4 hemos discutido la especificación del estado del sistema mediante las constantes de movimiento. Por simplicidad estamos considerando que el sistema es integrable y posse por lo tanto un conjunto de 2l constantes de movimiento uniformes. El objetivo de la descripción clásica es encontrar a las variables de estado en función del tiempo para cada valor de las constantes de movimiento, considerados como un conjunto completo de variables dinámicas independientes. Si se quiere pueden tomarse como constantes de movimiento los 2l valores iniciales de las variables de estado. La solución estará dada por: q = ~q(~ ~ q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t) (9.264) La ecuación (9.264) puede interpretarse como una transformación canónica de las variables ~ q0 , p~0 a las variables ~q, p~. En la sección 4.7 vimos que para un sistema conservativo la acción coincide con el negativo de la función generatriz de la transformación canónica de evolución temporal (9.264). Veamos que este resultado vale en general. En la sección 9.1 vimos que la diferencia de acción entre dos trayectorias rectas infinitesimalmente Las transformaciones canónicas / 365 próximas, ∆S, cuyos puntos iniciales y finales están sobre ciertas curvas C1 y C2 respectivamente, del espacio de configuración, está dada por la ecuación (9.11), ! ! l l X X ∆S = pν ∆qν − H ∆t − pν ∆qν − H ∆t (9.265) ν=1 C2 ν=1 C1 Describiendo la transformación canónica (9.264) mediante la función generatriz (9.135) con C = 1 y tomando a (q, p) como las nuevas variables y a q0 , p0 , como las viejas variables, obtenemos: ! ! l l X X −∆F = pν ∆qν − H ∆t − (9.266) pν0 ∆qν0 − H0 ∆t ν=1 ν=1 Si en (9.265) definimos la curva C1 como el conjunto de puntos iniciales simultáneos, t1 (α) = constante = t0 y dejamos a C2 arbitraria, entonces (9.265) tomará la forma: ∆S = l X ν=1 pν ∆qν − H ∆t − l X pν0 ∆qν0 (9.267) ν=1 Las expresiones (9.266) y (9.267) coincidirán si la transformación canónica generada por F , (9.264), satisface: −∆F − H0 ∆t = ∆S (9.268) Tomando H0 = 0 obtenemos F = −S. Además como ∂F/∂t = H − H0 se sigue que: F = −S ; → ∂S +H =0 ∂t (9.269) El resultado (9.269) fue obtenido por Hamilton (1805-1865) en 1835, quien además supuso que la transformación canónica (9.264), es libre de primera clase, con lo cual (9.267) conduce a: pν = ∂S ∂S ; pν0 = ; ∂qν ∂qν0 ν = 1, 2, ...l (9.270) Las fórmulas (9.270) conducen a la transformación canónica (9.264). 6 S se llama la función principal de Hamilton (o simplemente acción de Hamilton). Que F = −S, sin emRt bargo, no da un método para encontrar a F , puesto que para evaluar a S = t0 L(q, q̇, t) dt se requiere conocer a q(t), q̇(t), o sea haber resuelto el problema, es decir conocer la “transformación” (9.264). El resultado de Hamilton fue un cı́rculo vicioso: para escribir a partir de (9.270) las ecuaciones (9.264) se requiere conocer la función principal de Hamilton, y para evaluar esta función se requiere conocer la solución (9.264). La contribución de Jacobi (1804-1851), en 1837, fue romper este cı́rculo vicioso; mostró que al resolver la ecuación diferencial que resulta de (9.269), llamada la ecuación de HamiltonJacobi, para obtener una función S mediante las fórmulas (9.270), se obtiene la solución 6 Es una transformación canónica a unas variables donde el sistema está completamente en equilibrio; su trayectoria de fases se reduce a un punto. 366 / Mecánica clásica avanzada buscada (9.264). La ecuación de Hamilton-Jacobi para la función principal de Hamilton. Tratemos de hallar la transformación canónica libre univalente de primera clase que transforma las ecuaciones de Hamilton: q̇ν = ∂H ; ∂pν ṗν = − ∂H ; ∂qν ν = 1, 2, ...l (9.271) ν = 1, 2, ...l (9.272) en las ecuaciones de Hamilton: q̇ ν = ∂H ; ∂pν ṗν = − ∂H ; ∂qν donde H sea idénticamente cero: H ≡0 (9.273) Las ecuaciones (9.272) y (9.273) conducen a la solución inmediata: q ν = βν ; pν = αν ; ν = 1, 2, ...l (9.274) donde αν y βν son 2l constantes arbitrarias. En virtud de (9.158), las fórmulas de transformación estarán dadas por: ∂S(q, β, t) ∂S(q, β, t) = pν ; = −αν ; ν = 1, 2, ...l ∂qν ∂βν (9.275) En tanto que por (9.159) y (9.273) S necesariamente satisface: ∂S +H =0 ∂t (9.276) La ecuación (9.276) junto con (9.275) nos da la siguiente ecuación diferencial en derivadas parciales para S: ! ~ t) ~ t) ∂S(~q, β, ∂S(~ q, β, (9.277) + H ~q, ∂t ∂~q ~ t) La ecuación (9.277) se llama la ecuación de Hamilton-Jacobi.7 La solución S(~q, β, de la ecuación de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la integral completa de la ecuación de Hamilton-Jacobi si se cumple la condición: det ∂2S 6= 0 ~ ∂~q ∂ β (9.278) La expresión (9.278) es equivalente a la (9.162) que es la condición necesaria para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma ~ t); ~ ~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado q = ~q(~ ~ α, β, p = p~(~ α, β, 7 Ya óptica. en 1824 el mismo Hamilton halló una ecuación diferencial de esta forma en conexión con la Las transformaciones canónicas / 367 ~ t) es alguna integral completa de la ecuación de Hamiltones el siguiente: “si S(~ α, β, Jacobi (9.277), entonces la solución para las variables de estado ~q y p~ del sistema puede escribirse en la forma (9.275) para cualquier hamiltoniano H”.8 Según esto, en vez de integrar directamente las ecuaciones de movimiento (9.271), que nos darán a ~q, p~, con 2l constantes de integración arbitrarias, el teorema de Jacobi nos permite hacerlo encontrando la integral completa de la ecuación de Hamilton-Jacobi. Una integral completa de la ecuación de Hamilton-Jacobi no es una solución más general de esta ecuación. Pero en este contexto sólo es importante saber que existe una solución completa. Hasta aquı́ no hemos impuesto ninguna restricción sobre las constantes αν , βν . Si las escogemos de tal manera que coincidan con los valores iniciales de pν y qν obtendremos una solución completa que coincide con la acción principal de Hamilton –es la función generatriz de la transformación inversa de (9.264)–. En este caso S coincide con el generador de la transformación canónica de evolución hacia atrás en el tiempo, pero para otra elección de las constantes αν , βν , la solución completa S de la ecuación de Hamilton-Jacobi no admite esta interpretación. En esto se basa el aporte de Jacobi, quien no sólo rompió el cı́rculo vicioso que mencionamos antes sino que además ~ t) mostró que cualquier solución completa de la ecuación (9.277) permite escribir a ~q(~ α, β, ~ t) en la forma (9.275) donde las βν son las constantes de integración de la ecuay ~q(~ α, β, ción de Hamilton-Jacobi. Hay en efecto, un número infinito de integrales completas de la ecuación de Hamilton-Jacobi. Ejemplo 9.6.1 Formar la función principal de Hamilton para el movimiento de una partı́cula en caı́da libre en presencia de la gravedad. En este caso (tomando t0 = 0): x = 0, S= y = 0, Z t 0 1 z = z0 + ż0 t − gt2 2 1 mż 2 − mgz 2 dt = 1 1 m ż02 t − ż0 gt2 + g 2 t3 2 3 1 2 1 3 −mg z0 t + ż0 t − gt 2 6 (9.279) (9.280) teniendo en cuenta que E = 1/2 mż02 + mgz0 : 1 S = −Et + mż02 t − mż0 gt2 + mgt3 2 y como: ż0 t= g 1− s 2g 1 + 2 (z0 − z) ż0 ! podemos escribir a S en la forma: 3/2 mż03 2g S = −Et − 1 + 2 (z0 − z) 3g ż 8 Este (9.281) (9.282) (9.283) enunciado constituye la contribución de Jacobi a este problema y fue publicado en el año 1837. 368 / Mecánica clásica avanzada donde omitimos una constante. La expresión (9.283) también se puede escribir en términos de E como: 3/2 m 2 S(z, E, t) = −Et − (E − mgz)3/2 (9.284) 3g m que coincide con la ecuación (4.190), que fue obtenida integrando la ecuación de HamiltonJacobi. Otras formas de la ecuación de Hamilton-Jacobi. Si queremos hallar una transformación canónica libre univalente de segunda, tercera o cuarta clase que haga a H idénticamente igual a cero, podemos emplear un procedimiento análogo al que nos condujo a la ecuación (9.277) y también buscar una integral completa de la misma. Una forma equivalente de hallar esas transformaciones es por medio de las fórmulas (9.217), (9.218) y (9.219). Además son útiles: F2 = F1 + l X q ν pν l X q ν pν ν=1 F4 = F3 + (9.285) ν=1 La ecuación de Hamilton-Jacobi para las diferentes funciones generatrices de las transformaciones canónicas libres que hacen a H idénticamente cero son: ! ~ t) ~ t) ∂F1 (~q, β, ∂F1 (~ q , β, + H ~q, ,t = 0 ∂t ∂~q ∂F2 (~q, α ~ , t) ∂F2 (~ q, α ~ , t) + H ~q, ,t = 0 ∂t ∂~q ~ t) ∂F3 (~ q , β, +H ∂t ~ t) ∂F3 (~ p, β, − , p~, t ∂~p ! (9.286) =0 ∂F4 (~ q, α ~ , t) ∂F4 (~q, α ~ , t) +H − , p~, t = 0 ∂t ∂~p Vemos que F1 y F2 satisfacen la misma ecuación diferencial, lo cual es consistente con (9.285), esto es, F1 y F2 difieren por una constante aditiva. Similarmente F3 y F4 satisfacen la misma ecuación. F3 y F4 en la práctica son de poco interés en el método de Hamilton-Jacobi puesto que las qν entran en la energı́a potencial que es una función complicada y se hace por ello más difı́cil la separación de variables. Es posible hallar la ecuación de Hamilton-Jacobi asociado a la transformación canónica (9.260), lo cual se deja como ejercicio. Ejemplo 9.6.2 El oscilador armónico lineal. Resolver la ecuación de Hamilton-Jacobi y con ella hallar la solución a las ecuaciones de movimiento. Las transformaciones canónicas / 369 El hamiltoniano es: H= p2 kq 2 + 2m 2 La ecuación de Hamilton-Jacobi (9.277) es: 2 ∂S(q, β, t) kq 2 ∂S(q, β, t) + + =0 ∂t ∂q 2 (9.287) (9.288) Aquı́ podemos buscar una solución separando las variables q y t en la forma:9 S(q, β, t) = −ht + Σ(q, β) (9.289) donde h es la constante de Jacobi que en este caso coincide con la energı́a total E. Como el sistema tiene sólo un grado de libertad hay sólo una constante de integración, por tanto, podemos hacer h = E = β. Σ(q, E) será solución a la ecuación: 2 kq 2 1 d Σ(q, E) + =E (9.290) 2m dq 2 La ecuación (9.290) puede resolverse directamente: r √ Z q 2E Σ(q, E) = mk − q 2 dq k q0 (9.291) No evaluaremos a (9.291) por cuanto el objetivo no es hallar a S sino, mediante las fórmulas (9.275) encontrar a q y p en función del tiempo: Z qr √ 2E S(q, E, t) = Σ(q, E, t) = −Et + mk − q 2 dq (9.292) k q0 reemplazando a (9.292) en (9.275) obtenemos: r √ 2E ∂S p= = mk − q2 ∂q k Z q √ 2/k ∂S r = −t + mk −α = ∂E 2E q0 2 − q2 k (9.293) (9.294) La ecuación (9.294) se puede integrar directamente, incorporando la constante que depende de q0 en α para obtener: ! √ q −1 (9.295) −α = −t + mk sen p 2E/k 9 En la sección 4.4 encontramos una segunda solución de esta ecuación en la cual las variables no están separadas. Tal solución está dada por la ecuación (4.143). 370 / Mecánica clásica avanzada La ecuación (9.295) nos da a q en función del tiempo y reemplazándolo en (9.293) obtenemos a p en función del tiempo: r 2E sen ω(t − α) q(E, α, t) = k (9.296) √ p(E, α, t) = 2mE cos ω(t − α) Vemos que, como β y α son cantidades canónicamente conjugadas, la energı́a E y el tiempo α son un par de cantidades canónicamente conjugadas. E y α no coinciden con las condiciones iniciales, aunque están relacionadas con ellas: r r √ 2E k q0 = − sen ωα ; p0 = 2mE cos ωα ; ω = (9.297) k m Ejemplo 9.6.3 Comparar a S con la acción para el oscilador armónico: Z t L dt = t0 E Z t t0 Z t t0 kq 2 p2 − 2m 2 dt = [cos2 ω(t − α) − sen2 ω(t − α)] dt = E E sen 2ω(t − α) − sen 2ω(t0 − α) 2ω 2ω Omitiendo la constante aditiva podemos escribir: Z t E 1 L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α) ω 2 t0 Evaluando a S en (9.292): √ S = −Et + mk× # " r 2E q 2E 1 −1 2 q −q + sen p + constante 2 k k 2E/k (9.298) (9.299) (9.300) (9.301) reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva: S = −Et + 1√ 2mEq cos ω(t − α) + E(t − α) 2 1 ⇒ S → mωq 2 cot ω(t − α) 2 (9.302) Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se espera: la solución a la ecuación de Hamilton-Jacobi coincide con la integral de acción. La ecuación de Hamilton-Jacobi independiente del tiempo. Si el sistema es conservativo generalizado (puede ser esclerónomo, aunque no hay fuerzas disipativas Las transformaciones canónicas / 371 y H no depende del tiempo explı́citamente) posee una constante de movimiento que es la constante de Jacobi h, que coincide con la energı́a total cuando además el sistema es esclerónomo –véase la ecuación (3.99)–. Entonces la ecuación de Hamilton-Jacobi (9.277) tiene la forma: ! ~ t) ~ t) ∂S(~ q , β, ∂S(~ q , β, =0 (9.303) +H ~ q, ∂t ∂~q Una solución completa puede escribirse en la forma:10 S(~ q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h) (9.304) donde β1 , β2 , ...βl−1 son constantes con valores arbitrarios. Reemplazando a (9.304) en (9.303) y llamando β~l−1 a β1 , β2 , ...βl−1 obtenemos: ! ~l−1 , h) ∂Σ(~ q, β H ~ q, =h (9.305) ∂~q La integral completa de (9.305) satisface (9.278) es decir: 2 ∂ Σ det 6= 0 (βl = h) ~ ∂~q ∂ β (9.306) Conocida la solución de la ecuación de Hamilton-Jacobi independiente del tiempo (9.305), la condición (9.306) permite obtener a qν y pν en función del tiempo (ν = 1, 2, ...l) a partir de las ecuaciones que corresponden a (9.275): ~l−1 , h ∂Σ ~ q, β = pν ; ν = 1, 2, ...l ∂qν (9.307) ~ ∂Σ ~ q , βl−1 , h = −αν ; ν = 1, 2, ...l − 1 ∂βν ∂Σ(~ q , β~l−1 , h) = t − αl ∂h (9.308) donde αν , βν , h, son constantes arbitrarias. Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas en términos de la restante l-ésima coordenada y de las 2l − 1 constantes arbitrarias ~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuación (9.38). Éstas son las ecuaciones de las β trayectorias en el espacio de configuración. La ecuación (9.308) conecta las coordenadas con la variable temporal t, y equivale a la ecuación (9.40). Ası́ como la acción principal de Hamilton coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi dependiente del tiempo, la acción de Lagrange 10 El ejemplo 4.4.2, sección 4.4, ilustra la propiedad general de la ecuación de Hamilton-Jacobi de poseer soluciones en las cuales las variables t y ~ q no están separadas. 372 / Mecánica clásica avanzada Σ coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi independiente del tiempo (Véase sección 9.3). La conexión entre la acción principal de Hamilton S, y la acción reducida, Σ, está dada por la ecuación (9.46). Si tomamos allı́ a t2 = t y a t1 arbitrario, y omitimos una constante aditiva, vemos que la ecuación (9.46) coincide con la ecuación (9.304). Como se señalaba en la sección 9.3, la acción reducida Σ permite determinar las trayectorias en el espacio de configuración, consistentemente con el principio de mı́nima acción. S es la función generatriz de la transformación canónica que lleva a unas cantidades canónicas que son constantes. Σ es la función generatriz de cierta transformación canónica que no depende del tiempo, que no coincide con la transformación generada por S pero que tiene alguna relación con ella, según veremos. Σ considerada como la función generatriz de una transformación canónica. Sea una transformación canónica independiente del tiempo que al ser aplicada a un sistema conservativo generalizado (∂H/∂t = 0) nos lleva a unas nuevas variables canónicas q ν , pν , donde todas las pν sean cı́clicas. Por tanto todos los q ν serán constantes de movimiento. Llamemos βν a esas constantes. Esta transformación satisface: ∂F1 =0⇒H =H; ∂t ∂F1 = pν ; ∂qν H = H(q) = constante = h ∂F1 = pν ; ∂qν ν = 1, 2, ...l (9.309) (9.310) F1 , según (9.309) y (9.310), debe ser solución a la ecuación diferencial: H ∂F1 (~ q , ~q) q, ~ ∂~q ! =h (9.311) Si llamamos βl = h, (9.309) y (9.310) se pueden escribir como: H ∂F1 (~ q , β~l−1 , h) q, ~ ∂~q ! =h (9.312) ~l−1 , h) ∂F1 (~ q, β = p~ ∂~q ~l−1 , h) ∂F1 (~ q, β = −~pl−1 ~l−1 ∂β ~l−1 , h) ∂F1 (~ q, β = −~ pl ∂h (9.313) Las transformaciones canónicas / 373 Las ecuaciones de Hamilton y sus soluciones para las variables pν y qν son: ~ ~ ~q˙ = ∂H(q) = 0 ⇒ ~q = constante = β ∂~p ~ ~p˙ = − ∂H(q ) = − ∂βl ~ ~ ∂p ∂β ⇒ ~pl−1 = constante = α ~ l−1 ; (9.314) pl = −t + αl Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan ası́: ~l−1 , h) ∂F1 (~ q, β = pν ; ν = 1, 2, ...l ∂~qν ~l−1 , h) ∂F1 (~ q, β = −αν ; α = 1, 2, ...l − 1 ∂βν (9.315) ~l−1 , h) ∂F1 (~ q, β = t − αl ∂h Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la función generatriz de la transformación buscada, F1 (q, q), coincide con la función Σ. Σ puede considerarse como la función generatriz de una transformación canónica libre univalente de primera clase que al ser aplicada a un sistema conservativo generalizado nos conduce a unas variables canónicas (q, p) donde todas las q ν son constantes, lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-ésimo pν es una función lineal del tiempo, pl = −t + αl . Si esta transformación se aplica a un sistema para el cual ∂H/∂t 6= 0, es claro que las nuevas variables canónicas ya no tendrán las caracterı́sticas señaladas. ~ lo cual No es drástica la exigencia βl = h. Podrı́amos haber dejado a h = H(β), nos conducirı́a a que todos los q ν son constantes y todos los pν son funciones lineales del tiempo. Tratamiento cuando H(q, p) tiene coordenadas cı́clicas. Si el sistema es conservativo generalizado y además hay l − r coordenadas cı́clicas, entonces H = H(q1 , q2 , ...qr , p1 , p2 , ...pl ). Los momentos pr+1 , pr+2 , ...pl , conjugados a las coordenadas cı́clicas serán constantes de movimiento. La solución completa de la ecuación de Hamilton-Jacobi puede escribirse como: S = −ht + l X βν qν + Σ0 (q1 , q2 , ...qr , β1 , β2 , ...βl , h) (9.316) ν=r+1 donde la función Σ0 es solución a la ecuación diferencial: ∂Σ0 ∂Σ0 ∂Σ0 , , ... , βr+1 , βr+2 , ...βl = h H q1 , q2 , ...qr , ∂q1 ∂q2 ∂qr (9.317) en la cual hemos tomado los momentos constantes coincidiendo con l − r constantes βν . 374 / Mecánica clásica avanzada 9.7. Las transformaciones canónicas infinitesimales Ecuaciones de transformación. Las transformaciones canónicas infinitesimales (T.C.I.) son las transformaciones canónicas en las que (p, q) difieren infinitesimalmente de (p, q): q ν = qν + δqν ; pν = pν + δpν ; ν = 1, 2, ...l (9.318) aquı́ δ no denota desplazamientos virtuales sino simplemente los cambios infinitesimales en las coordenadas y momentos en la T.C.I. La T.C.I. (9.318) difiere infinitesimalmente de la transformación identidad. Si la transformación infinitesimal sólo depende de un parámetro ε, podemos decir que la función generatriz de la T.C.I. serı́a igual a la función generatriz de la transformación identidad más un término del orden de ε. La transformación identidad es univalente libre de tercera y de segunda clase, según las ecuaciones (9.184) a (9.188). La función generatriz de la T.C.I. (9.318) será pues: F2 (q, pν , t) = l X pν qν + ε G(q, p, t) (9.319) ν=1 Si la T.C.I. posee m parámetros infinitesimales, F2 será: F2 = l X pν qν + ν=1 m X εj Gj (9.320) j=1 Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de manera continua uno o varios parámetros. Los Gj se llaman los generadores infinitesimales de la T.C.I., en términos de los cuales se pueden expresar las fórmulas (9.135). Una transformación canónica del tipo F2 satisface: pν = ∂F2 ∂F2 ∂F2 ; qν = ; ν = 1, 2, ...l ; H − H = ∂qν ∂pν ∂t (9.321) Entonces para la T.C.I. con función generatriz (9.319) tenemos: δpν = −ε ∂G ∂G ; δqν = ε ; ν = 1, 2, ...l ∂qν ∂pν (9.322) ∂G H =H +ε ∂t donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε. La T.C.I. de evolución temporal. Sabemos que la evolución temporal puede considerarse como una transformación canónica. Queremos hallar el generador de la T.C.I. de evolución temporal. La transformación es: qν (t); pν (t) → q ν (t) = qν (t + τ )pν (t) = pν (t + τ ) ; ν = 1, 2, ...l (9.323) Las transformaciones canónicas / 375 donde tomamos a τ infinitesimal. De acuerdo con (9.269), la función generatriz de la transformación canónica de evolución temporal entre t0 y t es −S, Z t e.t. L dt (9.324) F1 = − t0 O sea que para la transformación (9.323) con τ infinitesimal, la función generatriz es: F1e.t. = = − − Z l X t+τ L dt ≈ −Lτ = − t l X ν=1 pν q̇ν − H ! τ pν q̇ν τ + Hτ (9.325) ν=1 Por otra parte, q̇ν = (q ν − qν )/τ → q̇ν τ = q ν − qν , o sea que: F1e.t. ≈ − l X (pν qν − pν q ν ) + Hτ (9.326) ν=1 De acuerdo con (9.217), (9.218), (9.187) y (9.188) vemos que: F1id. = F2id. + l X (pν qν + pν q ν ) = l X (−q ν pν + pν qν + pν q ν ) (9.327) ν=1 ν=1 donde F2id. es la función generatriz de la T.C. identidad y F1e.t. se refiere a la evolución temporal. Comparando (9.326) y (9.327) obtenemos: F1e.t. = F2id. − l X pν q ν + Hτ (9.328) ν=1 Comparando (9.328) con (9.218) obtenemos: F1e.t. = F2id. + Hτ = l X pν qν + Hτ (9.329) ν=1 Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del parámetro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evolución temporal. Al mismo resultado llegamos de la siguiente manera, notemos que: q ν = qν + τ q̇ν ⇒ δqν = τ q̇ν = dqν (9.330) pν = pν + τ ṗν ⇒ δpν = τ ṗν = dpν ; H = H + ∂H τ ∂t (9.331) Comparando a (9.322) con (9.330) obtenemos: ε ∂G = τ q̇ν ; ∂pν −ε ∂G = τ ṗν ; ∂qν ε ∂G ∂H =τ ∂t ∂t (9.332) 376 / Mecánica clásica avanzada De las ecuaciones de Hamilton obtenemos para (9.332): ε ∂G ∂H =τ ; ∂pν ∂pν −ε ∂ (εG − τ H) = 0 ; ∂qν ∂G ∂H ∂ = −τ ⇒ (εG − τ H) = 0 ∂qν ∂qν ∂pν ν = 1, 2, ...l ; (9.333) ∂ (εG − τ H) = 0 ∂t Las ecuaciones (9.333) nos dicen que εG = τ H. En efecto, podemos tomar τ como ε y a H como el generador de la T.C.I. El movimiento finito del sistema puede considerarse como una sucesión de T.C.I. Si H es constante, el generador de la T.C.I. de evolución temporal es el mismo para cada una de las transformaciones en tal sucesión. Si H depende de t, H es G para la evolución de t a t + τ y H + (∂H/∂t)τ es G para la evolución de t + τ a t + 2τ , etc. En el lı́mite τ → 0, la evolución finita es el desarrollo continuo de una T.C. En este caso el generador de la T.C.I. es H. En general, el generador de cualquier T.C.I. es una variable dinámica del sistema. La T.C.I. de translación espacial. Esta transformación involucra tres parámetros infinitesimales. Supongamos que el sistema es libre, de modo que las coordenadas cartesianas son a la vez coordenadas generalizadas independientes. La transformación es: xi = xi + εx ; y i = yi + εy ; z i = zi + εz ; i = 1, 2, ...N (9.334) Además, como para este sistema p~i = mi~r˙ i , se tiene que: ~pi = p~i ; i = 1, 2, ...N (9.335) En este caso δxi = εx , δyi = εy , δzi = εz , δ~ pi = 0; i = 1, 2, ...N . Entonces las ecuaciones (9.322) toman la forma: ∂ ~ = ~ε ; (~ε · G) ∂~ pi ∂ ~ = 0; (~ε · G) ∂~ri i = 1, 2, ...N (9.336) donde nos basamos en (9.320) con m = 3 y formamos los εj con el vector ~ε y con los Gj ~ De (9.336) se sigue que G ~ tiene la expresión: el vector G. ~ = G n X pi = P~ ~ (9.337) i=1 Vemos que el momento total del sistema P~ es el generador infinitesimal de la transformación canónica de translación espacial. Más exactamente, en la translación por una cantidad ε a lo largo del vector unitario ~n, entonces ~ε = ε~n y el generador infinitesimal ~ = Pn . El generador infinitesimal de translaciones a lo largo de la dirección será ~n · G ~n es la componente del momento total en esa dirección, Pn . El hecho de que se emplee (9.335) no implica que P~ o Pn sea constante en el tiempo. Veremos que P~ es constante sólo si H no depende de la coordenada de posición del centro de masa. Las transformaciones canónicas / 377 y ri ε r θi x Figura 9.7 Rotación de las partı́culas alrededor del eje z La T.C.I. de rotación espacial. Suponemos también qué sistema es libre. Por simplicidad consideremos una rotación de todas las partı́culas alrededor del eje z (véase figura 9.7). La transformación es: xi = ri cos(θi + ε) yi = ri sen(θi + ε) zi = zi ; i = 1, 2, ...N (9.338) y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338) y sus similares para p~i nos dan: xi = xi − εyi ; yi = yi + εxi ; z i = zi pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ; (9.339) i = 1, 2, ...N Comparando (9.339) con (9.322) hallamos: −εyi = δxi = ε ∂G ∂G ; εxi = δyi = ε ; ∂pxi ∂pyi −εpyi = δpxi = −ε εpxi = δpyi = −ε 0 = δzi = ε ∂G ∂pxi ∂G ∂pzi (9.340) ∂G ∂G ; 0 = δpzi = −ε ∂yi ∂zi vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si: G= N X i=1 (xi pyi − yi pxi ) = Lz (9.341) 378 / Mecánica clásica avanzada O sea que Lz es el generador infinitesimal de una rotación del sistema alrededor del eje z, donde Lz es la componente z del momento angular total del sistema. Vemos que: Lz = N X i=1 (xi pyi − y i pxi ) = N X (xi pyi − yi pxi ) + 0 (ε2 ) (9.342) i=1 O sea que, como debe ser, Lz = Lz . Veremos que Lz será constante en el tiempo sólo si H no depende de la coordenada φ del vector de posición del centro de masa. 9.8. Los corchetes de Poisson En el numeral anterior vimos que los generadores infinitesimales H, Pn y Lz corresponden a cantidades con claro significado fı́sico. Aquı́ consideraremos algunas propiedades de las funciones del estado del sistema que hemos definido como variables dinámicas (véase sección 3.4). Las variables dinámicas. Definimos una variable dinámica como una función del estado del sistema y del tiempo que no cambia su valor en una transformación canónica. Ası́ que bajo una transformación canónica (q, p) → (q, p), f será una variable dinámica si se cumple: f (q, p, t) = f [q(q, p, t), p(q, p, t)] = f (q, p, t) (9.343) De acuerdo con esta definición, como en una transformación canónica: H(q, p, t) = H(q, p, t) + ∂F ∂t (9.344) se sigue que el hamiltoniano no es una variable dinámica cuando se consideran transformaciones canónicas que dependen del tiempo. Ası́ por ejemplo, para un sistema conservativo H = E, igual a la energı́a total, en tanto que por medio de una transformación canónica dependiente del tiempo podemos hacer H = 0. Tenemos en general que el ~ o p~. Ası́ también, la energı́a generador de una T.C.I. es una variable dinámica, como L cinética es una variable dinámica. En esta definición de variables dinámicas está implı́cita la idea de las transformaciones canónicas desde un punto de vista pasivo. Formas “activa” y “pasiva” de una transformación canónica. En la sección 7.7 vimos que las rotaciones de un cuerpo rı́gido admiten las interpretaciones “activa” y “pasiva”. Análogamente esas consideraciones se pueden hacer a las transformaciones en el espacio de fases. En la interpretación “pasiva”, una transformación canónica es una regla de correspondencia que asocia a cada punto del espacio de fases (q, p) un punto del espacio de fases (q, p), tal que las ecuaciones de movimiento toman la misma forma en los dos espacios. Es una aplicación de un espacio en otro espacio. Una variable dinámica es una función del estado del sistema, considerado como algo intrı́nseco o sea independiente del espacio de fases que se use para describirlo. Ası́, si el estado del sistema en un tiempo Las transformaciones canónicas / 379 dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en otro espacio de fases, una variable dinámica tiene el mismo valor en A que en A. Por otra parte, hay transformaciones canónicas que admiten una interpretación activa. Son aquellas transformaciones canónicas del espacio de fases en sı́ mismo; o sea aquellas en que se tiene una aplicación del espacio de fases sobre sı́ mismo. Ası́, la transformación canónica de evolución temporal asocia al estado del sistema en el tiempo t0 , (q0 , p0 ) el estado en el tiempo t, (q, p); la transformación canónica de translación espacial asocia a la posición del sistema (~r1 , ~r2 , ...~rN ) una posición en la cual todas las partı́culas se han desplazado una distancia ~ ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformación canónica de rotación espacial es la misma estudiada en el capı́tulo 7. Son susceptibles de una interpretación “activa” todas aquellas transformaciones canónicas que se pueden obtener a partir de la transformación identidad por medio de la variación continua de uno o varios parámetros. Ası́ por ejemplo, la inversión de las coordenadas, o la transformación canónica que intercambia coordenadas y momentos, no son susceptibles de una interpretación activa. Tampoco mediante una variación continua de parámetros podemos llegar de las coordenadas cartesianas a las coordenadas esféricas, por ejemplo. Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado a otro). En (9.318) es entonces válido tomar desplazamientos del tipo ∆. Cambio de una variable dinámica en una T.C.I. En la interpretación “pasiva” no tiene sentido preguntarse por el “cambio de una variable dinámica f bajo una transformación canónica”, pues de acuerdo con (9.343) no hay tal cambio. En la interpretación “activa”, si tiene sentido preguntarse cómo cambia el valor de f al pasar el sistema de un estado A(q, p) a un estado B(q, p). Usaremos el sı́mbolo ∂ para denotar tal cambio: ∂f (q, p, t) = f (q, p, t) − f (q, p, t) (9.345) Para ser más precisos, en la interpretación “pasiva” podemos preguntarnos por el cambio en la forma funcional de la variable dinámica al ser descrita desde dos espacios de fases diferentes, lo cual es mucho más difı́cil de visualizar. Este cambio de forma funcional está definido por: f (q, p, t) − f (q, p, t) (9.346) de acuerdo con la notación (9.343). Usando (9.343) podemos escribir a (9.346) como: f (q, p, t) − f (q, p, t) = −∂f (9.347) comparando (9.345) y (9.347) vemos que: ∂f = −∂f (9.348) Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio funcional de la función f en el mismo estado, en la interpretación “pasiva”. La T.C.I. es 380 / Mecánica clásica avanzada (9.318) y expresada en términos de generadores es (9.322). Con la interpretación “activa” ∂f es: ∂f = = = f (q + δq, p + δp, t) − f (q, p, t) l X ∂f (q, p, t) ∂f (q, p, t) δqν + δpν ∂qν ∂pν ν=1 l m X X ∂f (q, p, t) ∂Gj (q, p, t) ∂f (q, p, t) ∂Gj (q, p, t) εj − εj ∂qν ∂pν ∂pν ∂qν j=1 ν=1 = m X εj [f (q, p, t), Gj (q, p, t)] (9.349) j=1 donde hemos definido el corchete de Poisson de dos variables dinámicas g(q, p, t) y h(q, p, t) como: l X ∂g ∂h ∂g ∂h − [g, h] = ∂qν ∂pν ∂pν ∂qν ν=1 (9.350) Vemos que el corchete de Poisson de dos variables dinámicas a su vez es una variable dinámica. En sı́ntesis: f (q, p, t) − f (q, p, t) = f (q, p, t) − f (q, p, t) m X εj Gj (q, p, t) = f (q, p, t), (9.351) j=1 Si la T.C.I. es la evolución temporal, tenemos que ε = τ y G = H. En este caso: l ∂f X f˙ = + ∂t ν=1 l = ∂f X + ∂t ν=1 ∂f ∂f q̇ν + ṗν ∂qν ∂pν ∂f ∂H ∂f ∂H − ∂qν ∂pν ∂pν ∂qν (9.352) ∂f + [f, H] ⇒ f˙ = ∂t Si la variable dinámica f no depende explı́citamente del tiempo, su rata de cambio es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f no depende explı́citamente del tiempo será una constante de movimiento si su corchete de Poisson con H es cero. Simetrı́a y leyes de conservación. Sabemos que la simetrı́a dinámica de un sistema se expresa mediante las simetrı́as de las funciones L o H. Las transformaciones canónicas / 381 Sea una T.C.I. y sea G el generador de la misma; G es una variable dinámica. Entonces es correcto expresar el siguiente teorema: G es una constante de movimiento si H es invariante bajo la transformación generada por G. Recordemos que H no es en general una variable dinámica. Por esta razón al realizar la T.C.I. generada por G el cambio en H no está dado por (9.349). H es simplemente una función que en un espacio de fases dado define las ecuaciones canónicas de movimiento. Por esta razón, cuando la transformación canónica depende del tiempo, no se cumple que H(q, p, t) = H(q, p, t). Denotemos por ∂H a la siguiente diferencia. Ver ecuación (9.346): ∂H = H(q, p, t) − H(q, p, t) (9.353) H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) están relacionadas por: H(q, p, t) − H(q, p, t) = ε ∂G ∂t (9.354) reemplazando a (9.354) en (9.353) tenemos: ∂H = H(q, p, t) − H(q, p, t) + ε ∂G ∂t (9.355) Ahora sı́ podemos usar la ecuación (9.351) para H: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] (9.356) La diferencia entre H y H es del orden de ε, luego, al primer orden en ε (9.356) toma la forma: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] Ahora, reemplazamos a (9.357) en (9.355) para obtener: ∂G ∂G ∂H = −ε [H, G] + ε =ε + [G, H] ∂t ∂t (9.357) (9.358) De (9.352) vemos entonces que: ∂H = ε Ġ (9.359) La ecuación (9.359) nos permite inmediatamente obtener el enunciado del teorema: G es una constante de movimiento si y sólo si es el generador de una transformación canónica infinitesimal que no cambia la forma funcional del hamiltoniano. Ası́ pues, si H no cambia al desplazar el sistema a lo largo de una dirección ~n, P~ .~n es una constante de movimiento y si H no cambia al rotar el sistema alrededor del eje ~ n es una constante de movimiento. P~ es el momento lineal total y L ~ es el ~n entonces L.~ momento angular. Este resultado ya lo habı́amos obtenido en unos casos particulares en la sección 3.4. Como según este teorema las constantes de movimiento han de ser los generadores de T.C.I. que dejan invariante a H, se sigue que hallando todas las transformaciones de simetrı́a de H podemos encontrar todas las constantes de movimiento. 382 / Mecánica clásica avanzada Por otra parte si se conocen 2l constantes de movimiento del sistema se tendrá resuelto el problema mecánico, si esas 2l constantes son independientes. En efecto, el método de Hamilton-Jacobi permite mediante una transformación canónica expresar las coordenadas y momentos del sistema en términos de las constantes de movimiento y del tiempo. En el capı́tulo 11 se muestra que el resultado falla si el sistema es no integrable. La conservación del momento que vimos en el capı́tulo 3 se sigue de este teorema. Si qν0 es cı́clica, H no depende de ella y por tanto es invariante en una T.C.I. que implique el cambio de qν0 , y el generador infinitesimal de esta transformación habrá de ser una constante de movimiento. Las ecuaciones de tal transformación canónica serán: δqν = ε δνν0 ; δpν = 0 ; ν = 1, 2, ...l (9.360) por otra parte se tiene que: δqν = ε ∂G ; ∂pν δpν = −ε ∂G ; ∂qν ν = 1, 2, ...l (9.361) Se sigue de (9.360) y (9.361) que: (9.362) G = pν0 O sea que el generador es precisamente el momento canónico conjugado de la coordenada cı́clica qν0 . En general, un cambio en cualquier variable canónica del sistema, qν o pν , es generado por su variable canónicamente conjugada, pν o −qν , respectivamente. Las ecuaciones de movimiento en términos de los corchetes de Poisson. Si en la ecuación (9.352) reemplazamos a f por qν y por pν obtenemos: q̇ν = [qν , H] ; ṗν = [qν , H] ; ν = 1, 2, ...l (9.363) o también, usando las ecuaciones de Hamilton: ∂H ∂H = [qν , H] ; = −[pν , H] ; ν = 1, 2, ...l ∂pν ∂pν (9.364) Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equivalentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son más que el resultado de aplicar el párrafo que sigue a la ecuación (9.362), conjuntamente con (9.351). Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una partı́cula cargada en presencia de un campo electromagnético externo. Usamos la ecuación (3.117) para h conjuntamente con la ecuación (4.1) para ~r˙ en función del momento canónico p~: H= e ~ 2 1 p~ − A + eφ 2m c (9.365) Las transformaciones canónicas / 383 ~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los donde A corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las fórmulas (9.363): ∂rn ∂H ∂rn ∂H · − · ∂~r ∂~ p ∂~p ∂~r e~ p~ − A ∂H c ; ~n = ~i, ~j, ~k = ~n · = ~n · ∂~ p m [rn , H] = (9.366) Por otra parte: [pn , H] = = ∂pn ∂H ∂pn ∂H ∂H ∂H · − · = −~n · =− ∂~r ∂~ p ∂~p ∂~r ∂~r ∂rn ~ e ~ ∂A ∂φ e p~ − A · −e mc c ∂rn ∂rn (9.367) La ecuación (9.367) también puede escribirse ası́: [pn , H] = ~ ∂φ e ∂ ˙ ~ ∂An e ˙ ∂A + −e = (~r · A) − Ȧn + ~r · c ∂rn ∂rn c ∂rn ∂t e e ∂An ∂φ Ȧn − −e c c ∂t ∂rn (9.368) ~ y E se pueden expresar en términos de A ~ y φ ası́: Notamos que B ~ ~ = − ∂φ − 1 ∂ A ; E ∂~r c ∂t ~ = ∂ ×A ~ B ∂~r (9.369) Notemos que: ∂ ∂Aµ ~ ~r˙ × ×A = ǫnms ǫstµ ṙm ∂~r ∂rt n = (δnt δmµ − δnµ δmt ) ṙm ∂Aµ ∂rt (9.370) ~ ∂A ∂Aµ = ~r˙ · − ~r˙ · ∂rn ∂~r y, Ȧn = ∂An ˙ ∂An + ~r · ∂t ∂~r (9.371) con lo cual: ~ ∂ ~ + ∂An − Ȧn ~ = ~r˙ · ∂ A + ∂An − Ȧn = ∂ (~r˙ · A) ×A ~r˙ × ∂~r ∂rn ∂t ∂rn ∂t (9.372) 384 / Mecánica clásica avanzada remplazando (9.372) en (9.369) obtenemos: e ˙ 1 ∂An ∂ ∂φ e ~ [pn , H] = + ~r × ×A + Ȧn − e c ∂~r c ∂rn c ∂t n e ˙ ~ e = (~r × B)n + eEn Ȧn + Ȧn c c pero, según la expresión para la fuerza de Lorentz: e ~ n + eEn mr̈n = (~r˙ × B) c Usando (9.374), (9.373) queda como: e e d [pn , H] = mr̈n + Ȧn = mṙn + An = ṗn c dt c en concordancia con (9.363). También de (9.366) se sigue que: [rn , H] = ṙn de donde: (9.374) (9.375) (9.376) El corchete de Poisson de dos componentes del momento cinemático es: ∂pci ∂pcj ∂pci ∂pcj · − · [pci , pcj ] = ∂~r ∂~p ∂~p ∂~r ~ pero p~c = p~ − (e/c) A, por tanto: e ∂Aj e ∂Ai · ~nj − ~ni · [pci , pcj ] = − c ∂~r c ∂~r = (9.373) e c ∂Aj ∂Ai − ∂ri ∂rj e = ǫijk c ∂ ~ ×A ∂~r k e [pci , pcj ] = ǫijk Bk c Esto último también puede escribirse como: e [ṙi , ṙj ] = 2 ǫijk Bk m c O sea que el corchete de Poisson de ẋ con ẏ es cero sólo si Bz se anula. (9.377) (9.378) (9.379) (9.380) Algunas propiedades de los corchetes de Poisson. Para cualesquiera tres funciones f (q, p, t), g(q, p, t) y h(q, p, t), se cumple: (i) [f, g] = −[g, f ] (ii) [cf, g] = [f, cg] = c[f, g] ; c : constante (iii) [f + g, h] = [f, h] + [g, h] (iv) [f g, h] = f [g, f ] + g[f, h] (v) ∂g ∂f ∂ [f, h] = , g + f, ∂t ∂t ∂t (9.381) Las transformaciones canónicas / 385 Estas propiedades se siguen directamente de la definición de los corchetes de Poisson, ecuación (9.350). La identidad de Jacobi. Para cualesquiera tres funciones f , g y h se cumple: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0 (9.382) esta relación se llama la identidad de Jacobi. Para demostrarla es útil la siguiente interpretación del corchete de Poisson: l X ∂g ∂ ∂g ∂ [g, φ] = − φ = D̂g φ (9.383) ∂qν ∂pν ∂pν ∂qν ν=1 donde D̂g es un operador diferencial lineal en el espacio de fases. Con esta notación podemos escribir el siguiente conmutador: D̂g D̂h − D̂h D̂g f = [g, [h, f ]] − [h, [g, f ]] = (9.384) [g, [h, f ]] + [h, [f, g]] La expresión (9.384) sólo contiene derivadas primeras respecto a pν y qν de la función f . En efecto: D̂g = 2l X i=1 gi ∂ ; xν = qν ; xν+l = pν ; ν = 1, 2, ...l ∂xi (9.385) por tanto, tenemos que: D̂g D̂h − D̂h D̂g f 2l 2l X X ∂ ∂ ∂ ∂ = gi hj − hi gj f ∂xi ∂xj ∂xi ∂xj i=1 j=1 " 2l X 2l X ∂2 ∂hj ∂ ∂2 g i hj = + gi − hi g j ∂xi ∂xj ∂xi ∂xj ∂xi ∂xj i=1 j=1 # ∂gj ∂ f − hi ∂xi ∂xj = 2l X 2l X ∂hj ∂gj ∂f gi − hi ∂xi ∂xi ∂xj i=1 j=1 (9.386) Por otra parte tenemos que: [f, [g, h]] = [[h, g], f ] = [D̂h g, f ] = 2l X i=1 = ∂g ,f hi ∂xi 2l X l X ∂ ∂g ∂g ∂ ∂f ∂f hi hi − ∂qν ∂xi ∂pν ∂pν ∂xi ∂qν i=1 ν=1 (9.387) 386 / Mecánica clásica avanzada La ecuación (9.386) se puede escribir como: D̂g D̂h − D̂h D̂g " 2l X l X ∂hν ∂gν ∂f gi f= − hi ∂xi ∂xi ∂qν i=1 ν=1 # ∂hl+ν ∂gl+ν ∂f + gi − hi ∂xi ∂xi ∂pν (9.388) Sumando (9.387) y (9.388) obtenemos: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 2l X l X ∂g ∂gν ∂ ∂f ∂hν hi − hi − gi ∂x ∂x ∂p ∂x ∂q i i ν i ν i=1 ν=1 + (9.389) 2l X l X ∂g ∂gl+ν ∂ ∂f ∂hl+ν hi − hi + gi ∂xi ∂xi ∂qν ∂xi ∂pν i=1 ν=1 De (9.383) y (9.385) se sigue que: gν = − ∂g ; ∂pν gl+ν = ∂g ; ∂qν ν = 1, 2, ...l (9.390) Por tanto: ∂gν ∂ ∂hν − hµ − gµ ∂qµ ∂qµ ∂pν = ∂g hµ ∂qµ ∂h ∂ 2 g ∂g ∂ 2 h − ∂pµ ∂qµ ∂pν ∂pµ ∂qµ ∂pν (9.391) ∂ 2 h ∂g ∂h ∂ 2 g + + ∂pν ∂pµ ∂qµ ∂pµ ∂pν ∂qµ = ∂g ∂ 2 h ∂g ∂ 2 h + ∂pµ ∂qµ ∂pν ∂qµ ∂pµ ∂qν Las transformaciones canónicas / 387 Similarmente hallamos que: gl+µ ∂gν ∂ ∂hν − hl+µ − ∂qµ ∂pµ ∂pν − ∂g hl+µ = ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h − ∂qµ ∂pµ ∂pν ∂pµ ∂pν ∂qµ ∂hl+ν ∂gl+ν ∂ gµ − hµ + ∂qµ ∂qµ ∂qν ∂g hµ = ∂qµ (9.392) ∂g ∂ 2 h ∂g ∂ 2 h − − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂hl+ν ∂gl+ν ∂ gl+µ − hl+µ + ∂pµ ∂pµ ∂qν ∂g hl+µ = ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h + ∂qµ ∂pµ ∂qν ∂pµ ∂qν ∂qµ Reemplazando (9.391)y (9.392) en (9.389) obtenemos: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = l X µ,ν=1 ∂g ∂ 2 h ∂g ∂ 2 h + ∂pν ∂qµ ∂pν ∂qµ ∂pµ ∂pν ∂g ∂ 2 h ∂g ∂ 2 h − − ∂qµ ∂pµ ∂pν ∂pµ ∂pµ ∂qν + l X µ,ν=1 − ∂g ∂ 2 h ∂g ∂ 2 h − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h + + ∂qµ ∂pµ ∂qν ∂pν ∂qν ∂qµ ! ! ∂f ∂qν (9.393) ∂f ∂pν La ecuación (9.393) es idénticamente cero, lo cual prueba la identidad de Jacobi. Invariancia de los corchetes de Poisson bajo T.C.I. Se trata de mostrar que: [f (q, p, t), g(q, p, t)] = [f (q, p, t), g(q, p, t)] (9.394) De la definición (9.343) se sigue que: l X ∂f ∂qµ ∂f ∂f ∂pµ ∂f = = + ∂q ∂q ν ∂qµ ∂qν ∂pµ ∂q ν µ=1 (9.395) 388 / Mecánica clásica avanzada De (9.318) y (9.322) se sigue: ∂qµ ∂2G ; = δµν − ǫ ∂q ν ∂qν ∂pµ ∂pµ ∂2G =ǫ ∂q ν ∂qν ∂qµ (9.396) Por tanto, se cumple: ∂f ∂f ∂ ∂f ∂f ∂G +ǫ ,f = +ǫ [G, f ] − ǫ G, = ∂qν ∂qν ∂qν ∂qν ∂qν ∂qν (9.397) donde la última igualdad se sigue de (9.381-v). De (9.318) y (9.322) se sigue: ∂2G ∂pµ ; = δµν + ǫ ∂pν ∂pν ∂qµ ∂qµ ∂2G = −ǫ ∂pν ∂pν ∂pµ (9.398) y análogamente se llega a: ∂f ∂ ∂f ∂f +ǫ [G, f ] − ǫ G, = ∂pν ∂pν ∂pν ∂pν (9.399) Reemplazando (9.397) y (9.399) y expresiones análogas para g, en (9.394): f, g (q,p) = " l X ∂[G, f ] ∂f ∂f +ǫ − ǫ G, · ∂qν ∂pν ∂qν ν=1 ∂[G, g] ∂g ∂g + +ǫ − ǫ G, ∂pν ∂pν ∂pν ∂[G, f ] ∂f ∂f · +ǫ − ǫ G, ∂pν ∂pν ∂pν # ∂[G, g] ∂g ∂g +ǫ − ǫ G, ∂qν ∂qν ∂qν (9.400) Las transformaciones canónicas / 389 Al primer orden en ε podemos escribir: f, g (q,p) l X ∂[G, f ] ∂g = [f, g](q,p) + ε ∂qν ∂pν ν=1 ∂f − G, ∂qν ∂f ∂[G, g] ∂g + ∂pν ∂qν ∂pν ∂g ∂[G, g] ∂f ∂g ∂f ∂f G, − + G, − ∂qν ∂pν ∂qν ∂pν ∂qν ∂pν − ∂f ∂g ∂g ∂[G, f ] G, + ∂qν ∂pν ∂qν ∂pν (9.401) = [f, g](q,p) + ǫ ([[G, f ], g] + [f, [G, g]]) +ǫ l X ∂g ∂f ∂g ∂f ,G − ,G ∂pν ∂qν ∂qν ∂pν ν=1 En la última igualdad se ha hecho uso de la propiedad (9.381-iv). Ahora los últimos términos en (9.401) dan [[f, g], G], con lo cual el término del orden de ε es cero con base en la identidad de Jacobi, por tanto: [f , g](q,p) = [f, g]q,p (9.402) Llegamos a la conclusión de que el corchete de Poisson de dos variables dinámicas es una variable dinámica que es invariante bajo transformaciones canónicas infinitesimales. En otras palabras, el corchete de Poisson de dos variables dinámicas es una variable dinámica con un valor independiente de las variables usadas para describir el estado del sistema: los corchetes de Poisson son invariantes canónicos. Veremos que esta invariancia se cumple aun bajo transformaciones canónicas que no se pueden obtener de manera continua a partir de la transformación identidad, o sea como sucesión de T.C.I. El teorema de Jacobi-Poisson. Si f y g son dos constantes de movimiento, entonces [f, g] también es una constante de movimiento.11 De (9.352) se sigue que si f y g son constantes de movimiento se cumple: ∂g ∂f + [f, H] = 0 y + [g, H] = 0 ∂t ∂t (9.403) Debemos probar que esto implica que: ∂[f, g] + [[f, g], H] = 0 ∂t 11 Este teorema fue enunciado por Poisson en 1809. (9.404) 390 / Mecánica clásica avanzada En efecto: ∂ ∂g ∂f = − [[f, H] , g] − [f, [g, h]] [f, g] = , g + f, ∂t ∂t ∂t (9.405) [[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H] La última igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra el teorema. El corchete de Poisson de dos variables dinámicas que se conservan es una variable dinámica que se conserva. Esto permite, por ejemplo, construir a partir de un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las 2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes de Poisson entre todos los posibles pares de estas S variables dinámicas. En total hay s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que sean independientes. Es claro que puede haber un número mı́nimo s de constantes de movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo de 2l constantes de movimiento independientes. Ejemplo 9.8.2 Sea una partı́cula en una dimensión, sometida a una fuerza constante. Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson de ellas no da lugar a una tercera constante de movimiento. La solución al problema es: 1 x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 ) 2 (9.406) donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energı́a total E. x puede escribirse en la forma: x= 1 p (t + t0 ) − g(t + t0 )2 m 2 Entonces las expresiones para t0 y E en función de p y x son: s 2x p p2 p2 − t0 = −t + − ; E = − mgx mg m2 g 2 g 2m (9.407) (9.408) El corchete de Poisson de t0 y E es: [t0 (p, x, t), E(p, x, t)] = ∂t0 ∂E ∂t0 ∂E − ∂x ∂p ∂p ∂x (9.409) Haciendo el cálculo indicado en (9.408), usando (9.409), obtenemos: [t0 , E] = 1 (9.410) La ecuación (9.408) puede interpretarse como una transformación canónica que permite expresar las nuevas variables canónicas t0 y E en función de las viejas x y p. Tal transformación depende del tiempo. Esto ilustra un resultado más general: [qν , pν ] = [q ν , q ν ] = 1, para todo ν, que veremos más adelante. Las transformaciones canónicas / 391 Ejemplo 9.8.3 Sea una partı́cula para la cual lz y py son constantes de movimiento. Hallar una tercera constante de movimiento. Por el teorema de Poisson, [lz , py ] es constante. [lz , py ] = [xpy , py ] − [ypx , py ] (9.411) = x[py , py ] + py [x, py ] − y[px , py ] − px [y, py ] Es fácil, de la definición, verificar que: [x, py ] = 0 ; [px , py ] = 0 ; [y, py ] = 1 son. (9.412) Por tanto, [lz , py ] = −px . O sea que px es constante de movimiento si lz y py lo Ejemplo 9.8.4 Demostrar que si dos componentes del momento angular son constantes de movimiento, la tercera también lo es. Si li y lj son dos componentes de ~l constantes, por el teorema de Poisson [li , lj ] también es una constante. Recordando que: li = ǫikl xk pl (9.413) Vemos que: [li , lj ] = ǫikl ǫjmn [xk pl , xm pn ] (9.414) Usando la propiedad (9.381-iv) vemos que: [xk pl , xm pn ] = xk [pl , xm pn ] + pl [xk , xm pn ] = −xk [xm pm , pl ] − pl [xm pn , xk ] = −xk (xm [pn , pl ] + pn [xm , pl ]) (9.415) −pl (xm [pn , xk ] + pn [xm , xk ]) Es fácil ver que: [pn , pl ] = 0 ; [xm , pl ] = δml ; [xm , xk ] = 0 (9.416) con lo cual (9.415) queda: [xk pl , xm pn ] = −xk pn δml + pl xm δnk (9.417) reemplazando (9.417) en (9.414) obtenemos: [li , lj ] = −ǫikl ǫjln xk pn + ǫikl ǫjnk pl xn (9.418) Usando la propiedad: ǫikl ǫjnl = δij δkn − δin δjk (9.419) 392 / Mecánica clásica avanzada obtenemos: [li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn (9.420) Finalmente encontramos que: [li , lj ] = δij ~r · ~p − rj pi − δij ~r · ~p + pj ri = ri pj − pi rj (9.421) no es otra cosa que: [li , lj ] = ǫijk lk (9.422) Ası́, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de movimiento, lz también lo es. Los corchetes de Poisson fundamentales. Son los corchetes de Poisson para las coordenadas y los momentos del sistema. Se sigue de la definición de corchete de Poisson que: [qν , qµ ] = 0 ; [pν , pµ ] = 0 ; [qν , pµ ] = δµν ; µ, ν = 1, 2, ...l (9.423) De acuerdo con la invariancia de los corchetes de Poisson bajo transformaciones canónicas se tiene que las relaciones (9.423) se cumplen independientemente de las variables canónicas usadas para describir el estado del sistema; veremos que esta propiedad proporciona un criterio para saber si una transformación en el espacio de fases es o no canónica. Algunos corchetes de Poisson de interés. En principio el corchete de Poisson de un par de variables dinámicas se obtiene a partir de los corchetes de Poisson fundamentales. Algunos corchetes de Poisson que se calculan directamente son: [qν , f ] = ∂f ; ∂pν [pν , f ] = − ∂f ; ∂qν µ, ν = 1, 2, ...l (9.424) siempre t0 es una de las constantes de movimiento y tiene una forma similar a (9.408), ver también la ecuación (3.91): t0 (q, p, t) = −t + θ(q, p) (9.425) de acuerdo con (9.411) se cumple que: [t0 , H] = − ∂t0 = 1 ⇒ [t0 , H] = 1 ∂t (9.426) La ecuación (9.423) nos dice que el corchete de Poisson de un par de variables canónicamente conjugadas es igual a +1; [qν , pν ] = 1 ; ν = 1, 2, ...l (9.426) nos dice entonces que t0 y H son un par de variables dinámicas canónicamente conjugadas. Muchos autores señalan que t y H son canónicamente conjugadas, pero esto es erróneo, pues realmente t no es una variable dinámica, como sı́ lo es t0 . Enfaticemos que f es una variable dinámica si satisface f (q, p, t) = f (q, p, t). Las transformaciones canónicas / 393 Vimos que el método de Hamilton-Jacobi permite mediante una transformación canónica describir el estado por medio de constantes de movimiento. Los corchetes fundamentales de Poisson, (9.423), permiten a priori saber si dos constantes de movimiento dadas pueden tomarse como dos “coordenadas” o dos “momentos” o una “coordenada” y su “momento” canónicamente conjugado. La ecuación (9.426) nos dice categóricamente que t0 y H pueden tomarse como un par de variables canónicamente conjugadas pero no es posible que ambos sean “coordenadas” o “momentos”. Algo análogo se concluye de las siguientes relaciones entre componentes de los momentos angular y lineal: [li , lj ] = ǫijk lk ; [pi , lj ] = ǫijk pk ; [xi , lj ] = ǫijk xk [ li , ~l2 ] = 0 ; [~ p, ~l2 ] = 2~l × ~p ; i, j, k = 1, 2, 3 (9.427) Se sigue que dos componentes de ~l no pueden tomarse como variables canónicas de estado, como tampoco una componente de p~ y ~l2 . Sin embargo, por ejemplo, [px , lx ] = 0 y [lz , lx ] = 0, permiten que px y lx sean momentos canónicos respectivamente, lo mismo que la componente de p~ paralela a ~l y ~l2 . Como ejemplo, para una partı́cula en un campo de fuerzas centrales se cumple que [ ~l2 , H] = 0 y [lz , H] = 0. Para este sistema se cumple: [~l, H] = 0 ; [lz , H] = 0 ; [~l2 , lz ] = 0 (9.428) O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que junto con sus tres “coordenadas” canónicamente conjugadas, que son funciones lineales del tiempo según se vio al final del capı́tulo 2, constituyen un conjunto de seis variables canónicas que describen exhaustivamente el sistema. Por ser independientes, li y lj podrı́an servir de variables de estado pero en un formalismo no canónico (no hamiltoniano). Funciones escalares y vectoriales del estado de una partı́cula. Una función escalar por definición, es aquella que no cambia al efectuar una rotación del sistema de coordenadas (punto de vista “pasivo”). Al efectuar la rotación los vectores de estado ~r y p~ cambian en ~r y ~p, ver sección 7.7: ~r = Ã~r ; ~p = Ã~ p (9.429) donde à es la matriz de rotación. Entonces φ(~r, p~) es escalar si: φ(~r, p~) = φ(~r , ~p) (9.430) Una función vectorial del estado de la partı́cula es una función F que se transforma de acuerdo con (9.428), es decir, F~ tiene tres componentes que se transforman por rotaciones como las componentes de ~r: ~ (~r, ~p) F~ (~r, ~p) = ÃF~ (~r, p~) = F (9.431) Para rotaciones infinitesimales à está dada por: à = I˜ + Ci G̃i δφ (9.432) 394 / Mecánica clásica avanzada donde los G̃i están dados en la ecuación (7.221), los Ci son los cosenos directores del eje de rotación y δφ es el ángulo de rotación. De acuerdo con (9.318) y (9.432): ~r = ~r + Ci G̃i ~r δφ ; ~p = p~ + Ci G̃i p~ δφ (9.433) De acuerdo con (9.318), (9.322) y (9.433) tenemos que: ∂ ǫ G(~r, ~p) ∂~p δ~r = Ci G̃i~r δφ = δ~ p= ∂ ~ δφ = Ci G̃i p ǫ G(~r, ~p) ∂~r (9.434) donde G es el generador infinitesimal de la rotación, que de acuerdo con (9.340) es la componente de ~l a lo largo del eje de rotación: G(~r, p~) = ~n · ~r × ~p = Ci li (9.435) Vemos entonces que δφ = ǫ y que: Ci G̃i ~r = ∂ ∂ Ci li = (~n · ~r × ~p) = ~n × ~r ∂~ p ∂~p Ci G̃i p~ = ∂ ∂ − Ci li = − (~n · ~r × p~) = ~n × p~ ∂~p ∂~r (9.436) Tomando componentes en (9.432) a (9.436): = ǫkil xl = ǫkil Ci xl ⇒ G̃i Ci G̃i kl kl (9.437) El lector puede verificar fácilmente que este resultado es consistente con las ecuaciones (7.222), teniendo en cuenta que allı́ se tenı́an rotaciones “activas”. De (9.436) vemos que se puede escribir: G(~r, ~ p) = ~l · ~n = Ci p~ · G̃i~r = −Ci~r · G̃i p~ (9.438) ⇒ li = p~ · G̃i~r = −~r · G̃i ~p ; i = 1, 2, 3 consistente con la antisimetrı́a de G̃i , (9.437). Evaluemos el corchete de Poisson de dos componentes de ~l: [li , lj ] = = ∂li ∂li ∂li ∂lj · − · = (−G̃i p~) · (G̃j ~r) − (G̃i ~r) · (−G̃j p~) ∂~r ∂~ p ∂~p ∂~r G̃i~r · G̃j p ~ − G̃j ~r · G̃i ~p (9.439) p = ~rT G̃Ti G̃j ~p − ~rT G̃Tj G̃i p~ = ~rT (G̃Ti G̃j − G̃Tj G̃i )~ Como los G̃i son antisimétricos, G̃Ti = −G̃i , p [li , lj ] = ~rT (G̃j G̃i − G̃i G̃j )~ (9.440) Las transformaciones canónicas / 395 De acuerdo con la ecuación (7.224) que define el álgebra de Lie de las rotaciones: G̃j G̃i − G̃i G̃j [li , lj ] = = ǫjik G̃k ǫjik ~rT G̃k p~ (9.441) = −ǫijk ~r · G̃k p~ = ǫijk lk lo cual concuerda con el resultado obtenido en (9.422). Decimos que li y G̃i tienen la misma álgebra de Lie, definida por corchetes de Poisson de variables dinámicas y de conmutadores de matrices respectivamente. Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones infinitesimales una función escalar cumple: φ(~r, p~) = φ(~r + δ~r, p~ + δ~ p) = φ(~r, ~p) + δ~r · ∂φ ∂φ + δ~ p· ∂~r ∂~p (9.442) o sea que se cumple: ∂φ ∂φ + δ~ p· =ǫ δ~r · ∂~r ∂~ p ∂G ∂φ ∂G ∂φ · − · ∂~ p ∂~r ∂~r ∂~p = −ǫ [G, φ] = 0 lo cual es consistente con (9.351). La ecuación (9.443) también implica que: ∂φ ∂φ ∂φ ∂φ ~n × ~r · =0 + ~n × p~ · = 0 ⇒ ~n · ~r × + p~ × ∂~r ∂~ p ∂~r ∂~p (9.443) (9.444) Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse: ~r × ∂φ ∂φ + p~ × =0 ∂~r ∂~ p (9.445) se cumple si ∂φ/∂~r = a~r + b~ p y ∂φ/∂~p = c~r + d~ p puesto que: ~r × ∂φ ∂φ + p~ × = b~r × p~ + c~ p × ~r = 0 si b = c ∂~r ∂~ p (9.446) es decir, φ es de la forma: φ= 1 2 1 2 a~r + c~r · p~ + d ~ p = A~r2 + B~ p2 + c~r · ~p 2 2 (9.447) donde A, B y C no dependen de ~r ni de ~p. Ası́ pues: [~r2 , li ] = 0 ; [~ p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0 (9.448) Una función vectorial F~ (~r, p~) puede escribirse en la forma: F~ = f1 ~r + f2 ~ p + f3 ~l donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447). (9.449) 396 / Mecánica clásica avanzada Usando las fórmulas (9.427) vemos que: [Fi , lj ] = ǫijk Fk → [F~ , li ] = ~ei × F~ (9.450) De (9.428) se sigue que F~ se transforma bajo rotación como (9.431). Los vectores de la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de base ~ei son independientes de él como también los vectores ~n, que definen las rotaciones. Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotación cambiarı́a no sólo los componentes de la función F~ sino la naturaleza misma de la función (algo análogo a lo que sucede con el hamiltoniano cuando las transformaciones canónicas dependen del tiempo). En una rotación el cambio en F~ es: ∂ F~ = δφ [F~ , ~l.~n] (9.451) donde los vectores unitarios no son rotados por ~l · ~n. Éste no serı́a el caso si F~ fuera un vector externo como un campo magnético, que no depende del estado de la partı́cula. La expresión (9.451) vale pues sólo para funciones vectoriales de la forma (9.449). La ecuación (9.450) también puede escribirse usando la notación diádica en términos del ~1 = ~e1~e1 + ~e2~e2 + ~e3~e3 : diádico unidad ~ ~ [F~ , ~l] = −~1 × F~ (9.452) ~ Es fácil mostrar que: Sean dos vectores de estado del sistema, F~ , G. ~ ~l · ~n] = 0 [F~ · G, (9.453) ~ es una función escalar, que no cambia por rotaciones. En efecto, F~ · G Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una función escalar y satisface que: [F~ · ~n′ , ~l · ~n] = (~n′ × ~n) · F~ (9.454) que en general no es cero. Ejemplo 9.8.5 Mostrar que (9.450) no se cumple cuando F~ no depende exclusivamente ~ = (~r × B)/2 ~ del estado de la partı́cula, por ejemplo cuando es el potencial vectorial A ~ es un vector fijo y constante en el espacio; digamos B ~ = B~l3 , o sea un campo donde B magnético homogéneo en la dirección z. [Ai , li ] = 1 1 B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ] 2 2 (9.455) usando (9.427) obtenemos: [Ai , lj ] = = 1 1 Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl 2 2 1 − B(δij x3 − δ3j xi ) 2 (9.456) Las transformaciones canónicas / 397 Por otra parte, el lado derecho en (9.450) es: 1 ǫijk Ak = Bǫijk ǫkl3 xl 2 (9.457) 1 1 = B(δil δj3 − δi3 δjl ) xl = B(δj3 xi − δi3 xj ) 2 2 Comparando (9.456) con (9.457) vemos que no son iguales. En conclusión, no hay una fórmula general para evaluar el corchete de Poisson de un vector que depende del estado solamente y un vector espacial. Correspondencia del formalismo de Poisson con el cuadro de Heisenberg de la mecánica cuántica.12 Hay una correspondencia entre el conjunto de las variables dinámicas en la descripción clásica y el conjunto de los operadores hermı́ticos en la descripción cuántica de un sistema de l grados de libertad. En esos dos conjuntos se puede definir un álgebra de Lie, de la siguiente manera: (i) En esos conjuntos se puede definir una ley de composición interna mediante la cual se hace corresponder a cada par de elementos del conjunto un tercer elemento del mismo conjunto: C = [a, b]. Tal ley de composición satisface: (ii) La propiedad reflexiva: [a, a] = 0, para todo elemento del conjunto, siendo 0 elemento del mismo. (iii) La propiedad antisimétrica: [a, b] = −[b, a]. (iv) La propiedad de linealidad: [αa + βb, c] = α[a, c] + β[b, c] siendo α y β números cualesquiera. (v) La identidad de Jacobi: para cualesquiera tres elementos a, b, c, del conjunto se cumple [a, [b, c]] + [b, [c, a]] + [c, [a, b]] = 0. Esta álgebra es en general no conmutativativa, además de ser no asociativa: [a, [b, c]] 6= [[a, b], c]. En el conjunto de las variables dinámicas clásicas el álgebra de Lie está dada por los corchetes de Poisson, que satisfacen todas las propiedades (i) a (v). En el conjunto de los operadores hemı́ticos cuánticos se satisfacen las propiedades (i) a (v) definiendo la ley de composición interna por medio de conmutadores: [â, b̂] = âb̂ − b̂â. La correspondencia entre el formalismo de Poisson y el de Heisenberg se establece de la siguiente manera: a cada variable canónica de estado pν o qν , ν = 1, 2, 3, ...l, le corresponde un operador hermı́tico, p̂ν o q̂ν , ν = 1, 2, ...l. En consecuencia a cada variable dinámica f (q, p, t) le corresponde un operador hermı́tico construido a partir de los operadores p̂ν o q̂ν : fˆ(q̂, p̂, t). A cada corchete de Poisson fundamental le corresponde un conmutador fundamental. La correspondencia entre el corchete de Poisson y conmutadores es: 1 1 (9.458) [f, g] → [fˆ, ĝ] = (fˆĝ − ĝfˆ) ih̄ ih̄ En particular a los corchetes fundamentales de Poisson, (9.423), les corresponde: q̂µ q̂ν − q̂ν q̂µ = 0 ; p̂µ p̂ν − p̂ν p̂µ = 0 q̂µ p̂ν − p̂ν q̂µ = ih̄δµν ; µ, ν = 1, 2, ...l 12 Véase el capı́tulo 12. (9.459) 398 / Mecánica clásica avanzada A la relación (9.426) le corresponde: t̂0 Ĥ − Ĥ t̂0 = ih̄ (9.460) similarmente, li = ih̄ǫijk l̂k lj − ˆ lj ˆ l̂i ˆ Las ecuaciones de movimiento de Heisenberg son: ˆq̇ ν = 1 q̂ν Ĥ − Ĥ q̂ν ; ˆṗν = 1 p̂ν Ĥ − Ĥ p̂ν ; ν = 1, 2, ...l ih̄ ih̄ (9.461) (9.462) Si G̃i (q, p, t) son los generadores infinitesimales de un grupo de simetrı́as, que satisface las relaciones de álgebra de Lie clásicas, i h (9.463) G̃i , G̃j = Cijk G̃k donde G̃i (q, p, t) son llamadas las constantes estructurales, las correspondientes relaciones de álgebra de Lie cuánticas son: Ĝi Ĝj − Ĝj Ĝi = iCijk h̄Ĝk (9.464) en particular para el grupo de rotaciones tridimensional, Cijk = ǫijk , que caracterizan al grupo SO(3). Toda la mecánica cuántica puede hacerse corresponder con la mecánica clásica a partir de las relaciones que hemos mencionado; con la mecánica cuántica en el formalismo de Heisenberg y con la mecánica clásica en el formalismo de Poisson. La analogı́a llega hasta el punto de formularse un principio de Hamilton cuántico (principio de acción de Schwinger) y construirse una integral de Poincaré-Cartán. Ejemplo 9.8.6 Sea una variable dinámica B independiente del tiempo, la cual satisface la última igualdad de la ecuación (9.352). Mostrar que la solución de dicha ecuación coincide formalmente con la fórmula de Hausdorff-Baker-Campbell (H.B.C.) de la mecánica cuántica. En mecánica cuántica se obtiene un operador en el tiempo t a partir del operador en el tiempo cero por la relación: B̂(t) = eiĤt/h̄ B̂(0)e−iĤt/h̄ (9.465) donde Ĥ es el operador hamiltoniano. Se puede mostrar que esta ecuación equivale a la fórmula de H.B.C: 2 1 it it [Ĥ, [Ĥ, B̂o ]] B̂(t) = B̂0 + [Ĥ, B̂0 ] + h̄ 2! h̄ n (9.466) 1 it +... [Ĥ, [Ĥ, ...[Ĥ, B̂0 ]...]] + ... {z } | n! h̄ n corchetes Las transformaciones canónicas / 399 (véase el texto de Messiah, Mécanique quantique, tomo 1, capı́tulo 8). Clásicamente la ecuación de movimiento para la variable dinámica B es (9.352): Ḃ = [B, H] (9.467) Formalmente B puede expandirse en serie de Tayor alrededor de t = 0: B = B0 + tḂ + 0 t2 B̈ 2! + ... 0 tn (n) B n! + ... (9.468) 0 Notando que: B̈ = [Ḃ, H] = [[B, H], H], ... (9.469) obtenemos: B = B0 − t[H, B]|0 + t2 [H, [H, B]] 2! 0 (9.470) 1 + ... (−t)n [H, [H ...[H, B] ...]] + ... {z } | n! n corchetes 0 Es clara la correspondencia entre (9.466) y (9.470) con sólo reemplazar el corchete de Poisson por i/h̄ veces el conmutador. La expresión (9.466) puede también obtenerse a partir de las fórmulas cuánticas que corresponden a (9.467) y (9.468): ˆ = i [Ĥ, B̂] (9.471) Ḃ h̄ Como ilustración, sea una partı́cula en un campo homogéneo gravitacional −mg. El hamiltoniano cuántico será: p̂2 − mg x̂ (9.472) Ĥ = 2m Sea B̂ = Ĥ y B̂0 = x̂0 . Hallemos a x̂ usando la fórmula (9.466). Es necesario evaluar los siguientes conmutadores: 1 2 −1 [Ĥ, x̂0 ] = p̂0 , x̂0 = x̂0 , p̂20 2m 2m (9.473) −1 ih̄ = ([x̂0 , p̂0 ] p̂0 + p̂0 [x̂0 , p̂0 ]) = − p̂0 2m m ih̄ [Ĥ, [Ĥ, x0 ]] = −mg x̂0 , − p̂0 = −gh̄2 (9.474) m Como el conmutador (9.474) es constante, todos los conmutadores de orden superior se anulan. Reemplazando (9.473) y (9.474) en (9.466): 1 p̂0 t + gt2 (9.475) m 2 La ecuación (9.475) es formalmente igual a la expresión clásica que se obtendrı́a a partir de (9.470). x̂ = x̂0 + 400 / Mecánica clásica avanzada 9.9. Pruebas del carácter canónico de una transformación La prueba más directa consiste en usar la transformación junto con las ecuaciones de Hamilton en las variables originales para obtener las ecuaciones de movimiento en las nuevas variables; la transformación será canónica si las nuevas ecuaciones de movimiento lo son para un hamiltoniano cualquiera; esto se usó en los ejemplos de las ecuaciones (3.92) y (3.93). Otra prueba consiste en mostrar que existe una función generatriz U para la transformación, tal que las fórmulas de la transformación se puedan llevar a la forma (9.260). A continuación veremos otros métodos de prueba como son los corchetes de Lagrange y Poisson y la llamada condición simplicial. Veamos que en la prueba del carácter canónico de una transformación es suficiente demostrar que la transformación para un tiempo dado es canónica. Sea la transformación: q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (9.476) Si la transformación es canónica se debe cumplir: l X ν=1 pν ∆q ν − H ∆t = C l X ν=1 pν ∆qν − H ∆t ! − ∆F (q, p, t) (9.477) Si en (9.477) tomamos un tiempo fijo y arbitrario t = t′ obtenemos: l X ν=1 pν δq ν = C l X ν=1 pν δqν − δF (q, p, t) (9.478) Ahora (9.478) es la identidad que define una transformación canónica que no depende del tiempo, q ν = q ν (q, p, t′ ) ; pν = pν (q, p, t′ ) ; ν = 1, 2, ...l (9.479) Entonces, las ecuaciones (9.479) definen una transformación canónica con valencia C y función generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos ahora cómo la identidad que define el carácter canónico de la transformación dependiente del tiempo, ecuación (9.477), puede obtenerse de la identidad correspondiente para la transformación independiente del tiempo, ecuación (9.478). La ecuación (9.4) relaciona las variaciones δ con las variaciones ∆: ∆q ν = δq ν + q̇ ν ∆t ; ν = 1, 2, ...l (9.480) Con expresiones análogas para ∆pν , ∆qν , ∆pν . Entonces la relación entre ∆F y δF será: # " l X ∂F ∂F ∂F ∆t (9.481) q̇ν + ṗν + ∆F = δF + ∂qν ∂pν ∂t ν=1 Las transformaciones canónicas / 401 Usando las fórmulas (9.480) y (9.481), la ecuación (9.478) se transforma en: l X ν=1 p ∆q ν − q̇ ν ∆t = C l X ν=1 + " pν (∆qν − q̇ν ∆t) − ∆F l X ∂F ν=1 ∂F q̇ν + ṗν ∂qν ∂pν ∂F + ∂t # ∆t (9.482) La ecuación (9.482) coincidirá con (9.477) si se define la función H por la ecuación: l X ∂F ∂F ∂F H = CH + pν q̇ ν − Cpν q̇ν + q̇ν + ṗν + (9.483) ∂qν ∂pν ∂t ν=1 El paréntésis en (9.483) se puede escribir también en la forma siguiente si asumimos que la transformación es libre de primera clase, de modo que F es función de (q, q, t): l X ∂F1 ∂F1 pν q̇ ν − Cpν q̇ν + (9.484) q̇ν + ṗν ∂qν ∂pν ν=1 Esta expresión es cero, de acuerdo con las fórmulas de la transformación (9.158). Se sigue entonces que: ∂F1 (9.485) ∂t Se llega al resultado correspondiente a (9.485) si la transformación tiene una estrutura arbitraria, es decir, regida por las fórmulas (9.260). Concluimos que a fin de que la transformación (9.476) sea canónica es necesario y suficiente que todas las transformaciones independientes del tiempo obtenidas de la transformación (9.476) por reemplazar a t por un valor árbitrario t′ , sean canónicas, es decir, que satisfagan la ecuación (9.478), con una y la misma valencia C y una y la misma función generatriz F . Por esta razón, al formular las pruebas para el carácter canónico de una transformación, basta restringirse a la consideración de las transformaciones que no contienen la variable temporal t explı́citamente: ! ~q, ~p q ν = q ν (q, p) ; pν = pν (q, p) ; ν = 1, 2, ...l ; J 6= 0 (9.486) ~q, p~ H = CH + Los corchetes de Lagrange. Para la transformación canónica (9.486), la identidad (9.477) toma la forma: l X ν=1 pν ∆ q ν = C l X ν=1 pν ∆qν − ∆K(q, p) (9.487) Si en (9.487) expresamos a ∆q ν en función de ∆qν y ∆pν usando las fórmulas (9.486) obtenemos: # " ! ! l l l X X X ∂q ν ∂qν (9.488) Cpν − ∆qν − ∆pν ∆K = pν pµ ∂qν ∂pν ν=1 µ=1 ν=1 402 / Mecánica clásica avanzada ∆K será un diferencial exacto si se cumplen las condiciones: ! ! l l X X ∂q µ ∂q µ ∂ ∂ Cpλ − = Cpν − pµ pµ ∂qν ∂qλ ∂qλ ∂qν µ=1 µ=1 ∂ ∂pν ∂ ∂pν l X ∂q µ − pµ ∂pλ µ=1 l X ∂q µ Cpλ − pµ ∂qλ µ=1 ! ! = ∂ ∂pλ = ∂ ∂qλ l X ∂qµ − pµ ∂pν µ=1 l X ∂q µ − pµ ∂pν µ=1 ! (9.489) ! Si efectuamos las operaciones, las ecuaciones (9.489) se transforman en: l X ∂pµ ∂q µ ∂pµ ∂q µ = 0 − ∂qν ∂qλ ∂qλ ∂qν µ=1 l X ∂pµ ∂q µ ∂pµ ∂qµ = 0 − ∂pν ∂pλ ∂pλ ∂pν µ=1 (9.490) l X ∂pµ ∂q µ ∂pµ ∂q µ = Cδνλ − − ∂pν ∂qλ ∂qλ ∂pν µ=1 Se define el corchete de Lagrange de dos variables dinámicas f y g como: l X ∂qν ∂pν ∂qν ∂pν {f (q, p, t), g(q, p, t)} ≡ − ∂f ∂g ∂g ∂f ν=1 (9.491) Con esta notación, las fórmulas (9.490) toman la forma: {qν (q, p, t), qλ (q, p, t)} = 0 ; {qν (q, p, t), pλ (q, p, t)} = {pν (q, p, t), pλ (q, p, t)} = 0 Cδνλ ; (9.492) ν, λ = 1, 2, ...l En las fórmulas (9.492) hemos colocado la variable t, teniendo en cuenta el resultado anterior, según el cual el carácter de la transformación dependiente del tiempo es el mismo que el de la transformación realizada en un tiempo fijo t = t′ . Las ecuaciones (9.492) expresan las condiciones suficientes y necesarias para que la transformación (9.476) sea canónica. Esta es una de las mencionadas pruebas del carácter canónico de una transformación. Las fórmulas (9.492) se llaman los corchetes de Lagrange fundamentales: con las ecuaciones (9.492) se pueden formar las siguientes igualdades entre matrices l × l: {~ q, ~ q )} = 0̃l ; {~ p, p~)} = 0̃l ; {~q, ~p)} = C I˜l (9.493) Las transformaciones canónicas / 403 donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0̃l y I˜ son las matrices cero e identidad de orden l × l respectivamente. A su vez las fórmulas (9.493) se pueden condensar en la siguiente expresión con matrices 2l × 2l: {~ q, ~ q )} {~ q, p~)} −{~ q, ~ p)} {~ p, p~)} = 0̃l −I˜l I˜l 0̃l ≡ Ẽ (9.494) Ẽ es una matriz 2l × 2l antisimétrica, ortogonal, de cuadrado igual al negativo de la matriz identidad, y de determinante +1: Ẽ T = −Ẽ Ẽ T = Ẽ −1 Ẽ 2 = −I˜ det Ẽ = +1 (9.495) Vectores y matrices simpliciales. Se trata de una notación vectorial en el espacio de fases con vectores de 2l elementos y matrices de dimensión 2l × 2l. Con esta notación se “entremezclan” las coordenadas y momentos generalizados, y de ahı́ el nombre de “simplicial” que recibe esta notación. El término matriz simplicial se reserva para una cierta clase de matrices 2l × 2l, las matrices M̃ que satisfacen la relación: M̃ T Ẽ M̃ = Ẽ (9.496) el conjunto de todas las matrices simpliciales de dimensión 2l × 2l forma un grupo, llamado el grupo simplicial. En efecto: (i) El producto de dos matrices simpliciales es una matriz simplicial. (ii) Las matrices simpliciales son no singulares, o sea que para toda matriz simplicial existe la matriz inversa. La matriz inversa de una matriz simplicial es simplicial. (iii) La matriz identidad 2l × 2l es simplicial. (iv) El producto de matrices simpliciales es asociativo. Los vectores de 2l elementos en el espacio de fases se pueden escribir en la forma [~u, ~v ], donde ~u y ~v son vectores columna de l elementos. Una forma bilineal de dimensión 2l es: f= l X (−uν vν′ + vν u′ν ) = ~v · ~u ′ − ~u · ~v ′ (9.497) ν=1 que puede escribirse en la forma: ′ ~u f = (~u, ~v ) Ẽ ′ ~v (9.498) 404 / Mecánica clásica avanzada Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformación mediante una matriz simplicial M̃ : ′ ′ ~u ~u ~u ~u = M̃ = M̃ ; (9.499) ′ ′ ~v ~v ~v ~v Entonces se cumple que: ′ ′ ~u ~u = (~u, ~v ) M̃ T Ẽ M̃ f = ~u, ~v Ẽ ′ ~v ′ ~v ′ ~u =f = (~u, ~v ) Ẽ ′ ~v (9.500) Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores [~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las transformaciones del grupo simplicial. La matriz jacobiana de una transformación biana de una transformación canónica: ∂q 1 ∂q1 ∂q 1 ∂q1 ∂q1 ∂q 1 ... ... ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl ∂q ∂q 2 ∂q 2 ∂q2 ∂q 2 ∂q2 2 ... ... ∂q ∂q ∂q ∂p ∂p ∂pl 1 2 l 1 2 ... ... ... ... ... ... ... ... ∂ql ∂q l ∂ql ∂q l ∂q l ∂ql ... ... ∂q ∂q2 ∂ql ∂p1 ∂p2 ∂pl 1 J˜ = ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂q1 ∂q2 . . . ∂ql ∂p1 ∂p2 . . . ∂pl ∂p2 ∂p2 ∂p2 ∂p2 ∂p2 ∂p2 ... ... ∂q1 ∂q2 ∂q ∂p ∂p ∂pl l 1 2 ... ... ... ... ... ... ... ... ∂p ∂pl ∂pl ∂pl ∂pl ∂pl l ... ... ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl canónica. Sea la matriz jaco = ∂~q ∂~q ∂~p ∂~q ∂~q ∂~p ~ ∂p ∂~p (9.501) donde ∂~p/∂~q, etc., son matrices jacobianas de orden l. Mostremos que J˜ satisface la relación: J˜T Ẽ J˜ = C Ẽ (9.502) Las transformaciones canónicas / 405 donde C es la valencia de T ∂~q ∂~q J˜T Ẽ J˜ = ∂~q T ∂~ p la transformación canónica. En T ∂~p ∂~q ˜ 0̃l −Il ∂~q ∂~q T ∂~p I˜l 0̃l ∂~p ∂~q ∂~ p efecto: ∂~q ∂~p ~ ∂p ∂~p (9.503) efectuando el producto de matrices indicado en (9.503), teniendo en cuenta que cuando las matrices constan de bloques se siguen las mismas reglas de la multiplicación ordinaria de matrices, obtenemos: T T T T ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q − − ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p T (9.504) J˜ Ẽ J˜ = T T T T ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p − − ∂~ p ∂~q ∂~ p ∂~q ∂~p ∂~p ∂~p ∂~p ∂~p/∂~qT indica la matriz traspuesta de ∂~p/∂~q. Notemos que los corchetes de Langrange fundamentales, (9.490) y (9.492), se pueden escribir en forma de matrices. En efecto, las ecuaciones (9.490) son los siguientes elementos de matriz: ! ! ! ! l X ~p T ~q ~q T ~p ∂ ∂ ∂ ∂ =0 − ∂~ q ∂~ q ∂~ q ∂~ q µ=1 νµ ! ! ~T ∂p ∂~ p µ=1 l X ~T ∂q ∂~ p µ=1 l X νµ νµ µλ ∂~q ∂~ p ! ∂~p ∂~q ! µλ µλ νµ − T ∂~q ∂~p ! − T ∂~q ∂~p ! νµ νµ µλ ∂~p ∂~p ! ∂~q ∂~q ! µλ µλ Comparando a (9.504) con (9.505) obtenemos que: 0̃l −C I˜l = C Ẽ J˜T Ẽ J˜ = C I˜l 0̃ =0 (9.505) = Cδνλ (9.506) Con lo cual queda demostrada la relación (9.502). Si la transformación canónica es univalente, C = 1, entonces J˜ es una matriz simplicial. En general, para C 6= 1, se dice que J˜ es una matriz simplicial generalizada, con valencia C. El conjunto de todas las matrices simpliciales generalizadas (todas con la misma C) forma un grupo. Si M̃ es una matriz simplicial generalizada, se cumple que det M̃ = ±C l . En efecto, tomando el determinante de (9.506) y teniendo en cuenta que el determinante de un producto de matrices es igual al producto de los determinantes y que det Ẽ = +1, det J˜T detẼ detJ˜ = C 2l det Ẽ (9.507) 406 / Mecánica clásica avanzada Como det J˜T = det J˜ se sigue que: ˜ 2 = C 2l ⇒ detJ˜ = ±C l (det J) (9.508) O sea que para una matriz simplicial se cumple que det M̃ = ±1, o sea que las matrices simpliciales son no singulares. Sabemos que las igualdades (9.492), o sea (9.505), son las condiciones suficientes y necesarias para que la transformación sea canónica. Por tanto la igualdad (9.506) se cumple solamente si la transformación es canónica. Llegamos pues, a otra prueba del carácter canónico de una transformación: Para que la transformación q ν = q ν (q, p, t), pν = pν (q, p, t), ν = 1, 2, ...l sea canónica, es necesario y suficiente que la matriz jacobiana J˜ correspondiente a esta transformación sea una matriz simplicial generalizada con valencia constante C. Si la transformación es univalente, entonces J˜ es una matriz simplicial ordinaria. Entonces, ˜ ecuación (9.502), debe cumplirse idénticala condición de la naturaleza simplicial de J, mente para todos las variables (q, p, t). El teorema de Liouville. En la sección 9.6, ecuación (9.269), se halló que el movimiento de un sistema hamiltoniano puede considerarse como una transformación canónica libre de primera clase univalente. En consecuencia, su matriz jacobiana es simplicial y su determinante vale ±1. Se sigue entonces que el volumen de una región arbitraria del espacio de fases es constante en el tiempo. Tal volumen es: Z Z Z Γ= ... dq 1 dq 2 ...dq l dp1 dp2 ...dpl (9.509) que puede expresarse también en la forma: ! Z Z Z ~q, ~p dq1 dq2 ...dql dp1 dp2 ...dpl J Γ= ... ~q, p~ (9.510) ˜ Si la transformación es canónica, donde J es el determinante de la matriz jacobiana J. l ˜ J = det J = ±C , o se a que: Γ = Γ|C|l (9.511) En particular, Γ es invariante bajo la transformación canónica de evolución temporal, o sea que: dΓ =0 dt (9.512) La ecuación (9.512) puede considerarse como una prueba del teorema de Liouville, véase ecuación (3.137). Γ es una de las integrales invariantes de Poincaré, ecuación (9.81). Invariancia de los corchetes de Poisson bajo transformaciones canónicas. Hemos ya mostrado esta invariancia bajo transformaciones canónicas infinitesimales, ecuación (9.394) y siguientes. Veremos ahora que esta invariancia vale para cualquier tipo de tranformación canónica univalente; no solamente para aquellas que pueden obtenerse a partir de la transformación continua de parámetros. Las transformaciones canónicas / 407 Empecemos por mostrar que la condición de canonicidad (9.502) puede expresarse en la forma: J˜Ẽ J˜T = C Ẽ (9.513) ˜T −1 ˜−1 en efecto, multiplicando por (J ) a (9.502) por la izquierda y por J por la derecha, obtenemos: 1 (J˜T )−1 Ẽ J˜−1 = Ẽ (9.514) C En (9.514) ahora tomamos las matrices inversas de ambos lados y usamos las propiedades de las ecuaciones (9.495): −1 i−1 h 1 Ẽ = J˜Ẽ −1 J˜T = −J˜Ẽ J˜T ; (J˜T )−1 Ẽ J˜−1 = −C Ẽ (9.515) C O sea que la siguiente es otra expresión de la condición de canonicidad: J˜Ẽ J˜T = C Ẽ (9.516) La ecuación (9.516) puede obtenerse a partir de (9.502) intercambiando los papeles de J˜ y J˜T . Comparando con (9.503) vemos que J˜Ẽ J˜T se puede obtener de (9.504) intercambiando a ∂~q/∂~q y ∂~p/∂~ p por sus respectivas traspuestas y a ∂~p/∂~q por (∂~q/∂~p)T . Es decir: T T T T ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p − − ∂~ ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p p ∂~q T ˜ ˜ J Ẽ J = (9.517) T T T T ∂~p ∂~q ~ ~ ~ ~ ~ ~ ∂p ∂q ∂p ∂p ∂p ∂p − − , ∂~ p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p Los corchetes de Poisson fundamentales pueden escribirse en forma de matriz. En efecto: ! ! ! ! l X ~q ~q ~p T ~p T ∂ ∂ ∂ ∂ [q ν , pλ ] = − ∂~q ∂~p ∂~p ∂~q µ=1 µλ µλ νµ νµ (9.518) ! T T ∂~q ∂~p ∂~q ∂~p = − ∂~q ∂~ p ∂~p ∂~q νλ y similarmente: [q ν , q λ ] = T T ∂~q ∂~q ∂~q ∂~q − ∂~q ∂~ p ∂~ p ∂~q ! µλ ; [pν , pλ ] = T T ∂~p ∂~p ∂~p ∂~p − ∂~q ∂~p ∂~p ∂~q Se sigue entonces que (9.516) se puede escribir como: ~ ~ − q, q − ~q, ~p 0̃l −I˜l C = C Ẽ = J˜Ẽ J˜T = T ˜ ~ ~ ~q , ~p Il C 0̃l − p, p ! (9.519) µλ (9.520) 408 / Mecánica clásica avanzada O sea que las condiciones de canonicidad de la transformación también se pueden expresar por medio de los corchetes de Poisson, según (9.520): [~q , ~q ] = 0̃l ; [~p, ~p] = 0̃l ; [~q, ~p] = C I˜l , o en términos de los elementos de matriz. [q ν , q λ ] = 0 ; [pν , pλ ] = 0 ; [q ν , pλ ] = Cδνλ ; ν, λ = 1, 2, ...l (9.521) Las ecuaciones (9.521) coinciden con (9.423) cuando la transformación canónica es univalente. Sean ahora dos variables dinámicas f (q, p, t) y g(q, p, t). Al expresar a las qν , pν ; ν = 1, 2, ...l, en términos de las variables (q, p, t) por medio de la transformación canónica, obtenemos las variables dinámicas f (q, p, t) y g(q, p, t). O sea que los corchetes de Poisson de f con g pueden evaluarse bien respecto a las variables (q, p) o respecto a las variables (q, p). Mostremos qué vale la identidad: [f, g](q,p) = C[f, g](q,p) (9.522) notemos que: [f, g](q,p) = = [f, g](q,p) = = l X ∂f ∂g ∂f ∂g − ∂qν ∂pν ∂pν ∂qν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q (9.523) l X ∂f ∂g ∂f ∂g − ∂q ν ∂pν ∂pν ∂q ν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q Las ecuaciones (9.523) se pueden expresar de la siguiente manera con la notación de (9.498): [f, g](q,p) = ∂g ∂g , ∂~q ∂~p ∂f ∂~q Ẽ ∂f ∂~p (9.524) y similarmente [f, g](q,p) . Veamos cómo se transforman las derivadas respecto a qν y respecto a pν en función de las derivadas respecto a q ν y respecto a pν : l X ∂f ∂qµ ∂f ∂pµ ∂f = = + ∂qν ∂q ν ∂qν ∂pµ ∂qν µ=1 T T ∂~q ∂f ∂~p ∂f − ∂~q ∂~q ∂~q ∂~p ! (9.525) ν Las transformaciones canónicas / 409 y similarmente para ∂f /∂pν . Vemos entonces que: T T ∂~p ∂f ∂~q ∂f ∂f + ∂~q ∂~p ∂~q ∂~q ∂~q = = ∂f T T ∂~q ∂f ~ ∂ p ∂f + ∂~ p ∂~ p ∂~q ∂~p ∂~p T T ∂f ∂~p ∂~q ∂~q ∂~q ∂~q T T ∂f ∂~q ∂~p ∂~p ∂~ p ∂~p (9.526) Comparando a (9.526) con (9.501) vemos que: [∂f /∂~q, ∂f /∂~p] = J˜T ∂f /∂~q, ∂f /∂~p Es decir: ∂f ∂~q ∂g ∂g ˜ ˜T (9.527) J Ẽ J [f, g](q,p) = , ~ ∂~ q ∂p ∂f ∂~p De acuerdo con (9.516) obtenemos entonces: ∂f ∂~q ∂g ∂g = C [f, g] C Ẽ [f, g](q,p) = , (q,p) ∂~ q ∂~p ∂f ∂~p (9.528) Hemos mostrado que si la transformación (q, p) → (q, p) es canónica entonces se cumple la igualdad (9.522). El inverso también vale: si para cualquier par de variables dinámicas f y g vale la identidad (9.522) para una y la misma constante C 6= 0, entonces la transformación de las 2l variables qν y pν a las 2l variables q ν y pν es canónica con valencia C. Este es pues otro test del carácter canónico de una transformación. Para una transformación canónica univalente, C = 1, se cumple: [f, g](q,p) = [f, g](q,p) (9.529) En otras palabras, los corchetes de Poisson son invariantes bajo transformaciones canónicas univalentes, lo cual es el mismo resultado (9.402). En resumen, para estas transformaciones es innecesario especificar respecto a cuales variables se evalúan los corchetes de Poisson. Otras propiedades de los corchetes de Lagrange. Sea el siguiente conjunto de 2l variables dinámicas: u1 , u2 , ...ul , v1 , v2 , ...vl . Usando notación vectorial, dicho 410 / Mecánica clásica avanzada conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes corchetes de Lagrange y Poisson: [~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v } A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l: [~u, ~u] [~u, ~v ] {~u, ~u} {~u, ~v } ; L̃ = P̃ = (9.530) [~v , ~u] [~v , ~v ] {~v , ~u} {~v , ~v } Mostremos que se cumple lo siguiente: L̃P̃ = I, donde I˜ es la identidad de orden 2l. Los corchetes de Langrange se pueden expresar en forma similar a (9.524): ∂~q ∂f ∂~q ∂~p {f, g} = Ẽ , ∂~p ∂g ∂g ∂f (9.531) Un elemento tı́pico de la matriz L̃P̃ es de la forma siguiente: 2l X i=1 {xn , xi } [xi , xm ] = 2l X i=1 ∂~z T ∂~z Ẽ ∂xi ∂xn ! ∂xm T ∂xi Ẽ ∂~z ∂~z ! (9.532) donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector [~ q , p~].13 Notando que: 2l X ∂zr ∂xi ∂zr = = δrs ; ∂x ∂z ∂zs i s i=1 Ẽ 2 = −I˜ (9.533) y que: Eµr Ert ∂zt ∂xm = −δnm ∂xn ∂zµ (9.534) obtenemos entonces que: 2l X i=1 {xn , xi } [xi , xm ] = −δnm ⇒ L̃P̃ = −I˜ (9.535) O sea que el corchete de Lagrange es, excepto por el signo, el recı́proco del corchete de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes de Poisson son invariantes bajo transformaciones canónicas univalentes, por tanto se 13 Véase las fómulas (9.385). Las transformaciones canónicas / 411 sigue la invariancia de los corchetes de Lagrange bajo estas fransformaciones.14 Otras propiedades de los corchetes de Lagrange son las siguientes: q ~q ~ , = Ẽ p~ p ~ {~ q, f } = ∂~p ∂~q ; {~ p, f } = − ∂f ∂f (9.536) {g, f } = −{f, g} {cf, g} = {f, cg} = 1 {f, g} c No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que los corchetes de Lagrange no permiten definir un álgebra. Ejemplo 9.9.1 Analizar la siguiente transformación compleja, y si es canónica, hallar la función generatriz y la valencia. 1 1 q = √ (q + ip) ; p = √ (q − ip) 2 2 La transformación puede escribirse en la forma: √ √ p = i(q − 2q) ; p = 2q − q (9.537) (9.538) La transformación será canónica libre de primera clase con valencia C, si, de acuerdo con (9.158), puede generarse por una función tal que: Cp = ∂F ∂F ; p=− ∂q ∂q (9.539) Es simple mostrar que la transformación (9.537) será canónica si F y C están dadas por: F = 1 2 1 2 √ q + q − 2qq ; C = −i 2 2 (9.540) De acuerdo con (9.159), el nuevo hamiltoniano será: H = iH (9.541) Es simple mostrar de (9.492) que {q, p} = −i. Ejemplo 9.9.2 En la transformación canónica del ejemplo 9.9.1 hallar el corchete de Poisson de q, y de p. Resolver el problema del oscilador armónico lineal usando dicha transformación canónica. 14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes de movimiento porque para evaluarlos hay que conocer todas esas constantes. 412 / Mecánica clásica avanzada Como la transformación (9.537) es canónica con valencia C = −i, se sigue de la fórmula general para los corchetes de Poisson que: [q, p] = −i (9.542) resultado que también puede obtenerse directamente de las fórmulas de la transformación. Nótese que toda transformación lineal con coeficientes constantes en el espacio de fases bidimensional será canónica con valencia igual al determinante de la matriz de la transformación: q = aq + bp ; p = eq + f p ⇒ c = af − be (9.543) El hamiltoniano del oscilador armónico lineal es: H= 1 p2x + kx2 2m 2 (9.544) y puede escribirse en la forma siguiente: H= 1 I(q 2 + p2 ) 2 mediante la transformación: r √ I q ; px = Imω p x= mω (9.545) (9.546) donde k = mω 2 e I es una constante que puede tomar cualquier valor. En la transformación (9.546) procedemos por analogı́a con una correspondiente transformación cuántica. Si ahora realizamos la transformación canónica: 1 i q = √ (q + p) ; q = √ (p − q) 2 2 (9.547) obtenemos para H: H = Iωqp (9.548) entonces el hamiltoniano CH será: −iH = −iIωN (9.549) donde llamamos N a: N = qp podemos ver que E = IN y que: N , q = −q ; N , p = p (9.550) (9.551) Vemos que q, p y N son análogos a los operadores de destrucción, de creación y de número, â, â+ , N̂ , de la mecánica cuántica. Las transformaciones canónicas / 413 La transformación (9.543) es de cambio de escala, o sea que según las fórmulas (9.191) y (9.192) es libre de segunda clase, con valencia igual al producto de los factores de escala: r mω 1 1 C= ·√ (9.552) = I I Imω de modo que el hamiltoniano correspondiente a las variables canónicas q y p será ωqp. Entonces, el hamiltoniano correspondiente a q y p es: H = −iωq p (9.553) Las fórmulas (9.551) nos permiten escribir directamente las ecuaciones de movimiento de Poisson, ecuaciones (9.363): q̇ = q, H ; ṗ = p, H (9.554) con lo cual de (9.553) y (9.551) obtenemos: q̇ = −iωq ; ṗ = iωp (9.555) Que podemos integrar fácilmente: q = q 0 e−iωt ; p = q ⋆0 eiωt (9.556) donde hemos notado que q y p son complejo conjugadas entre sı́. Utilizando las fórmulas (9.547) obtenemos a q y p en función del tiempo: √ √ q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt ) (9.557) Es claro que q 0 puede determinarse de las condiciones iniciales sobre q y p: √ √ (9.558) q0 = 2Re q 0 ; p0 = 2Imq0 Entonces obtenemos para q(t) y p(t) en términos de sus valores iniciales: q = q0 cos ωt + p0 sen ωt (9.559) p = p0 cos ωt + q0 sen ωt y para las variables originales x y px , obtenemos: x = x0 cos ωt + px0 sen ωt mω (9.560) px = px0 cos ωt − mωx0 sen ωt Ejemplo 9.9.3 Analizar las dispersiones de x y de px para un ensamble de osciladores armónicos lineales que tengan la misma energı́a. El ensamble está ilustrado en el ejemplo 4.8.1, sección 4.8. 414 / Mecánica clásica avanzada Los distintos sistemas del ensamble difieren sólo por la fase. La dispersión en x se caracteriza por su varianza (∆x)2 , definida por: (∆x)2 = h(x − hxi)2 i = hx2 i − hxi2 (9.561) x = Ax sen(ωt + δ) (9.562) donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma: Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los promedios de ensamble microcanónicos: A2x ; hxi = 0 (9.563) 2 px se comporta análogamente. Obtenemos entonces que: 1 1 (∆x)2 = A2x ; (∆p)2 = A2p (9.564) 2 2 El producto ∆x ∆px será entonces: 1 (9.565) (∆x) (∆px ) = Ax Ap 2 Notamos según el ejemplo 9.9.2 que los máximos valores de x y px , que se obtienen de las fórmulas (9.560), son: px A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20 (9.566) m ω que pueden expresarse en función de q0 y p0 mediante (9.546): I A2x = (q 2 + p20 ) ; A2p = Iωm(q02 + p20 ) (9.567) mω 0 Reemplazando (9.548) en (9.546) obtenemos: hx2 i = (∆x) (∆px ) = I(q02 + p20 ) (9.568) Notando que según (9.550): N = (Re q 0 )2 + (Im q 0 )2 (9.569) Entonces obtenemos al usar (9.549): E (9.570) ω Este valor no depende del tiempo, en concordancia con el teorema de Liouville, ejemplo 4.8.4, sección 4.8. El resultado (9.569) es una propiedad del ensamble o sea que para un valor dado de E, queda determinado de manera única el valor del producto ∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este producto; o sea que una disminución de ∆x implica un aumento en ∆px y viceversa. Según la desigualdad de Heisenberg para osciladores mecánico-cuánticos: h̄ ∆x ∆px ≥ (9.571) 2 se sigue entonces de (9.551) que E ≥ h̄ω/2. Si tomamos I igual a la constante de Planck, se sigue también de (9.551) que E = nh̄ω. Estos resultados recuerdan a análogos resultados mecánico-cuánticos. ∆x ∆px = IN = 10 La ecuación de Hamilton-Jacobi con variables de acción-ángulo Aquı́ estudiaremos más en detalle el significado fı́sico de las soluciones de la ecuación de Hamilton-Jacobi con énfasis en los sistemas que presentan movimientos multiperiódicos. Se desarrollará la teorı́a hasta el punto en el cual se perciban claramente las diferencias y similitudes con la mecánica cúantica, cuando se trate con sistemas atómicos. Las soluciones y los métodos de solución de la ecuación de Hamilton-Jacobi han merecido numerosos estudios. El método de separación de variables permite en principio resolver cualquier problema integrable introduciendo las coordenadas adecuadas. Los modelos no integrables, como el famoso problema de los tres cuerpos, son objeto de muchas investigaciones en la actualidad. Un estudio matemático de los principales casos en que se resuelve la ecuación de Hamilton-Jacobi está en la sección 27 del texto de (Gantmacher Op. cit.). 10.1. Los invariantes adiabáticos Desde cuando el fı́sico aleman Max Planck en 1899 descubrió que la absorción y la emisión de energı́a radiante por la materia no se producen en cantidades arbitrarias sino de una manera cuantizada, los fı́sicos han tratado de introducir las ideas cúanticas en la mecánica clásica. En 1913 Niels Bohr explicó el espectro del hidrógeno con la mecánica clásica más dos suposiciones de tipo cúantico: que los electrones sólo tienen ciertos movimientos periódicos (órbitas) estables y no un continuo de tales movimientos, y que pueden pasar entre dos órbitas adyacentes por emitir o absorber un cuanto de luz. Los movimientos ligados de los sistemas cuánticos aislados que son estables o estacionarios forman un conjunto discreto. Los demás estados son inestables, aunque ligados, y forman un conjunto continuo; son estados no estacionarios. Desde entonces hasta la actualidad (y pasará algún tiempo hasta que la cuestión sea definitivamente resuelta), los fı́sicos téoricos investigan los movimientos estables que presentan los sistemas atómicos; con ello se busca determinar la causa de que ciertos estados sean estables y los demás sean inestables. A comienzos del siglo la cuestión de interés no era tanto las causas de 415 416 / Mecánica clásica avanzada la cuantización de los sistemas atómicos (lo cual se tomó como un dato experimental) sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se halló que las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden cambiar sólo por múltiplos enteros de la constante de Planck h̄ y deben permanecer absolutamente inalteradas cuando se someta el sistema a una influencia externa que no sea capaz de causar una alteración de magnitud h̄ en esa cantidad. Tales cantidades se llaman invariantes adiabáticos y fueron extensivamente estudiados por P. Ehrenfest en los años 1914-1923.1 Los invariantes adiabáticos de la vieja teorı́a cúantica coinciden con las llamadas variables de acción. Un invariante adiabático para un sistema de un grado de libertad. Sea un sistema de un grado de libertad en un estado arbitrario de movimiento acotado con lo cual el movimiento además será periódico. Sea λ un parámetro caracterı́stico de los efectos externos sobre el sistema; si λ cambia, cambian los efectos externos sobre el sistema con lo cual se realizará un trabajo y posiblemente cambie también la frecuencia de la oscilación además de la energı́a total. Ciertamente la energı́a total dependerá del valor de λ siendo constante para cada valor que tenga λ: E = E(q, p, λ). Las expresiones para la energı́a total y el perı́odo del movimiento son de la forma: 1 (10.1) E = a(q, λ) q̇ 2 + U (q, λ) 2 Z q2 √ 2a dq √ T = (10.2) E −U q1 donde q1 y q2 son las raı́ces de la ecuación E = U (q, λ) para valores dados de E y λ. Puesto que E depende de λ, T depende de E y de λ. Si λ cambia con el tiempo, E dependerá del tiempo a través de λ: Ė = ∂E λ̇ ∂λ (10.3) Se dice que el parámetro λ varı́a adiabáticamente si: λ̇ ≪ λ T (10.4) es decir, si λ varı́a muy poco en el curso de un perı́odo del movimiento del sistema. Un invariante adiabático es una cantidad que no cambia cuando el sistema se somete a una variación adiabática de λ. Sabemos que, en virtud de las ecuaciones de Hamilton: Ḣ = ∂H ∂t (10.5) O sea que para un sistema conservativo como el que consideramos aquı́: Ė = 1 El ∂H ∂H λ̇ = ∂t ∂λ (10.6) tema continúa estudiándose en la actualidad. Véase por ejemplo: K.P. Marzlin, B.C. Sanders, Physics review letters 93, 160408(2004). También http://xxx.lanl.gov/abs/quant-ph/0405059. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 417 Como λ varı́a muy poco en un perı́odo del movimiento, podemos considerar que λ̇ también es constante. Entonces al promediar la ecuación (10.6) sobre un perı́odo obtenemos: Z 1 T ∂H Ė = λ̇ dt (10.7) T 0 ∂λ De acuerdo con una de las ecuaciones de Hamilton se cumple: dt = dq ∂H/∂p (10.8) La ecuación (10.7) se puede entonces escribir como: I ∂H/∂λ dq ∂H/∂p (10.9) Ė = λ̇ I 1 dq ∂H/∂p H donde denota la integral de lı́nea sobre la trayectoria de fases del sistema en un perı́odo de movimiento. En un perı́odo, por hipótesis, λ cambia muy poco, por tanto E es constante, según (10.6). Como una trayectoria de fases se caracteriza por la relación: p = p(q; E, λ) (10.10) donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego: dHc ∂Hc ∂Hc ∂p = + dλ ∂λ ∂p ∂λ (10.11) Como durante un perı́odo E no cambia apreciablemente y HC = E se cumple aproximadamente que: ∂Hc ∂Hc /∂λ =− ∂p ∂p/∂λ (10.12) como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple: 1 ∂Hc = ∂p ∂p/∂E Reemplazando a (10.12) y (10.13) en (10.9) obtenemos: I ∂p dq − ∂λ Ė = λ̇ I ∂p dq ∂E La ecuación (10.14) se puede escribir en la forma: I ∂p ∂p Ė + λ̇ dq = 0 ∂E ∂λ (10.13) (10.14) (10.15) 418 / Mecánica clásica avanzada Dado que durante un perı́odo E y λ permanecen prácticamente constantes, de (10.10) se sigue que: ∂p ∂p ∂p Ė + λ̇ = ∂t ∂E ∂λ (10.16) y podemos sin mayor error reemplazar a Ė por Ė, con lo cual en vez de (10.15) podemos escribir: I I d ∂p dq = 0 (λ̇2 ) ⇒ p dq = 0 + 0(λ̇2 ) (10.17) ∂t dt Se define la variable de acción J como: I J = p dq (10.18) Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiabático (una cantidad que no cambia cuando λ varı́a adiabáticamente). Concluimos que J depende de la energı́a del sistema pero varı́a muy poco con λ. Esto permite calcular a partir de J la frecuencia del movimiento: I I I ∂p 1 ∂J = dq = dq = dt = T (10.19) ∂E ∂E ∂HC /∂p o sea que: ν= 1 ∂J/∂E (10.20) La ecuación (10.18) tiene la siguiente interpretación geométrica: J es el valor del área encerrada por la curva de fases que describe el sistema en un perı́odo. La invariancia adiabática de J permite concluir que una perturbación al sistema que varı́a lentamente con el tiempo puede producir una deformación de la trayectoria de fases pero de tal manera que no se cambia el valor del área encerrada por esa curva. J también se puede escribir como una integral de superficie: Z J = dq dp (10.21) Ejemplo 10.1.1 Evaluar la variable de acción J para un oscilador armónico unidimensional. En este caso el hamiltoniano constante es: H= p2 1 + mω 2 q 2 = E 2m 2 (10.22) que puede escribirse en la forma: q2 p2 + =1 2mE 2E/(mω 2 ) (10.23) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 419 p La ecuación (10.23) define una elipse en el plano de fases cuyos semiejes son y 2E/(mω 2 ). El valor de J es igual al área encerrada por la elipse, esto es: p √ E J = π ( 2mE) ( 2E/(mω 2 )) = 2π ω √ 2mE (10.24) La invariancia adiabática de J significa en este caso que al variar lentamente los parámetros del oscilador (m y ω), la energı́a varı́a de manera proporcional a la frecuencia ω. Ejemplo 10.1.2 Mostrar explı́citamente la invariancia adiabática de J para un péndulo simple sometido a un acortamiento o alargamiento adiabático de la cuerda, para pequeñas oscilaciones. En este caso el hamiltoniano, constante, es: H= 1 2 2 ml ϕ̇ + mgl(1 − cos ϕ) = E 2 (10.25) para pequeñas oscilaciones: ϕ̇2 ϕ2 1 2 2 1 ml ϕ̇ + mgl ϕ2 = E ⇒ + =1 2 2 2 2E/(ml ) 2E/(mgl) (10.26) que es la ecuación de una elipse en el plano ϕ − ϕ̇, el área encerrada es: p 2πE E 1 √ = 2π 2E/(mgl) = ω ml2 ml gl H Es claro que J = p dq está dada también por la expresión (10.24): π p 2E/(ml2 ) (10.27) E ω (10.28) J = 2π para probar la invariancia adiabática de J, calculemos el trabajo realizado al variar la longitud del hilo del péndulo en una cantidad dl. Este trabajo es: dA = −mlϕ̇2 − mg cos ϕ dl (10.29) en (10.29) el primer término representa el trabajo de la fuerza de la ligadura y el segundo el trabajo de la fuerza de gravedad. Para pequeñas oscilaciones (10.29) se puede escribir como: 1 (10.30) dA = −mg dl + mg ϕ2 − mlϕ̇2 dl 2 El primer término en (10.30), −mg dl, representa el trabajo hecho para subir la posición de equilibrio de la masa del péndulo; y el otro término representa la energı́a comunicada a la oscilación, que llamaremos dE: 1 (10.31) mg ϕ2 − mlϕ̇2 dl dE = 2 420 / Mecánica clásica avanzada Sabemos que para un valor dado de l los valores medios de las energı́as cinética y potencial son iguales, e iguales a la mitad de la energı́a total E (teorema del virial): 1 2 2 1 1 ml ϕ̇ = mgl ϕ2 = E 2 2 2 (10.32) Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos que: E dl 2l (10.33) dω 1 dl =− ω 2 l (10.34) dE = − p Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es proporcional al cambio fraccional de l cuando la longitud del péndulo se altera en dl: Comparando a (10.33) y (10.34) obtenemos que: dω dE = E ω (10.35) Se sigue por integración de (10.35) que: J E = = Constante 2π ω (10.36) Argumentos similares se pueden usar cuando ω se varı́a lentamente a causa de alguna otra influencia externa. Se usó el carácter adiabático de la variación en l, dl, al tomar en (10.31) el promedio temporal: se asumió que dl es prácticamente constante durante un perı́odo de la oscilación. Como el oscilador armónico del ejemplo de (10.22) equivale matemáticamente a un péndulo con una amplitud de oscilación pequeña, se sigue que E/ω es constante en tal caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad, E/ω no es un invariante adiabático, aunque para tales sistemas habrá otros invariantes adiabáticos. 10.2. Los toroides invariantes En la sección 9.6 analizamos en detalle la solución de las ecuaciones de movimiento de un sistema conservativo generalizado por el método de Hamilton-Jacobi. Esto nos condujo a la ecuación de Hamilton-Jacobi independiente del tiempo, ecuaciones (9.305) y siguientes del capı́tulo anterior. El resultado es que para tales sistemas es posible hallar una transformación canónica generada por Σ, que permite expresar a (~q, p~) en función de (~q, ~p), dados por pν = αν (ν = 1, 2, ...l − 1), pl = −t + αl , q ν = βν (ν = 1, 2, ...l) donde αν y βν son 2l constantes y se exige que Bl = h. Si no se toma a h coincidiendo con una ~ se obtendrá la solución en términos de de las βν sino que se deja en general h = H(β) ~ ~q = ~γ t + α ~ ~ ~p = β, ~ donde α ~ y β son las constantes de integración y ~γ son funciones de β. El formalismo de las variables acción-ángulo se caracteriza por: La ecuación de Hamilton-Jacobi con variables acción-ángulo / 421 (a) Es aplicable a sistemas conservativos generalizados. (b) Se define para sistemas ligados. (c) Se identifican las l constantes pν con l invariantes adiabáticos del sistema. (d) Si existen las l constantes de movimiento se dice que el sistema es integrable. Los sistemas integrables se caracterizan por poseer un número de constantes de movimiento uniformes igual al número de grados de libertad:2 en un sistema no integrable el número de constantes de movimiento uniformes es menor que l, y la trayectoria fásica cubrirá (total o parcialmente) regiones de más de l dimensiones en el espacio fásico. Veremos que si el sistema posee más constantes de movimiento uniformes que el número de grados de libertad, entonces la trayectoria fásica cubre regiones de dimensión menor que l y además la separación de variables es posible en más de un sistema de coordenadas. Las ecuaciones de movimiento de un sistema hamiltoniano de l grados de libertad son de la forma: ẋi = fi (x1 , x2 , ...x2l , t) ; i = 1, 2, ..,2l (10.37) Una integral primera del sistema (10.37) es una función constante que se obtiene a partir del mismo: d Φ(x1 , x2 , ...x2l , t) = 0 (10.38) dt La integral primera Φ = C es una superficie 2l dimensional en el espacio de 2l + 1 dimensiones, de coordenadas x1 , x2 , ...x2l , t, que posee la propiedad de que cada curva integral que tiene un punto común con esta superficie está enteramente contenida en ella. Si se han hallado k integrales primeras: Φi (x1 , x2 , ...x2l , t) = Ci ; i = 1, 2, ...k (10.39) Y si todas estas integrales son independientes, o sea, si al menos un determinante: Φ1 , Φ2 , ...Φk 6= 0 (10.40) J xj1 , xj2 , ...xjk donde xj1 , xj2 , ...xjk son k funciones cualesquiera de las x1 , x2 , ...x2l , entonces a partir de las ecuaciones (10.39) se pueden expresar k funciones de t desconocidas xj1 , xj2 , ...xjk en función de las demás y sustituyéndolas en (10.37), reducir el problema a la integración de un sistema de ecuaciones con menos incógnitas que 2l. Si k = 2l y todas las integrales son independientes, entonces (10.39) es un sistema de 2l ecuaciones algebraicas con las 2l incógnitas xi , que puede resolverse en el caso en que todas las funciones Φi sean uniformes. Sucede a veces que entre las Φi hay algunas que son funciones multiformes del estado del sistema y entonces las funciones Φ1 , Φ2 , ...Φ2l no determinan unı́vocamente el estado cuando toman los valores constantes C1 , C2 , ...C2l . Para que un sistema de ecuaciones diferenciales (10.37) sea integrable es suficiente, pues, que existan l integrales primeras uniformes. Cuando el sistema permite la separación de variables en la forma: Z Fi (xi ) dxi = t; i = 1, 2, ..,2l (10.41) 2 Es posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las ecuaciones de movimiento. 422 / Mecánica clásica avanzada se dice que el sistema se integra por cuadraturas. Teorema de Liouville sobre los sistemas integrables. Recordemos que una función Φ es una integral primera de un sistema de hamiltoniano H si su corchete de Poisson con H es nulo: [H, Φ] = 0 (10.42) Estamos excluyendo la constante t0 , conjugada canónica de H, y funciones de t0 . Dos funciones F1 y F2 del estado de un sistema hamiltoniano están en involución si su corchete de Poisson es nulo. Liouville demostró que si en un sistema de l grados de libertad se conocen l integrales primeras independientes y uniformes en involución entonces ese sistema se integra por cuadraturas. El enunciado exacto del teorema es: sean l funciones en involución: Φ1 , Φ2 , ...Φl ; [Φµ , Φν ] = 0 ; µ, ν = 1, 2, ...l (10.43) en un espacio fásico de dimensión 2l. Consideremos los subespacios (hipersuperficies 2l − 1 dimensionales): Sν = {(q, p) : Φν (q, p) = Cν } ; ν = 1, 2, ...l (10.44) y el producto directo de los mismos: Mc = {(q, p) : Φν = Cν ; ν = 1, 2, ...l} (10.45) Suponemos que sobre Mc las l funciones Φν son independientes (esto es, que los l gradientes de las hipersuperficies Sν son linealmente independientes en cada punto de Mc ). Entonces, recordando el teorema sobre simetrı́as y leyes de conservación de la sección 9.8, como los Φν son generadores infinitesimales de las transformaciones canónicas que dejan invariante a H, se cumple que: (i) Mc es un subespacio invariante bajo cada una de las transformaciones canónicas infinitesimales generadas por Φ1 = H, Φ2 , ...Φl . (ii) Si las funciones Φν son continuas y uniformes y tales que (q) y (p) siempre toman valores finitos, entonces el subespacio Mc corresponde con un toroide de dimensión l: T l = {ϕ1 , ϕ2 , ...ϕl } mod 2π (10.46) donde ϕ1 , ϕ2 , ...ϕl son coordenadas angulares sobre el toroide invariante T l . (iii) El hamiltoniano H genera sobre Mc un movimiento que se denomina cuasiperiódico, definido en términos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 , ...ϕl ) sobre el toroide invariante T l : d ϕ ~=~ ω; dt ~ ω ~ =ω ~ (C) (10.47) (iv) Las ecuaciones canónicas de Hamilton se integran por cuadraturas.3 3 Una demostración rigurosa del teorema puede verse en el libro de V. Arnold, Les méthodes matématiques de la mecánique classique, Mir, Moscú, 1976. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 423 Ejemplo 10.2.1 Aplicar el teorema de Liouville al estudio del oscilador bidimansional. Según el teorema de Liouville sobre sistemas integrables, si en un sistema canónico de dos grados de libertad se conoce una integral primera F que no depende de H, entonces el sistema se integra por cuadraturas; el subespacio definido por H = h y F = f siendo f y h dos constantes, es un toro invariante sobre el cual el movimiento es cuasiperiódico. Para precisar, consideremos un oscilador bidimensional descrito por el hamiltoniano: H= p2y 1 p2x + + m(ωx2 x2 + ωy2 y 2 ) 2m 2m 2 (10.48) El sistema de ecuaciones diferenciales (10.37) para este caso es: ẋ = px ; m ẏ = ṗx = −mωx2 x ; py m (10.49) ṗy = −mωy2 y Es fácil ver que: px py p˙x + mωx2 x ẋ = ṗy + mωy2 y ẏ = 0 m m (10.50) Con lo cual se obtiene que las siguientes son integrales primeras: 1 p2x + mωx2 x = E1 ; 2m 2 p2y 1 + mωy2 y 2 = E2 2m 2 (10.51) La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase (x, px ) y (y, py ) dadas por las elipses (10.51). Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51); dado que H = E1 + E2 . La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio fásico; tal hipersuperficie es de dimensión 3, en tanto que H1 = E1 es unidimensional siendo la hipersuperficie MEE1 bidimensional. El producto directo de las elipses definidas por (10.51) es un toroide de dimensión 2, en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen una superficie bidimensional, que se puede hacer corresponder topológicamente con un toroide bidimensional (véase figura 10.1). El movimiento cuasiperiódico generado por H sobre ME1 E2 se define en términos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante, con frecuencias angulares constantes que dependen de los valores de E1 y E2 : d~ ϕ =~ ω(E1 , E2 ) dt (10.52) Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria de fases es cerrada y por lo tanto ocupa una región de dimensión menor a la del toro, es 424 / Mecánica clásica avanzada ϕ2 ϕ1 Figura 10.1 Toroide generado por H. decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante de movimiento además de E1 y E2 . Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada con la degeneración, que es el momento angular: A = xpy − ypx (10.53) Cuando ωy = 2ωx la constante es: A = (m2 ωx2 x2 − p2x ) y + xpx py (10.54) y cuando ωx = 2ωy , es constante: A = (m2 ωy2 y 2 − p2y ) x + ypx py (10.55) Para el caso ωx = ωy es fácil ver que hay otra constante dada por: B = px py + m2 ω 2 xy (10.56) y que se cumple: [E2 , B] = −mω 2 A ; [E2 , A] = B m (10.57) o sea que E2 con B1 y E2 con A no están en involución. Tampoco A y B están en involución puesto que su corchete de Poisson vale E2 − E1 . Pero aún es posible formar una combinación lineal de A y B que esté en involución con E1 y con E2 : C = B + mω tan(ϕ10 − ϕ20 ) A (10.58) donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios. Resultados análogos se esperan cuando las frecuencias satisfacen la relación nωx = mωy donde n y m son números enteros. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 425 Vectores tangentes a Mc . Como las l funciones Φν son independientes, también serán linealmente independientes los l vectores gradientes 2l-dimensionales, perpendicu~ν . lares a las superficies Φν = Cν , que llamaremos V ∂Φν ∂Φν ∂Φν V~ν = (10.59) , , ... ∂q1 ∂q2 ∂pl ~ν no tiene componentes a lo largo de un vector Ẽ V ~µ , donde la matriz Un vector V simplicial Ẽ fue definida en la sección 9.9. En efecto: ∂Φµ ∂~q ∂Φν ∂Φν (10.60) V~ν · Ẽ V~µ = Ẽ , = [Φµ , Φν ] = 0 ∂~q ∂~ p ∂Φµ ∂~p Entonces concluimos que sobre el subespacio l-dimensional Mc existen l vectores linealmente independientes, tangentes a Mc en cada punto. En efecto, los V~ν son linealmente independientes, y como los autovalores de Ẽ son todos diferentes se concluye que los Ẽ V~ν son linealmente independientes. Se sigue entonces que en cada punto de Mc un vector tangente (por ejemplo la dirección de la trayectoria de fases en ese punto) puede expresarse como combinación ~ν (ν = 1, 2, ...l). lineal de los l vectores Ẽ V Si se realiza en un punto de Mc la transformación canónica infinitesimal generada por Φν , de acuerdo con la fórmula (9.349), el cambio experimentado por una variable dinámica f está dado por: ∂f ∂f ~ν ∂ν f = ǫ [f, Φν ] = −ǫ · Ẽ V (10.61) , ∂~q ∂~p Se sigue entonces que el cambio 1 0 0 0 1 0 ~q ∂ν = −ǫ . . . .. .. .. p ~ 0 0 0 experimentado por el vector de estado (~q, ~p) es: . . . 0 . . . 0 ~ ~ (10.62) .. .. .. .. Ẽ V ν = −ǫẼ Vν . . . . . . . 1 O sea que los desplazamientos producidos por cada una de las transformaciones canónicas infinitesimales generadas por Φ1 , Φ2 , ...Φl están contenidos totalmente dentro del subespacio Mc . Con esto queda demostrada la proposición (i) del teorema de Liouville. En particular, para cuando Φ1 = H se tiene que: q ~ −∂H/∂~p ∂H ⇒ ~q˙ = ∂H ; ∂ = −ǫ ~p˙ = − (10.63) ∂~p ∂~q p~ ∂H/∂~q 426 / Mecánica clásica avanzada como debe ser. Hemos mostrado que cualquier desplazamiento sobre Mc se puede obtener por medio de las l transformaciones canónicas asociadas a las integrales primeras Φν en involución. Como en cada punto de Mc cada uno de los vectores tiene una dirección bien definida, concluimos que a cada integral primera Φν se le puede asociar una familia de trayectorias “paralelas” sobre la superficie de Mc y que en consecuencia a las l integrales primeras en involución Φν se les puede asociar un sistema de coordenadas curvilı́neas sobre Mc . En efecto, los l desplazamientos finitos asociados a los l grupos de transformaciones correspondientes a las Φν se pueden describir mediante l parámetros reales. Si fijamos sobre Mc un punto (~q, p~) ≡ x0 , entonces cualquier punto de Mc se puede obtener de éste por acción de los l grupos de transformaciones asociados a Φ1 , Φ2 , ...Φl : g(~r)x0 ≡ g1 (r1 ) g2 (r2 ) ...gl (rl )x0 = xr1 , r2 , ...rl ∈ Mc (10.64) donde gν (rν ) es la transformación finita asociada a Φν siendo rν el parámetro. Entonces los vectores ~r ≡ (r1 , r2 , ...rl ) definen unı́vocamente los puntos de Mc . Correspondencia entre Mc y un toroide de dimensión l. Por hipótesis la región Mc es acotada, ya que estamos tratando con sistemas ligados. Como consecuencia de esto, los vectores ~r = (r1 , r2 , ...rl ) que sirven para caracterizar los puntos de Mc tienen componentes acotadas. Para precisar, llamemos Rl al espacio euclı́deo l-dimensional en el cual están definidos los vectores ~r; en consecuencia, la región del espacio fásico Mc está asociada a un subespacio l-dimensional acotado de Rl mediante la fórmula (10.64). Como la región Mc es acotada, ciertamente existen transformaciones g(~r) que retornan un punto arbitrario x0 de Mc en sı́ mismo: g(~r)x0 = x0 (10.65) Podemos, por ejemplo, definir l transformaciones independientes que retornen a x0 en sı́ mismo de la siguiente manera: g1 (1)x0 = x0 ; g2 (1)x0 = x0 ; ...gl (1)x0 = x0 (10.66) Es decir, asociar el intervalo (0, 1) a cada una de las lı́neas cerradas que se obtienen por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que gν (mν )x0 = x0 donde mν es un número entero. Por tanto podemos caracterizar el conjunto de todas las transformaciones de la forma (10.65) mediante los vectores enteros: ~r = (m1 , m2 , ...ml ) ; mν = ... − 2, −1, 0, 1, ... (10.67) A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que podemos hacer corresponder a la región Mc un toroide de dimensión l, T l , definido como el producto cartesiano de l cı́rculos, siendo definidos los puntos de los l cı́rculos mediante coordenadas angulares ϕν mod 2π: T l = {(ϕ1 , ϕ2 , ...ϕl )} ; ϕ ~ mod 2π (10.68) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 427 Existe una completa correspondencia entre T l y la región de Rl que representa los puntos de Mc . Por tanto es posible asociar a los puntos de Mc un toroide de dimensión l. Toda la argumentación depende de la existencia de transformaciones sobre Mc de la forma (10.65) para cualquier punto de Mc . Existencia en Mc de movimientos cuasiperiódicos. La transformación canónica generada por H tiene por parámetro a t. Entonces la correspondencia entre Mc y T l permite asociar a cada valor de t un punto (ϕ1 , ϕ2 , ...ϕl ) mod 2π sobre T l . El movimiento generado por H en Mc se presenta uniforme sobre T l debido a que una variación ∆t en el parámetro t se traduce en variaciones ∆ϕ1 , ∆ϕ2 , ...∆ϕl en las coordenadas sobre T l . Como ciertamente la variación del parámetro t es uniforme, de igual manera serán uniformes las variaciones en las coordenadas angulares sobre T l . En consecuencia: ϕ̇ν = ων ; ων = ων (~c) ; ϕ ~ (t) = ϕ ~ (0) + ~ω t (10.69) Hemos justificado las tres primeras proposiciones del teorema de Liouville. Las superficies de sección de Poincaré. Asumamos que el espacio de fases es 4-dimensional (sistema autónomo de dos grados de libertad). Escojamos una superficie bidimensional, que puede o no coincidir con uno de los planos de fase; para precisar tomemos el plano x − px en un valor de y determinado. Cada vez que la trayectoria de fases cruza el plano x − px en una dirección dada, un punto en el valor de x y px es marcado sobre la superficie. Después de muchos ciclos de la trayectoria, en el plano quedará formada una figura de puntos. Si tomamos como referencia el oscilador armónico bidimensional (ejemplo 10.2.1), la figura tendrá forma elı́ptica (véase figuras 10.2 y 10.3). Cada elipse corresponde a una trayectoria. Un comportamiento similar ocurre en las intersecciones con el plano x = 0. Los planos x − px y y − py son ejemplos de superficies de sección y las figuras de puntos formados permiten obtener conclusiones acerca de las frecuencias del movimiento. Si las frecuencias son conmensurables, las intersecciones de la trayectoria con las superficies de sección se repiten debido a que la trayectoria es cerrada, en caso contrario, las intersecciones cuando t → ∞ forman una curva continua sobre la superficie de sección, que no es otra cosa que la intersección del toroide invariante con la superficie de sección. Que las intersecciones de la trayectoria con una superficie de sección están localizadas sobre una curva única es una consecuencia de la existencia de una constante de movimiento además de la energı́a. En efecto la conservación de la energı́a, H(x, y, px , py ) = E (10.70) permite expresar una variable en términos de las otras tres, py = py (x, y, px ). Entonces es suficiente considerar la proyección de la trayectoria sobre el volumen tridimensional (x, y, px ). Si hay una constante de movimiento además de H, I(x, y, px , py ) = C (10.71) entonces (10.70) y (10.71) se pueden combinar para darnos: px = px (x, y) (10.72) 428 / Mecánica clásica avanzada px 0 0 x Figura 10.2 Superficies de sección de Poincaré en el plano x − px py 0 0 y Figura 10.3 Superficies de sección de Poincaré en el plano y − py O sea que las intersecciones sucesivas de la trayectoria con la superficie de sección y = 0 deben estar sobre la curva única px = px (x, 0). Consideremos ahora el toroide asociado a las constantes de movimiento E y C, MEC . Las coordenadas angulares sobre MEC son ϕ1 y ϕ2 siendo ω1 y ω2 las frecuencias correspondientes. Ciertamente la relación de frecuencias es función de E y C: α(E, C) = ω1 (E, C) ω2 (E, C) (10.73) Para α = r/S, con r y S enteros, la trayectoria sobre el toro es periódica, cerrándose al completarse r revoluciones en ϕ1 y S revoluciones en ϕ2 . En la superficie de sección ϕ2 = Constante habrán S puntos fijos sobre una circunferencia de radio R que depende solamente de E y C. Las sucesivas intersecciones están separadas por un tiempo La ecuación de Hamilton-Jacobi con variables acción-ángulo / 429 ∆t = 2π/ω2 . Durante este intervalo, ϕ1 avanza por ω1 ∆t = 2πα. La aplicación “twist” de Moser. Las ecuaciones que describen el movimiento de la N -ésima a la (N +1)-ésima intersección de la trayectoria con la superficie de sección son: RN +1 = RN ; ϕN +1 = ϕN + 2πα (10.74) La ecuación (10.74) constituye una aplicación (o mapeo discreto) de los puntos de la superficie de sección en ella misma. 10.3. Las variables acción-ángulo ~ ϕ Mostremos que es posible definir una transformación canónica (~q, p~) → (I, ~ ) de ~ que son los manera tal que hay l integrales primeras Φν dependientes únicamente de I, momentos canónicamente conjugados de las coordenadas angulares sobre el toroide T l correspondiente a Mc . ~ son coordenadas de los puntos de Mc en el espacio fásico 2lCiertamente (~ ϕ, Φ) dimensional y satisfacen las ecuaciones direrenciales ordinarias siguientes: ~ dΦ d~ ϕ ~ = 0; =ω ~ (Φ) dt dt que se integran inmediatamente para darnos: ~ ~ ~ t Φ(t) = Φ(0) ; ϕ ~ (t) = ϕ ~ (0) + ~ω Φ(0) (10.75) (10.76) ~ no son necesariamente canónicas, es posible construir l Aunque las variables (~ ϕ, Φ) ~ tales que (I, ~ ϕ funciones de las Φν , que llamaremos Iν = Iν (Φ), ~ ) sean variables canónicas. Las Iν , son llamadas las variables de acción y junto con las variables angulares ϕν forman en la vecindad de Mc un sistema de variables canónicas acción-ángulo. Las cantidades Iν son integrales primeras del sistema de hamiltoniano H = Φ1 puesto que son funciones de integrales primeras. A su vez, las Φν pueden expresarse en función de las Iν . Entonces en las variables acción-ángulo las ecuaciones canónicas con hamiltoniano que sólo depende de los “momentos” canónicos, son: ∂H dI~ =− = 0; dt ∂ϕ ~ d~ ϕ ∂H ~ = ~ω (I) (10.77) = dt ∂ I~ Las funciones ων están restringidas por la condición que resulta de la continuidad ~ de la función H(I): ∂2H ∂2H ∂ων ∂ωµ = ⇒ = ∂Iν ∂Iµ ∂Iµ ∂Iν ∂Iµ ∂Iν (10.78) Variables acción ángulo para l = 1. Debemos encontrar una transformación canónica (q, p) → (I, ϕ) que satisfaga las dos condiciones siguientes: I dϕ = 2π (10.79) I = I(h) y Mh 430 / Mecánica clásica avanzada En este caso el “toro” es una lı́nea cerrada. Es claro que la función generatriz del tipo F2 para esta transformación es Σ(I, q), que satisface: p= H ∂Σ ; ∂q ∂Σ ,q ∂q ϕ= ∂Σ ∂I = h(I) (10.80) (10.81) siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relación h(I) es biunı́voca se sigue que cada curva Mh está definida por un valor de I. Sobre una curva definida h por un valor de I, se sigue de (10.80) que: dΣ|I=Constante = p dq En la vecindad de un punto q0 la acción vale:4 Z q p dq = Area Σ(I, q) = (10.82) (10.83) q0 La segunda condición en (10.79) depende del comportamiento global de Σ(I, q). La función Σ no es uniforme pues al dar un ciclo completo sobre la curva Mh cambia su valor por una constante igual al área encerrada por la curva. Esto no afecta el valor de ∂Σ/∂q pero sı́ el de ϕ = ∂Σ/∂I puesto que el área depende de I. Si llamamos ∆Σ(I) al área, I p dq (10.84) ∆Σ(I) = Mh Entonces (10.80) define a ϕ con la indeterminación de un múltiplo entero de d∆Σ/dI. Para que se satisfaga la segunda condición de (10.79) es necesario entonces que: d∆Σ(I) ∆Σ A = 2π ⇒ I = = dI 2π 2π o sea que I debe valer: I 1 I= p dq 2π Mh (10.85) (10.86) Si el área A depende de h, entonces existe la función h(I) inversa de I(h). El perı́odo del movimiento sobre la curva cerrada Mh en el plano de fases (q, p) está dado por: T = dA(h) dh (10.87) Hemos demostrado además que la variable de acción es un invariante adiabático, de acuerdo con la definición dada por (10.18). 4 Esta integral de lı́nea ciertamente está sobre la trayectoria del sistema, pero no está evaluada siguiendo el movimiento del sistema: es una propiedad intrı́nseca de los puntos q y q0 del “toro”. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 431 Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador armónico unidimensional del ejemplo 10.1.1 usando las variables acción-ángulo. ω0 ≡ De acuerdo con el ejemplo 10.1.1, para un oscilador armónico de constante k, con p k/m el área encerrada por la elipse definida por H = E es: A= E 2πE ⇒ I= ω0 ω0 (10.88) La frecuencia del movimiento es entonces: ω= ∂E = ω0 ∂I (10.89) que en este caso particular resulta independiente del valor de I. Las fórmulas (10.80) permiten resolver las ecuaciones de movimiento usando el formalismo de las variables acción-ángulo. En efecto: Z qq Z q 2mE − m2 ω02 q 2 dq p dq = Σ(I, q) = (10.90) q0 q0 entonces: ϕ= ∂Σ = ∂I Z q q0 r dq = sen−1 2I − q2 mω0 r mω0 q 2I lo cual nos dice que: r r 2I 2I q= sen ϕ = sen (ϕ0 + ω0 t) mω0 mω0 (10.91) (10.92) donde hemos absorbido en ϕ la constante de integración de (10.91). Resulta que la variable angular ϕ es la fase de las oscilaciones. Ejemplo 10.3.2 Aplicar el formalismo de las variables acción-ángulo para hallar la solución a las ecuaciones de movimiento del péndulo plano y realizar un estudio del espacio fásico correspondiente. Las ecuaciones de movimiento son: ṗ = −F sen θ ; θ̇ = Gp (10.93) donde F = mgL, G = 1/(mL2 ) siendo mg la fuerza gravitacional, L la longitud del péndulo, θ el ángulo respecto a la vertical y p el momento angular conjugado a θ. El hamiltoniano es: H= 1 2 Gp − F cos θ = E 2 (10.94) El problema es completamente separable, como ocurre siempre cuando hay un grado de libertad. Una descripción cualitativa del movimiento se obtiene a partir de un diagrama de energı́a y otro de las trayectorias de fase (véase figura 10.4). F es el mayor 432 / Mecánica clásica avanzada valor de la energı́a potencial. Si E > F , entonces p es siempre diferente de cero y el movimiento es no acotado en θ (rotación). Para E < F , el movimiento es acotado (libración). Para E = F , tenemos el movimiento separatriz, en el cual el perı́odo de oscilación se hace infinito. Hay dos puntos singulares en p = 0: el origen en θ = 0, que es estable o punto singular elı́ptico; y la intersección de las dos ramas de la separatriz en θ = ±π, que es inestable o punto singular hiperbólico. Una trayectoria de fases cerca a un punto singular elı́ptico permanece en su vencindad, en tanto que una trayectoria cerca a un punto hiperbólico diverge de él. El perı́odo está dado por: r I dθ 1 √ T = (10.95) 2G E + F cos θ Sobre la separatriz vemos de (10.93) que la fuerza restauradora y la velocidad son cero en θ = π, de modo que T es infinito. p Punto elíptico Rot. Sep. Lib. E>F E=F E<F –2π –π 0 π 2π θ Punto hiperbólico Figura 10.4 Curvas de fase para el péndulo Transformemos ahora el hamiltoniano a variables acción ángulo, usando la definición (10.86): r Z 2 θmax 2 (E + F cos θ) dθ (10.96) I(E) = π 0 G y las expresiones (10.80) y (10.83): Z 1 dE θ ∂Σ dα r = φ(θ, E) = ∂I G dI 0 2 (E + F cos α) G (10.97) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 433 donde θmax = π/2 para rotación (E > F ) y cos θmáx = −H/F para libración (E < F ). El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite en principio expresar a E en función de I. En (10.79) se supone que Mc representa una lı́nea cerrada. Sin embargo la definición es posible ampliarla para incluir no sólo libración sino rotación. Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente: s 1 E θ 1+ sen η = sen (10.98) 2 F 2 obtenemos: I= y, 8 π r E(k) − (1 − k 2 )K(k) , k < 1 F G 1 kE(k −1 ) , k>1 2 F (η, k) /K(k) , k<1 π ϕ= 2 2F (η/2, k −1) /K(k −1 ) , k > 1 (10.99) (10.100) siendo F (η, k) y E(η, k) las integrales elı́pticas incompletas de primera y segunda especie respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales elı́pticas completas de primera y segunda especie (véase sección 8.4). Z η dξ p = sen−1 (sen η) F (η, k) = 2 2 1 − k sen ξ 0 (10.101) Z ηp E(η, k) = 1 − k 2 sen2 ξ dξ 0 k está dada por: E (10.102) F y es una medida de la energı́a normalizada del oscilador. k = 1 cuando E = 1 (la energı́a de la separatriz) y k < 1 para libración y k > 1 para rotación. De (10.95) obtenemos para la frecuencia normalizada: 1/K(k) , k<1 ω(k) π = (10.103) ω0 2 2k/K(k −1 ) , k > 1 √ donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del punto singular elı́ptico. El valor asintótico de K cerca a k = 1 nos da una frecuencia normalizada cerca a la separatriz: (π/2)/ln 4(1 − k 2 )−1/2 , k < 1 ω = (10.104) lı́m k→1 ω0 π/2 ln 4(k 2 − 1)−1/2 , k>1 2k 2 = 1 + que tiende a cero cuando k tiende a 1. 434 / Mecánica clásica avanzada Ejercicio 10.3.1 Mostrar que para la trayectoria separatriz se cumple: p=± 2ω0 θ cos ; G 2 θ = 4tan−1 (eω0 t ) − π (10.105) Variables acción ángulo para l grados de libertad. En el caso unidimensional, donde el toroide invariante se reduce a una lı́nea, la integral de lı́nea en (10.86) coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria. Sean γ1 , γ2 , ...γl , l lı́neas cerradas sobre el toroide Mc , topológicamente equivalentes a circunferencias. Sobre cada lı́nea especificamos un punto mediante una coordenada ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesariamente con trayectorias, que según veremos en general no son cerradas; es decir, en el caso general ninguna de las lı́neas γν coincide con la proyección de la trayectoria de fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por: 1 Iν = 2π Z l Z 1 X p~ · d~q = pν dqµ 2π µ=1 γµ γν (10.106) Consideramos sobre Mc un “tubo de caracterı́sticas” que pasan por los puntos de γν en un tiempo dado (véase figura 10.5). En un tiempo posterior t′ los puntos del tubo de caracterı́sticas que en t estaban sobre γν pasarán a formar un contorno cerrado diferente γν′ . En la sección 9.4 se demostró que la integral de Poincaré I1 no cambia de valor al ser evaluada sobre contornos que envuelven el mismo tubo de caracterı́sticas y tales que los puntos de dichos contornos representen estados simultáneos. γν γ′ν Figura 10.5 Tubo de caracterı́sticas sobre el toroide Se sigue entonces en virtud de la invariancia de la integral de Poincaré que: Z Z p~ · d~q = ~p · d~q (10.107) γν γν′ Se sigue de (10.106) que el valor de la variable de acción Iν no varı́a al deformar la curva cerrada γν . De la topologı́a de un toroide se sigue que no es posible por deformación hacer coincidir una curva γµ con otra γν independiente, o sea que la topologı́a del toroide determina de manera única los l números I1 , I2 , ...Il definidos por (10.106). La ecuación de Hamilton-Jacobi con variables acción-ángulo / 435 ~ ϕ Como (Φ, ~ ) son las coordenadas de los puntos de la vecindad de Mc , entonces si las Iν son independientes, o sea si I1 , I2 , ...Il J 6= 0 (10.108) C1 , C2 , ...Cl entonces en la vecindad del toroide se pueden tomar como coordenadas las variables ~ ϕ). (I, De acuerdo con el método de Hamilton-Jacobi, la siguiente es la función generatriz ~ ϕ de la transformación canónica (~ q, p ~) → (I, ~) 5 ~ ~ Σ(I, q) = Z q ~ q ~0 ~ ~ p~(I, q ) · d~q (10.109) de acuerdo con las fórmulas: p~ = ∂Σ ; ∂~q ϕ ~= ∂Σ ∂ I~ (10.110) ~ ~q), la cual en principio Como sabemos, (10.109) no permite evaluar la función Σ(I, se obtiene resolviendo la ecuación de Hamilton-Jacobi independiente del tiempo: ∂Σ ~ ,~ q = h(I) (10.111) H ∂~q Queda claro que el sistema es integrable si es posible encontrar l contornos cerrados independientes tales que existen las l cantidades I1 , I2 , ...Il , lo cual es posible independientemente de poder resolver la ecuación (10.111) por separación de variables. La función Σ es multivaluada sobre Mc . El cambio experimentado al realizarse un circuito sobre una lı́nea γν es igual a: I dΣ = 2πIν (10.112) ∆ν Σ = γν Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una función unı́voca que especifica la transformación canónica. Como en el caso unidimensional, la no uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto el cambio en la variable angular ϕν al realizarse un circuito sobre la lı́nea γµ está dado por: ∆µ ϕν = ∆µ ∂Σ ∂ = ∆µ Σ = 2πδµν ∂Iν ∂Iν (10.113) Por otra parte, las variables de acción están indeterminadas por una constante que no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae problemas como los provenientes de la no uniformidad de Σ. 5 La integral (10.109) es una integral de lı́nea que no depende de la trayectoria seguida para llegar de ~ q0 a q~. 436 / Mecánica clásica avanzada Sistemas separables. Hay casos en los cuales mediante una adecuada elección de las coordenadas resulta que la función Σ puede escribirse en la forma: ~ ~ Σ(I, q) = l X ~ qν ) Σν (I, (10.114) ν=1 se dice entonces que el sistema es completamente separable. Para un sistema de este tipo las ecuaciones (10.110) toman la forma: pν = ∂ ~ qν ) ; Σν (I, ∂qν ϕν = l X ∂ ~ qµ ) Σµ (I, ∂I ν µ=1 (10.115) ν = 1, 2, ...l En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acción pueden definirse por las integrales: I 1 1 Iν = ∆ν Σν = pν dqν (10.116) 2π 2π donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la sección 9.4. Sistemas multiplemente periódicos degenerados. Cuando el sistema es separable, las variables angulares describen la proyección del punto representativo del sistema sobre el plano de fases correspondiente (pν , qν ) y ων es la frecuencia angular correspondiente al movimiento de tal proyección sobre la trayectoria cerrada. Entonces tanto qν como pν son funciones periódicas del tiempo. Puede ocurrir que todas las frecuencias sean conmensurables entre sı́; entonces existen nuḿeros enteros m1 , m2 , ...ml tales que, si T1 , T2 , ...Tl son los perı́odos sobre las proyecciones en los planos de fases se cumple: m1 T1 = m2 T2 = ... ml Tl = T (10.117) en este caso la trayectoria de fases es cerrada y el sistema como un todo es periódico. Se dice entonces que el sistema es completamente degenerado. Si el sistema es no degenerado o parcialmente degenerado, entonces (10.117) no se cumple y nunca retorna a su estado inicial, pero cuando T es suficientemente grande entonces pasa arbitrariamente cerca al estado inicial y se dice que el movimiento es cuasiperiódico sobre el toroide invariante. En este caso la trayectoria, independientemente de las condiciones iniciales, es uniformemente distribuida sobre el toroide. Este enunciado constituye el teorema ergódico. Podemos decir que si el sistema es no degenerado es ergódico. Si hay degeneración esto no se cumple. En las coordenadas en que el sistema es separable, qν y pν son funciones periódicas del tiempo con frecuencia angular ων . Entonces cualquier función uniforme F (~q, p~ ) del La ecuación de Hamilton-Jacobi con variables acción-ángulo / 437 estado del sistema es periódica respecto a las variables angulares y su perı́odo respecto a cada una de ellas es 2π. Su expansión de Fourier es de la forma: F (~ q , p~) = ∞ X ∞ X ... n1 =−∞ n2 =−∞ ∂E ∂E ∂E n1 + n2 + ... nl t An1 , n2 , ...nl exp i ∂I1 ∂I2 ∂Il n =−∞ ∞ X (10.118) l Cada término de esta suma es periódico respecto al tiempo con frecuencia angular: ∂E ∂E ∂E n1 + n2 + ... nl ∂I1 ∂I2 ∂Il (10.119) pero como estas frecuencias no son conmensurables en general, la suma no es periódica. En particular, no serán periódicas las coordenadas y momentos (~q, p~) en las cuales el sistema no sea separable. En algunos casos particulares, dos o más de las frecuencias ων = ∂E/∂Iν son conmensurables para todos los valores de las Iµ . La existencia de degeneración conlleva una reducción del nuḿero de variables de acción independientes de las cuales depende de la energı́a. En efecto si ω1 y ω2 son tales que: n1 ∂E ∂E = n2 ∂I1 ∂I2 (10.120) donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 sólo en la combinación n2 I1 + n1 I2 : E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il ) (10.121) Cuando hay degeneración, el número de integrales de movimiento uniformes es mayor que l. En efecto, la siguiente cantidad es constante de movimiento: A = n1 ϕ1 − n2 ϕ2 (10.122) la constancia de la cual es evidente de (10.120). Además está constante de movimiento no depende de las Iν , que son las variables canónicamente conjugadas de las ϕν . Al realizarse un circuito sobre la lı́nea γν , el cambio en A está dado, en virtud de (10.113), por: ∆ν A = (n1 δ1ν − n2 δ2ν ) 2π (10.123) o sea que A no es uniforme, pero su no uniformidad consiste en la adición de un múltiplo entero de 2π. Por tanto, tomando una función trigonométrica arbitraria de A se obtiene una nueva integral de movimiento uniforme. Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador armónico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 . 438 / Mecánica clásica avanzada Es simple mostrar que A(I1 , I2 , ϕ1 , ϕ2 ) en (10.53) vale: 2p A= I1 I2 sen(ϕ1 − ϕ2 ) m y en (10.54) vale: p A = 2I1 mI2 ω1 sen(2ϕ1 − ϕ2 ) (10.124) (10.125) De (10.123) se sigue que estas constantes de movimiento son uniformes. En el cálculo hemos usado la fórmula (10.92) para cada uno de los grados libertad, en coordenadas cartesianas. Ejemplo 10.3.4 En la sección 5.2 mostramos que el oscilador armónico bidimensional cuando ω1 = ω2 es separable en coordenadas cartesianas y en coordenadas polares. Resolver este problema en coordenadas polares usando las variables acción ángulo. La ecuación de Hamilton-Jacobi para el problema es: " 2 2 # 1 ∂Σ 1 ∂Σ 1 + mω02 r2 = E + 2 2m ∂r r ∂ϕ 2 (10.126) Resolviendo a (10.126) por separación de variables obtendremos las dos ecuaciones diferenciales ordinarias siguientes: 2 l2 dΣr dΣϕ + 2 + m2 ω02 r2 = 2mE (10.127) = l; dϕ dr r donde l2 es la constante de separación. Salvo constantes de integración, las soluciones son: Z r l2 Σϕ = lϕ ; Σr = (10.128) 2mE − 2 − m2 ω02 r2 dr r Entonces las cuatro ecuaciones (10.115) toman la forma: r l2 pϕ = l ; pr = 2mE − 2 − m2 ω02 r2 r ϕr = ϕ ϕϕ = ϕ ∂l + ∂Ir Z ∂l + ∂Iϕ Z 1 ∂l2 ∂E − 2 ∂Ir r ∂Ir r dr 2 l 2 2 2 2 2mE − 2 − m ω0 r r (10.129) 2m 2m r 1 ∂l2 ∂E − 2 ∂Iϕ r ∂Iϕ l2 2 2mE − 2 − m2 ω02 r2 r dr (10.130) (10.131) La variable de acción Iϕ vale: Iϕ = l (10.132) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 439 y la variable de acción Ir vale: Z rmax r 1 l2 Ir = ·2 2mE − 2 − m2 ω02 r2 dr 2π r rmı́n (10.133) donde rmı́n y rmax están dados por la fórmula (5.76). Mediante la sustitución x = r2 , (10.133) toma la forma: I q 1 1 Ir = −m2 ω02 x2 + 2mEx − l2 dx (10.134) 2π x La integral se hace fácilmente usando la técnica de los residuos teniendo en cuenta que en el plano complejo el integrando es una función biforme (positivo en el intervalo (xmı́n , xmax ) y negativo entre (xmax , xmı́n )), presentándose entonces una lı́nea de ramificación entre xmı́n y xmax . Por otra parte el integrando tiene singularidades en x = 0 y x = ∞, presentándose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y el residuo en x = ∞ (que se obtiene con la sustitución y = 1/x) vale E/(2πω0 ). En consecuencia, usando (10.132): E = ω0 (Ir + Iϕ ) (10.135) La técnica para evaluar este tipo de integrales puede verse en el apéndice II del libro de Born, The mechanics of the atom o en la sección 9-7 del libro de Goldstein. Esto nos permite escribir entonces (10.130) y (10.131) como: Z dr r (10.136) ϕr = mω0 l2 2 2 2 2mE − 2 − m ω0 r r Z mω0 − l/r2 r ϕϕ = ϕ + dr (10.137) l2 2 2 2 2mE − 2 − m ω0 r r Estas integrales coinciden con las evaluadas en el capı́tulo 5, que aparecieron en las fórmulas (5.67) y (5.75): El resultado para r en función de ϕr se obtiene directamente de (5.81): ! r ω02 l2 E 2 (10.138) 1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr ) r = mω02 E La ecuación de la órbita r(ϕ) depende de la diferencia ϕϕ − ϕr y de una constante de integración que se puede absorber por ϕϕ . Como según (10.135) el movimiento es degenerado (ωr = ωϕ = ω0 ), resulta que ϕϕ − ϕr es una constante. La integral en (10.131) es idéntica a (5.67). El resultado para ϕ en términos de las variables acción ángulo es: e + sen 2ϕr 1 (10.139) ϕ = ϕϕ − ϕr + sen−1 2 e sen 2ϕr + 1 440 / Mecánica clásica avanzada La constante (10.122) que aparece cuando hay frecuencias degeneradas es: A = ϕr − ϕϕ (10.140) Los cambios en A al realizarse circuitos sobre las lı́neas γr y γϕ respectivamente son ∆r A = 2π y ∆ϕ A = −2π. O sea que ϕ no es una función uniforme, lo cual introduce dificultades para tomar a (r, ϕ, pr , pϕ ) como variables de estado. Cuando Iϕ = 0, ϕ = π/4 − A y cuando Iϕ = Ir + Iϕ , ϕ = ϕϕ = ϕr − A. Sólo una función que contenga funciones trigonométricas de A es uniforme. El toroide invariante en coordenadas polares está definido por las ecuaciones H = E y pϕ = l. En este caso degenerado queda reducido a una curva cerrada: p2r + l2 + m2 ω02 r2 = 2mE ; r2 pϕ = l (10.141) El potencial efectivo presenta dos puntos de retorno en r, en tanto que en ϕ no hay puntos de retorno. Las figuras 10.6 y 10.7 muestran las envolventes de las trayectorias en el plano de la órbita y algunas órbitas, para l = 0 y para l 6= 0. Las ecuaciones paramétricas de la curva en el plano r − Pr son: r2 = r02 (1 + e sen 2ϕr ) ; p2r = m2 ω02 r02 e2 cos2 2ϕr 1 + esen 2ϕr (10.142) l≠0 Figura 10.6 Envolventes de las trayectorias en el plano de la órbita para l 6= 0 La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes valores de e. Cuando e → 1, las trayectorias cerca a rmı́n son muy “planas”, de modo que cuando e = 1, los puntos con pmax y pmı́n están unidos por una lı́nea recta vertical levantada en rmı́n = 0. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 441 l=0 Figura 10.7 Envolventes de las trayectorias en el plano de la órbita para l = 0 1 pr (mω0r0) e=1 e = 0,8 e = 0,6 0,5 e = 0,4 e = 0,2 e=0 0 0,5 1 r/r 0 1,5 –0,5 –1 Figura 10.8 Curvas de fases para diferentes valores de e Como r es positivo, la trayectoria para e = 1 es un arco de elipse con los extremos unidos por una lı́nea recta vertical, o sea que en r = 0, pr cambia abruptamente de signo. e = 1 corresponde a un movimiento pendular. En este caso el “toroide” se convierte 442 / Mecánica clásica avanzada en un segmento de lı́nea, pues en cualquier movimiento real los puntos de la lı́nea recta vertical son recorridos a velocidad infinita. En coordenadas polares son constantes de movimiento E y l. Como consecuencia de la degeneración hay otra constante que es una función trigonométrica de A. Tal constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 . px puede expresarse en función de pr y pϕ mediante la fórmula: 1 px = pr cos ϕ − pϕ sen ϕ r (10.143) pϕ es una constante igual a l, cuyo valor tiene la siguiente expresión en función de e: p l = mω0 r02 1 − e2 (10.144) remplazando pr de (10.142) en (10.143) obtenemos: p mω0 r0 e cos ϕ cos 2ϕr − 1 − e2 sen ϕ px = √ 1 + e sen 2ϕr (10.145) con lo cual E1 puede llevarse a la forma: E1 = mω02 r02 1 [e (1 + cos 2ϕ)(e + sen 2ϕr ) 2 1 + e sen 2ϕr √ +1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ] De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ: √ (e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A cos 2ϕ = 1 + e sen 2ϕr √ (e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A sen 2ϕ = 1 + e sen 2ϕr (10.146) (10.147) La sustitución de (10.147) en (10.146) nos conduce finalmente a: E1 = 1 mω02 r02 (1 + e sen 2A) 2 (10.148) y en consecuencia: E2 = 1 mω02 r02 (1 − e sen 2A) 2 (10.149) Sistemas no separables. Como una consecuencia del teorema de Liouville sobre los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de movimiento uniformes admite un sistema de variables acción ángulo, siendo las variables de acción l constantes de movimiento uniformes y las variables agulares l funciones lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento no uniformes. En un sistema no integrable, el número de constantes de movimiento uniformes es menor que l y por tanto la trayectoria de fases cubrirá regiones de más de l dimensiones. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 443 Cuando hay un número de constantes de movimiento uniformes superior a l, se tiene un sistema integrable degenerado. Sistemas separables degenerados. En este caso es posible construir más de l constantes de movimiento uniformes en involución. Entonces hay diferentes maneras de escoger el conjunto de l variables de acción y por tanto hay diferentes transformaciones canónicas a variables acción ángulo. Sean (q, p) → (I, ϕ) y (q, p), (I ′ , ϕ′ ) dos de tales transformaciones, entonces las variables (q, p) en los dos casos deben ser diferentes. Llegamos a otra propiedad fundamental de los sistemas degenerados consistente en que las ecuaciones de movimiento son separables en diferentes sistemas de coordenadas. Ejemplo 10.3.5 Mostrar que en un oscilador armónico bidimensional cuando ωx = 2ωy (o ωy = 2ωx ) es posible la separación de variables en coordenadas parabólicas. En el ejemplo 10.2.1 hallamos que cuando ωy = 2ωx existen tres constantes de movimiento uniformes independientes, E1 , E2 y A (10.54), cuando la separación de variables se hace en coordenadas cartesianas. En términos de las coordenadas parabólicas ξ y η las coordenadas cartesianas x, y están dadas por: p (10.150) x = ξ−η; y = ±2 ξη ; 0 ≤ (ξ, η) < ∞ En este sistema de coordenadas curvilı́neas, las curvas de ξ constante son parábolas confocales con ejes a lo largo de x y abiertas hacia la izquierda. Las curvas de η constante son parábolas confocales con ejes a lo largo del eje x pero abiertas hacia la derecha y ortogonales a la familia ξ = constante. En ambos casos el foco está en el origen. Las ecuaciones cartesianas de esas familias de curvas son: y 2 − 4ηx = 4η 2 (η = Constante) y y 2 + 4ξx = 4ξ 2 (ξ = Constante) (10.151) La sustitución de (10.150) en (10.151) hace triviales a estas últimas identidades, como debe ser. El lagrangiano en coordenadas cartesianas es: m m 2 L= ẋ + ẏ 2 − ωy2 (4x2 + y 2 ) (10.152) 2 2 cuando ωx = 2ωy . En coordenadas parabólicas es: ! 1 η̇ 2 ξ˙2 L = m(ξ + η) − 2mωy2 (ξ 2 + η 2 − ξη) (10.153) + 2 ξ η Por tanto el hamiltoniano en coordenadas parabólicas es: H= 1 ξp2ξ + ηp2η + 2mωy2 (ξ 2 + η 2 − ξη) 2m ξ + η La ecuación de Hamilton-Jacobi es: " 2 2 # 1 1 ∂Σ ∂Σ ξ + 2mωy2 (ξ 2 + η 2 − ξη) = E +η 2m ξ + η ∂ξ ∂η (10.154) (10.155) 444 / Mecánica clásica avanzada Haciendo Σ = Σξ (ξ) + Ση (η) (10.156) obtenemos las ecuaciones: 2 dΣξ 2ξ + 8mωy2 ξ 3 − 4mEξ = β dξ 2η dΣη dη 2 (10.157) + 2mωy2 η 3 − 4mEη = −β (10.158) donde β es la constante de separación. Integrando estas ecuaciones hallamos: Z s Z s β β 2 2 2 Σ= − 4m ωy ξ dξ + − 4m2 ωy2 η 2 dη (10.159) 2mE + 2mE − 2ξ 2η La constante β tiene la siguiente expresión en términos de las variables de estado: β = 2ξη p2ξ − p2η + 8m2 ωy2 ξη(ξ − η) ξ+η (10.160) y cumple un papel análogo al de la constante l cuando ωx = ωy . En efecto, cuando β 6= 0 los potenciales efectivos en los movimientos unidimensionales equivalentes tienen las siguientes expresiones: ξ Vef (ξ) = β 1 4mωy2 ξ 2 − ; 2 4mξ η Vef (η) = 1 β 4mωy2 η 2 + 2 4mη (10.161) De las gráficas de energı́a potencial efectiva se deducen los valores de retorno en ξ y η y por tanto las parábolas que envuelven las trayectorias en el plano x − y. Tales curvas envolventes se denominan “cáusticas”. La figura 10.9 muestra las cáusticas para diferentes signos de β y algunas de las trayectorias. La solución analı́tica en variables acción ángulo requiere evaluar las variables de acción y por medio de las ecuaciones (10.115) hallar las ecuaciones de la trayectoria. Al conocer la función E(Iξ , Iη ) se hallan las frecuencias ωξ , ωη que contendrán alguna relación racional de la forma (10.120) y luego se puede obtener una constante de movimiento adicional, de la forma (10.122). Es interesante notar que al separar el movimiento en coordenadas cartesianas hay una constante ligada a la degeneración que es (10.55). Tal constante es precisamente β. Para mostrar esto, notemos que las fórmulas de la transformación inversa a (10.150) son: p p x + x2 + y 2 −x + x2 + y 2 ξ= ; η= (10.162) 2 2 dado que los momentos están conectados por las fórmulas: pξ ∂x/∂ξ ∂y/∂ξ px = pη py ∂x/∂η ∂y/∂η (10.163) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 445 y y η2 η1 ξ1 ξ2 ξ2 y η2 x x x ξ2 η2 β>0 β=0 β<0 Figura 10.9 Curvas envolventes o “cáusticas” para distintos valores de β se sigue que: pξ = pη = px + s −px + p −x + x2 + y 2 p py x + x2 + y 2 s p x + x2 + y 2 p py −x + x2 + y 2 (10.164) Reemplazando a (10.164) y (10.162) en (10.160) se sigue que: β = 2[ypx py + x(m2 ωy2 y 2 − p2y )] (10.165) Similarmente, la constante ligada a la degeneración en coordenadas parabólicas puede tomarse como E1 : ! ξp2ξ − ηp2η 1 E1 = + 2mωy2 (ξ − η)2 (10.166) 2m ξ+η 10.4. Problema de Kepler (coordenadas esféricas) El hamiltoniano para una partı́cula de masa m sometida al efecto de un centro de fuerzas inmóvil que crea un potencial −k/r es: ! p2ϕ 1 p2θ k 2 H(r, θ, pr , pθ , pϕ ) = pr + 2 + 2 − (10.167) 2m r r sen2 θ r Este problema admite la separación completa de variables en la ecuación de HamiltonJacobi, en la forma: Σ(r, θ, ϕ) = Σϕ (ϕ) + Σθ (θ) + Σr (r) (10.168) 446 / Mecánica clásica avanzada obteniéndose las siguientes ecuaciones diferenciales: 2 dΣϕ = lz2 dϕ r 2 dΣr dr dΣθ dθ 2 2 + (10.169) − 2mkr − 2mEr2 = −l2 (10.170) lz2 = l2 sen2 θ (10.171) donde l y lz son las constantes de separación. Los puntos de retorno en θ y r, donde pθ = 0 y pr = 0, están dados por: ! r k 2El2 rmax, min = − 1± 1+ ; 2E mk 2 sen θmax, min = ± (10.172) lz l La variable de acción Iθ está dada por: Z θmax r I r lz2 l2 2 2πIθ = 2 dθ = l − l2 − z2 dθ 2 sen θ sen θ θmı́n (10.173) donde se ha notado que pθ es positivo cuando θ se incrementa de θmı́n = sen−1 (lz /l) a θmax = π − θmı́n y es negativo cuando θ decrece de θmax a θmı́n , y que el integrando es una función par de θ. Con la sustitución η = sen2 θ, Iθ toma la forma: s Z l 1 l2 η − lz2 2πIθ = 2 dη (10.174) 1−η lz /l2 η y con la sustitución r −lz2 + l2 u x= 1−u (10.175) llegamos a: 2πIθ = 4 l2 − lz2 Z ∞ 0 (x2 x2 dx + lz2 )(x2 + l2 ) Descomponemos el integrando en fracciones parciales: Z ∞ Z ∞ dx dx 2 2 − lz 2πIθ = 4 l x2 + l2 x2 + lz2 0 0 (10.176) (10.177) para llegar finalmente a: Iθ = l − lz (10.178) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 447 Por otra parte, de (10.169) se sigue directamente: Iϕ = lz (10.179) Obteniendo las siguientes expresiones para las constantes l y lz en términos de las variables de acción: l = Iθ + Iϕ ; Ir está dado por: Z 2πIr = lz = lϕ rmax rmı́n pr dr − (10.180) Z rmı́n pr dr = 2 Z rmax pr dr (10.181) rmı́n rmax Llamando a y b a: a=− k ; 2E l b= √ −2mE (10.182) Podemos escribir a p2r como: " 2 2 # b a a 2 pr = −2mE −1 + 2 − r a r (10.183) De tablas de integrales estándar como la de Schaum’s hallamos: Z √ 2 √ Ar + Br + C Ar2 + Br + C dr = r B −2Ar − B + √ sen−1 √ 2 −A B 2 − 4AC (10.184) √ Br + 2C − −Csen−1 √ r B 2 − 4AC Por tanto: Z √ √ r−a pr dr = −2mE −r2 + 2ar − b2 + a sen−1 √ a2 − b 2 ar − b2 −1 √ −b sen r a2 − b 2 y teniendo en cuenta que: p rmin, max = a ± a2 − b2 llegamos a: Z rmax rmı́n pr dr = √ −2mE (a − b)π (10.185) (10.186) (10.187) 448 / Mecánica clásica avanzada De donde se tiene la siguiente expresión para E en función de Ir , Iθ , Iϕ : E=− mk 2 2(Ir + Iθ + Iϕ )2 (10.188) Entonces a y b en términos de las variables de acción toman la forma: a= (Ir + Iθ + Iϕ )2 ; mk b= (Iθ + Iϕ )(Iθ + Iϕ + Ir ) mk Σr y Σθ pueden escribirse como: Z p 1 1 Σr = (Ir + Iθ + Iϕ ) −r2 + 2ar − b2 dr a r Z s Iϕ2 1 1− dθ Σθ = (Iθ + Iϕ ) 2 (Iθ + Iϕ ) sen2 θ (10.189) (10.190) (10.191) Solución para el movimiento radial. Según la ecuación (10.115), la variable angular ϕr es: ϕr = ∂Σr ∂Σ = ∂Ir ∂Ir (10.192) Al derivar la integral (10.190) usamos las expresiones auxiliares: 2a ∂a = ; I = Ir + Iθ + Iϕ ∂I I " 2 # 2(1 − ǫ2 )a2 Iθ + Iϕ ∂ a2 = ∂I I I ǫ2 = 1 − ∂ ∂I Iθ + Iϕ I 1 I =− a a Por tanto: ϕr = 2 (10.193) (10.194) (10.195) Z p 1 1 −r2 + 2ar − (1 − ǫ2 )a2 dr a r Z dr +2 p 2 −r + 2ar − (1 − ǫ2 )a2 − 2 −(1 − ǫ )a Z r p −r2 (10.196) dr + 2ar − (1 − ǫ2 ) a2 Cada una de estas integrales es elemental y puede hallarse en el manual citado. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 449 El resultado, luego de simplificaciones, es: ϕr = − 1p 2 r−a −r + 2ar − (1 − ǫ2 )a2 + sen−1 a ǫa (10.197) A este resultado se puede llegar derivando respecto a I la expresión integrada Σr que se obtiene de (10.185). Definamos ahora una cantidad auxiliar y ası́: y= 1 − r/a ⇒ r = a(1 − ǫy) ǫ Con lo cual: p ϕr = −ǫ 1 − y 2 − sen−1 y (10.198) (10.199) Como Σ es indeterminada bajo la adición de una constante arbitraria, ϕr estará igualmente indeterminada bajo la adición de una constante, que llamaremos a. Introduciendo una nueva variable ψ, definida como: y = cos ψ y usando la circunstancia mencionada, obtenemos: π ϕr = −ǫ sen ψ − −ψ +α 2 (10.200) (10.201) Podemos escoger a α igual a π/2 con lo cual: ϕr = ψ − ǫ sen ψ (10.202) r = a(1 − ǫ cos ψ) (10.203) La ecuación (10.202) es la ecuación de Kepler, hallada en el capı́tulo 5. Vemos además que la variable angular ϕr coincide con la anomalı́a media M , en tanto que ψ es la anomalı́a excéntrica que, como sabemos, sirve para especificar la posición de la partı́cula en el plano de la órbita. En el ejemplo 5.3.1 se halló la solución analı́tica de la ecuación de Kepler en serie de Fourier. ϕr puede escribirse, de acuerdo con (10.77) en la forma: ϕr = ωr (t − t0 ) (10.204) Vemos que cuando ϕr = 0, ψ = 0 y r = rmı́n ; cuando ϕr = π, ψ = π y r = rmax ; cuando ϕr = 2π, ψ = 2π y r = rmı́n y ası́ sucesivamente. ωr es la frecuencia angular del movimiento radial que es periódico. Ejemplo 10.4.1 Expresar a r, x, y en términos de ϕr por medio de series de Fourier, donde x, y son unos ejes cartesianos en el plano de la órbita, con x a lo largo del eje mayor de la órbita y el origen es el centro de fuerzas. De la figura 5.14 se sigue que: x = r cos ϕv y y = r sen ϕv donde ϕv es la anomalı́a verdadera (ángulo entre r y x). 450 / Mecánica clásica avanzada Por otra parte, la ecuación de la órbita en el plano de la misma cuando se toma a x en la dirección del perihelio es: r= a(1 − ǫ2 ) 1 + ǫ cos ϕv (10.205) Por tanto, combinando (10.205) y (10.203): a(1 − ǫ2 ) − r = a(cos ψ − ǫ) ǫ p p y = r2 − x2 = a 1 − ǫ2 sen ψ x= (10.206) (10.207) Vemos que x y r son funciones pares de ψ en tanto que y es una función impar. Entonces podemos escribir: ∞ X 1 r = B0 + Bn cos(nϕr ) a 2 n=1 ∞ X 1 x Cn cos(nϕr ) = C0 + a 2 n=1 ∞ X y p = 1 − ǫ2 Dn sen (nϕr ) a n=1 Los coeficientes de Fourier son: Z Z r −2 π 2 πr cos(nϕr ) dϕr = sen (nϕr ) d Bn = π 0 a nπ 0 a Z Z −2 π x 2 πx cos(nϕr ) dϕr = sen (nϕr ) d Cn = π 0 a nπ 0 a Z π 2 y √ Dn = sen (nϕr ) dϕr π 0 a 1 − ǫ2 Z π 2 y √ = cos nϕr d nπ 0 a 1 − ǫ2 (10.208) (10.209) (10.210) (10.211) (10.212) (10.213) donde se han realizado integraciones por partes. Usando (10.206), (10.207) y (10.203) llegamos a las siguientes expresiones con integrales sobre ψ. Z 2ǫ π sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.214) Bn = − nπ 0 Z π 2 Cn = sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.215) nπ 0 La ecuación de Hamilton-Jacobi con variables acción-ángulo / 451 Dn = 2 nπ Z π 0 cos[n(ψ − ǫ sen ψ)] cos ψ dψ (10.216) Procediendo como en el ejemplo 5.3.1, usando la definición integral de las funciones de Bessel enteras, llegamos a: Bn = ǫ 2ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] = − Jn′ (ǫn) n n (10.217) Cn = 1 2 [Jn−1 (ǫn) − Jn+1 (ǫn)] = Jn′ (ǫn) n n (10.218) Dn = 2 Jn (ǫn) ǫn (10.219) B0 y C0 deben calcularse por separado. El resultado es: B0 = 2 + ǫ 2 ; C0 = −3ǫ (10.220) Entonces, finalmente: ∞ X 1 ǫ2 r =1+ +ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 1 3 x =− ǫ+ [Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 2p y 1 1 − ǫ2 = Jn (ǫn) sen (nϕr ) a ǫ n n=1 (10.221) (10.222) (10.223) Es interesante notar que el sistema formado por dos partı́culas cargadas, ligado, emite radiación electromagnética. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 , donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las fórmulas (5.1), como: Z1 Z2 ~ d = µe ~r (10.224) − m1 m2 donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momento de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia nω0 , donde ω0 = ϕ̇r está dada por la fórmula: In = ω04 n4 ~ dn 3c3 2 (10.225) Como d~n es un vector en el plano de la órbita, se han de considerar las contribuciones de x y y a la radiacion de frecuencia nω0 . El resultado es: 2 1 − ǫ2 2 Z2 Z1 64n2 E 4 Jn′2 (ǫn) + − J (ǫn) (10.226) In = 3 2 2 n 3c Z1 Z2 m1 m2 ǫ2 452 / Mecánica clásica avanzada ver Landau, Teorı́a de campos, sección 70. Solución para el movimiento en θ. La variable angular ϕθ es: ϕθ = ∂Σ ∂Σr ∂Σθ = + ∂Iθ ∂Iθ ∂Iθ (10.227) Notando que: p 2a2 p ∂ 1 − ǫ2 1 + 1 − ǫ2 [(1 − ǫ2 ) a2 ] = ∂Iθ I (10.228) r − (1 − ǫ2 )a ∂Σr = ϕr − sen−1 ∂Iθ ǫr (10.229) y mediante un cálculo similar al que conduce a (10.196) obtenemos: Por otra parte, de (10.191) se sigue: Z ∂Σθ sen θ dθ s = 2 ∂Iθ Iϕ 2 sen θ − Iθ + Iϕ (10.230) y con el cambio de variable u = sen2 θ: Z ∂Σθ 1 du q = ∂Iθ 2 2 [u − Iϕ /(Iθ + Iϕ )2 ] (1 − u) (10.231) La fórmula (14.120) del manual citado nos conduce finalmente a: ∂Σθ cos θ = sen−1 q ∂Iθ 1 − Iϕ2 /(Iθ + Iϕ )2 si llamamos γ a: s γ= 1− (10.232) Iϕ2 (Iθ + Iϕ )2 (10.233) obtenemos de (10.231), (10.229) y (10.227): " r [r − (1 − ǫ2 ) a ]2 cos θ 1− ϕθ − ϕr = sen−1 γ ǫ2 r 2 2 − r − (1 − ǫ ) a ǫr s 1− 2 (10.234) cos θ γ2 Donde hemos usado la fórmula: p p sen−1 A − sen−1 B = sen−1 A 1 − B 2 − B 1 − A2 (10.235) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 453 Definamos las cantidades auxiliares siguientes: L= r − (1 − ǫ2 ) a ; ǫr M= L ; γ S = sen (ϕθ − ϕr ) (10.236) Entonces (10.234) toma la forma: r p 1 S = cos θ − M 2 − M γ 2 − cos2 θ 2 γ (10.237) y despejando a cos θ obtenemos: p p cos θ = γS 1 − M 2 γ 2 ± γ 2 M 1 − S 2 (10.238) Para hallar la dependencia de cos θ, notamos que L tiene la siguiente expresión en términos de ψ: L= ǫ − cos ψ 1 − ǫ cos ψ (10.239) Entonces: √ sen (ϕθ − ϕr ) 1 − ǫ2 sen ψ − cos(ϕθ − ϕr )(ǫ − cos ψ) cos θ = γ (1 − ǫ cos ψ) (10.240) donde hemos tomado el signo negativo en (10.238) para hacer la expresión compatible con el caso en que la órbita está colocada completamente en el plano x − z. Despejando a M en términos de cos θ obtenemos: M =− p Sp 2 1 cos θ γ − cos θ ± 1 − S2 γ2 γ2 (10.241) y usando las definiciones (10.236), llegamos a la siguiente expresión para la ecuación de la órbita en términos de las variables acción-ángulo: r (Iθ + Iϕ )2 ( 1− 1 1 I2 I2 1+ s = 2 r (Iθ + Iϕ ) a Iϕ2 1− (Iθ + Iϕ )2 (10.242) " × sen (ϕθ − ϕr ) s sen2 θ Iϕ2 − ± cos(ϕθ − ϕr ) cos θ (Iθ + Iϕ )2 #) Si la partı́cula se mueve sobre un plano que contiene al eje z, no tendrá componente del momento angular en ese eje, o sea Iϕ = 0. En ese caso, según (10.172), θmı́n = 0 y θmax = π, y según (10.233), γ = 1. Entonces (10.242) toma la forma: ( ) r Iθ2 I2 1 1 1 ± 1 − 2 cos[θ ∓ (ϕθ − ϕr )] (10.243) = 2 r Iθ a I 454 / Mecánica clásica avanzada Si tomamos el signo positivo y definimos a θ0 como: θ0 = ϕθ − ϕr (10.244) llegamos a la fórmula conocida: 1 1 + ǫ cos(θ − θ0 ) = r a(1 − ǫ2 ) (10.245) Entonces θ0 es la dirección del vector absidal del perihelio respecto al eje z, o sea la orientación de la elipse. Las frecuencias asociadas a los movimientos en r, ϕ y θ son iguales, pues (10.188) conduce a: mK 2 ∂E (10.246) = ∂I I3 Según (10.120) y (10.122), habrán dos constantes de movimiento asociadas a la degeneración: ωr = ωθ = ωϕ = ϕr − ϕθ y ϕϕ − ϕθ (10.247) Cuando Iϕ = 0, la órbita está colocada en el plano z − x′ , donde x′ hace un ángulo cualquiera con el eje x. θ0 es el ángulo entre los ejes x y z, como se muestra en la figura 10.10. x- z y- θ0 x′ θ Figura 10.10 Órbita en el plano z − x′ Cuando Iϕ = 0 y θ0 = 0, la ecuación (10.240) da la siguiente relación entre θ y ψ: r 1−ǫ ψ θ cot (10.248) cot = 2 1+ǫ 2 En general, para una órbita con orientación arbitraria y con el plano de la órbita fuera del plano zx′ tenemos: θ0 = ϕθ − ϕr ; cos θmin = γ ; cos θmax = π − θmin (10.249) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 455 En términos de estos ángulos la ecuación general de la órbita es: 1 ǫ 1 1+ = r (1 − ǫ2 ) a cos θmı́n √ cos θ0 cos θ + sen θ0 sen2 θ − sen2 θmı́n (10.250) Solución para el movimiento en ϕ. ϕϕ está dada por: ϕϕ = ∂Σ ∂Σr ∂Σθ ∂Σϕ = + + ∂Iϕ ∂Iϕ ∂Iϕ ∂Iϕ (10.251) De (10.229) vemos que: r − (1 − ǫ2 ) a ∂Σr = ϕr − sen−1 ∂Iϕ ǫr (10.252) De (10.191) se sigue: ∂Σθ = ∂Iϕ Z s 1− Iϕ 1 Iθ + Iϕ sen2 θ Iϕ2 1 1− (Iθ + Iϕ )2 sen2 θ dθ (10.253) El cambio de variable: s cos2 θ v= 2 sen θ − (1 − γ 2 ) nos lleva a: Z dθ p sen4 θ − (1 − γ 2 ) sen2 θ (10.254) =− Z dv 1 + v 2 (1 − γ 2 ) p 1 −1 1 − γ2] tan [v =− 1 − γ2 (10.255) Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a: p (10.256) ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ Resolviendo para v hallamos: 1 v=p tan(ϕϕ − ϕθ − ϕ) 1 − γ2 (10.257) que equivale a la siguiente ecuación cuadrática en cos θ: (1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ −γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0 (10.258) 456 / Mecánica clásica avanzada por tanto: cos θmı́n tan(ϕϕ − ϕθ − ϕ) cos θ = p sen2 θmı́n + tan2 (ϕϕ − ϕθ − ϕ) (10.259) o si se quiere: sen θmı́n cos θ tan(ϕϕ − ϕθ − ϕ) = √ 2 cos θmı́n − cos2 θ (10.260) Usando (10.238) obtenemos esta expresión para la dependencia temporal de ϕ: tan(ϕϕ − ϕθ − ϕ) = sen θmı́n √ − cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ √ sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ (10.261) Cuando la órbita está en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θmı́n = θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0, −ǫ + cos ψ tan(ϕϕ − ϕθ − ϕ) = √ 1 − ǫ2 sen ψ (10.262) de donde: √ 1 − ǫ2 sen ψ cos(ϕϕ − ϕθ − ϕ) = = 1 − ǫ cos ψ r 1 − ǫ2 p 2 2 a ǫ − (a − r)2 ǫr (10.263) que nos conduce a una ecuación similar a la (10.245), pero esta vez para la órbita en el plano x − y. Entonces el ángulo que hace el vector absidal del perihelio respecto al eje x, cuando θ0 = 0, es: ϕ0 + π 2 donde ϕ0 = ϕϕ − ϕθ (10.264) Cuando la órbita está en el plano z − x′ , Iϕ = 0 y sen θmı́n = 0 entonces tan(ϕϕ − ϕθ − ϕ) = 0. Por tanto en este caso el ángulo ϕ es constante y vale ϕ0 , que es el ángulo que hace la lı́nea de intersección entre el plano vertical de la órbita y el plano x − y. En general, para Iϕ y Iθ arbitrarios, el plano de la órbita y el plano x − y se cortan en la lı́nea Ox′ , llamada lı́nea de nodos. La curva cruza el plano xy cuando θ = π/2 y cuando θ = 3π/2. En esos puntos, según (10.260), ϕ vale ϕ0 . En conclusión, ϕ0 es el ángulo de la lı́nea de nodos respecto al eje x. ϕ0 es el acimut de la partı́cula cuando θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2. Como ϕ es una variable cı́clica, pϕ es constante de movimiento, cuyo valor es igual al de Iϕ cuya variable canónica conjugada es ϕϕ . Por medio de una transformación canónica es posible hacer que las variables acción-ángulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr ) y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables canónicas conjugadas, lo mismo que lz y ϕ0 . Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al completar un ciclo sobre las lı́neas γθ0 y γϕ0 del toroide no regresan a su valor original La ecuación de Hamilton-Jacobi con variables acción-ángulo / 457 sino que aumentan en 2π, pero esto no tiene efecto sobre las fórmulas ya que aparecen en funciones trigonométricas. Los ejes x, y, z fijos a la órbita, se pueden ubicar respecto a los ejes x, y, z mediante los ángulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la sección 7.6. ϕ′ es el ángulo entre x′ y x, θ′ el ángulo entre z y z y el ψ ′ ángulo entre x y x′ , donde el eje x′ coincide con la lı́nea de nodos. (Véase figura 10.11). ϕ′ , θ′ , ψ ′ están relacionados con θ0 , ϕ0 mediante: ϕ′ = ϕ0 ; θ′ = π − θmı́n ; 2 ψ′ = π − θ0 2 (10.265) z z θ′ θmin y′ y α θ0 x ψ′ y ϕ′ x′ Figura 10.11 Los ejes x, y y z están fijos a la órbita y ubicados respecto a x, y y z mediante los ángulos de Euler. x, y están sobre el plano de la órbita. El ángulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z: cos α = sen ψ ′ sen θ′ = cos θmin cos θ0 (10.266) ~ = ǫ~ex , por tanto Puede mostrarse que el vector de Runge-Lenz tiene la expresión A Az = ǫ cos α. I determina la longitud del semieje mayor de la órbita a, en tanto que I y Iθ + Iϕ determinan la excentricidad. Concluimos que las variables acción-ángulo determinan la forma y tamaño de la órbita, lo mismo que su orientación en el espacio. I además determina la frecuencia y ϕr determina la posición de la partı́cula sobre la órbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son conocidas como los elementos de Delaunay de la órbita en astronomı́a. Ejemplo 10.4.2 Hallar las expansiones de Fourier para z y x ± iy. 458 / Mecánica clásica avanzada De la matriz de rotación en términos de los ángulos de Euler se sigue: z = sen θ′ sen ψ ′ x + sen θ′ cos ψ ′ y (10.267) Entonces, usando (10.265): z = cos θmı́n (cos θ0 x + sen θ0 y) (10.268) x y y están dados por (10.222) y (10.223). En consecuencia: ( ∞ −iϕr X e 3 Jn′ (nǫ) cos nϕr z = aγ − ǫ−iϕr + 4 n n=1 √ ) 1 − ǫ2 eiϕθ −i Jn (nǫ) sen nϕr ǫ +aγ ( ∞ iϕr X e 3 − ǫeiϕr + 4 n n=1 (10.269) Jn′ (nǫ) cos nϕr √ ) 1 − ǫ2 e−iϕθ +i Jn (nǫ) sen nϕr ǫ Igualmente de la matriz de rotación obtenemos: x + iy = [(cos ψ ′ cos ϕ′ − cos θ′ sen ϕ′ sen ψ ′ ) +i(cos ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ sen ψ ′ )] x (10.270) + [(−sen ψ ′ cos ϕ′ − cos θ′ sen ϕ′ cos ψ ′ ) +i(−sen ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ cos ψ ′ )] y Usando nuevamente (10.265), (10.206) y (10.209) llegamos a: h p x + iy = a sen θ0 + i 1 − γ 2 cos θ0 (cos ψ − ǫ) √ i p 1 − ǫ2 sen ψ ǫiϕ0 + − cos θ0 + i 1 − γ 2 sen θ0 Finalmente, usando (10.222) y (10.223) llegamos a: ! " ∞ −iϕr X p e 3ǫ Jn′ (nǫ) cos nϕr − e−iϕr + x + iy = i −1 + 1 − γ 2 4 n n=1 # ∞ −iϕr √1 − ǫ2 X p e 2 Jn (nǫ) sen nϕr eiϕϕ − −1 − i 1 − γ ǫ n n=1 " ! ∞ −iϕr X p 3ǫ e + i 1 + 1 − γ2 − e−iϕr + Jn′ (nǫ) cos nϕr 4 n n=1 (10.271) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 459 p − 1 + i 1 − γ2 ! ∞ # √ 1 − ǫ2 X e−iϕr Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ ) ǫ n n=1 (10.272) Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son diferentes de: nϕ = 0, 1, −1 ; nθ = 0, ±2 En cuanto a n no hay ninguna restricción. Según la fórmula (10.225), para este caso se tiene: h i ω4 4 2 2 In, nθ , nϕ = 03 τn, An, nθ , nϕ + Bn, nθ , nϕ nθ , nϕ 3c (10.273) (10.274) donde τn, nθ , nϕ es un número que describe el orden del armónico de ω0 radiado, y A y B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente es posible la radiación asociada a los nθ y nϕ dados por (10.273). Las fórmulas (10.269) y (10.272) pudieron también obtenerse directamente de (10.240) y de (10.256). Ejemplo 10.4.3 Mostrar que el vector de Runge-Lenz (o de Laplace) es una constante de movimiento asociada a la degeneración del movimiento en el problema de Kepler. ~ es constante: Es simple mostrar que el vector A ~ = p~ × ~l − mk ~r A r (10.275) ~ · ~l = 0, se sigue que A ~ es un vector fijo en el plano de la órbita. Tomando Como A ~ con ~r obtenemos: el producto escalar de A Ar cos ϕv = l2 − mkr (10.276) Comparando con la ecuación de la órbita vemos que la magnitud de A es esencialmente ǫ: A = mkǫ (10.277) ~ es independiente de las Se sigue entonces que sólo una de las componentes de A ~ ~ está en la dirección constantes de movimiento E y l. De (10.276) se sigue también que A del perihelio, de donde se concluye que salvo el factor mk: ~ = ǫ~ex ; A Az = ǫ cos α (10.278) Como cos α tiene la expresión (10.266), se sigue que Az depende esencialmente de la constante θ0 = ϕθ − ϕr , que sabemos es constante debido a la degeneración del movimiento y además es independiente de ~l y E. También sabemos que la existencia de este tipo de constantes está asociada a la posibilidad de separar las variables en otro sistema de coordenadas. En efecto, según veremos, A es precisamente la constante que aparece al separar variables en coordenadas parabólicas. 460 / Mecánica clásica avanzada Ejemplo 10.4.4 Mostrar que las constantes de movimiento lx , ly están asociadas a la degeneración del movimiento angular en un problema de fuerzas centrales. De las fórmulas (5.23) en la sección 5.1 sabemos que: lx = −pθ sen ϕ − pϕ cot θ cos ϕ ; (10.279) ly = pθ cos ϕ − pϕ cot θ sen ϕ Que pθ y pϕ tienen las siguientes expresiones es válido en cualquier problema de fuerzas centrales: r l2 pθ = l2 − z2 ; pϕ = lz (10.280) sen θ donde l y lz son las constantes de separación en coordenadas esféricas. Para precisar, adoptemos los resultados en el movimiento kepleriano. Según (10.258) se cumple: p 1 − γ2 sen θ = p 2 1 − γ cos2 (ϕ − ϕ0 ) (10.281) −r sen (ϕ − ϕ0 ) cos θ = p 1 − γ 2 cos2 (ϕ − ϕ0 ) lx puede escribirse en la forma siguiente usando (10.260): p sen ϕ − lz cot θ cos ϕ lx = −l γ 2 − cos2 θ sen θ ! p l 1 − γ 2 sen ϕ = − lz cos ϕ cot θ tan (ϕ − ϕ0 ) (10.282) Entonces, usando (10.281) llegamos a: lx = l cos θmı́n sen ϕ0 (10.283) similarmente, ly = −l cos θmı́n cos ϕ0 (10.284) Estos resultados son válidos para fuerzas centrales en general y no sólo en el caso kepleriano, ya que independientemente de la forma del potencial la energı́a depende de Iθ y Iϕ en la combinación Iθ + Iϕ , lo cual da lugar a que: ωθ = ωϕ (10.285) en cualquier problema de fuerzas centrales y por tanto ϕ0 = ϕϕ − ϕθ es una constante de movimiento, lo que a su vez implica que lx y ly sean constantes. l, lz y lx2 + ly2 = l2 cos2 θmin = l2 −lz2 son constantes de movimiento especiales de las coordenadas esféricas y por lo tanto sólo dependen de las variables de acción. lx y ly son constantes que La ecuación de Hamilton-Jacobi con variables acción-ángulo / 461 dependen de las variables angulares 6 ϕθ y ϕϕ a través de ϕ0 y están asociadas a la posibilidad de separar el movimiento angular del radial en coordenadas esféricas donde el eje polar es reemplazado por x o por y. Que lx y ly dependan de las variables angulares es resultado de la propiedad general del vector momento angular consistente en que no existe una transformación canónica en que lx , ly , lz sean simultáneamente momentos generalizados. En efecto, en el ejemplo 9.8.4 se muestra que las componentes de ~l no están en involución entre sı́: [li , lj ] = ǫijk lk ; i, j, k = x, y, z (10.286) Notemos que (10.286) es una propiedad de los li que sabemos son los generadores infinitesimales del grupo de rotaciones. Se dice que ~l tiene un álgebra de Lie cuyas constantes de estructura son ǫijk . Ejemplo 10.4.5 Mostrar la invariancia bajo el grupo O(4). ~ y ~l podemos formar los vectores J~ y K ~ definidos como: Con los vectores A 1 1 ~ ~ ; ~ = 1 ~l − √ 1 l+ √ J~ = A K (10.287) ~ 2 2 −2mE −2mE A Estos vectores están en involución entre sı́, mas no sus componentes: [Ji , Jj ] = ǫijk Jk , [Ki , Kj ] = ǫijk Kk , [Ji , Kj ] = 0 (10.288) ~ tienen cada uno un álgebra de Lie como la del grupo de rotaPor tanto J~ y K ciones. Concluimos que el hamiltoniano de una partı́cula ligada en un potencial −k/r es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos de un grupo más general, el de las rotaciones ortogonales O(6). La representación O(6) es reducible siendo una de sus representaciones irreducibles O(4). Como, según vimos en la sección 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos que la degeneración del sistema que consideramos resulta del hecho de ser invariante el hamiltoniano bajo un grupo de simetrı́a más amplio que el grupo de rotaciones. ~ K ~ y H sólo existen 5 constantes inEntre las siete constantes de movimiento J, 2 2 dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones entre ellas, provenientes de: ~ · ~l = 0 ; J~ − K 2 ~ J~ − K = mkaǫ2 (10.289) De (10.288) puede verse que estas cinco constantes no están en involución. Por tanto si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separación, necesariamente Jz y Kz dependerán de variables angulares. 6 Puede verse que los “buenos números cuánticos” están asociados precisamente con las variables dinámicas que no dependen de variables angulares. 462 / Mecánica clásica avanzada 10.5. Problema de Kepler (coordenadas parabólicas) Las coordenadas parabólicas en tres dimensiones son una generalización de las definidas en el ejemplo 10.3.5. p p x = 2 ξn cos ϕ ; y = 2 ξn sen ϕ ; z =ξ−n (10.290) donde ϕ es el ángulo acimutal. Las fórmuIas inversas son: ξ= 1 θ (z + r) = r cos2 2 2 η= θ 1 (−z + r) = r sen2 2 2 (10.291) y x Con un procedimiento análogo al del ejemplo 10.3.5 llegamos a: s Z p2ϕ 2mK1 2mE + − 2 dξ Σ(ξ, η, ϕ; E, K, pϕ ) = ξ 4ξ ϕ = tan−1 + Z s 2mE + 2mK2 − η p2ϕ 4η 2 dη + ϕpϕ (10.292) (10.293) Las constantes de separación K1 y K2 satisfacen: K1 + K2 = K ; 0 ≤ K1 ≤ K Las variables de acción son definidas por: s I p2ϕ 2mK1 dξ 2πIξ = 2mE − 2 + 4ξ ξ s I p2ϕ 2mK2 2πIη = 2mE − 2 + dη 4η η 2πIϕ = 2πpϕ (10.294) (10.295) (10.296) (10.297) De la siguiente ecuación, dada en Goldstein, que se deduce similarmente a la integral de (10.134) en el ejemplo 10.3.4, I r √ C 2B B (10.298) − 2 dr = 2πi A+ −C + √ r r A obtenemos: Iξ , η = i pϕ mK1,2 i +√ 2 2mE (10.299) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 463 que junto con (10.297) nos conduce a la siguiente expresión para la energı́a en términos de las variables de acción parabólicas: E=− mk 2 2(Iξ + Iη + Iϕ )2 (10.300) Si definimos a I como: I = Iξ + Iη + Iϕ (10.301) llegamos a la siguiente expresión para las constantes K1 y K2 en términos de las variables de acción: K1,2 = K 2Iξ,η + Iϕ 2I (10.302) Es conveniente definir una sola constante, pues K1 y K2 están relacionadas por (10.294): β= K1 − K2 Iξ − Iη = ; K I −1 ≤ β ≤ 1 (10.303) Veremos que β coincide con la componente z del vector de Runge-Lenz (véase en Mecánica cuántica de Laudau, sección 37). Entonces K1 y K2 tienen la siguiente expresión en términos de β: K1 = 1+β K; 2 K2 = 1−β K 2 (10.304) Ejercicio 10.5.1 Expresar a K1 y K2 en coordenadas parabólicas. Luego, usando las fórmulas de transformación expresar a β en coordenadas cartesianas y mostrar que coincide con la componente z del vector de Laplace. Variables angulares ϕξ y ϕη . De (10.293) se sigue que: ϕξ = Z m s ∂E m ∂K1 + ∂Iξ ξ ∂Iξ p2ϕ 2mK1 − 2 2mE + ξ 4ξ dξ (10.305) + Z s ∂E m ∂K2 m + ∂Iξ η ∂Iξ p2ϕ 2mK2 − 2 2mE + η 4η dη De (10.300) y (10.302) se siguen: ωξ = ωη = ωϕ = 2E mk 2 ∂E = 3 =− ∂I I I (10.306) 464 / Mecánica clásica avanzada y, ∂K1,2 K2 =± ; ∂Iξ I K1 ∂K1,2 =∓ ; ∂Iη I K1 − K2 ∂K1,2 =∓ ∂Iϕ I (10.307) Por tanto: ϕξ = + Z Z − s 2mE mK1 + I ξI p2ϕ 2mK1 2mE + − 2 ξ 4ξ s dξ (10.308) 2mE mK 2 − − I ηI p2ϕ 2mK2 2mE + − 2 η 4η dη ϕη tiene una expresión análoga, colocando η, en lugar de ξ y K1 en lugar de K2 . Definimos a y γ ası́: a= I2 ; mk γ= Iϕ I (10.309) los puntos de retorno en ξ y ϕ están dados por: s ! 1+β γ2 1± 1− ; ξmax,min = a 2 (1 + β)2 ηmax,min = a 1−β 2 1± s 1− 2 γ (1 − β)2 ! (10.310) Las fórmulas 14.281 y 14.280 del Manual de fórmulas y tablas matemáticas de Spiegel nos dan para ϕξ : s 2 ξ ξ γ2 ϕξ = − − + (1 + β) − a a 4 r η 2 η γ2 − − + (1 − β) − + a a 4 −sen−1 2 ξ 1− 1+β a s γ2 1− (1 + β)2 ϕη tiene una expresión análoga intercambiando ξ con η y 1 + β con 1 − β. (10.311) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 465 Si definimos a θ1 , Lξ y Lη ası́: 7 2ξ 1− (1 + β) a θ1 = ϕξ − ϕn ; Lξ = s ; γ2 1− (1 + β)2 2η 1− (1 − β) a Lη = s γ2 1− (1 + β)2 (10.312) obtenemos: 2ξ 2η , = a a 1− s γ2 1− Lξ , η (1 ± β)2 ! (1 ± β) (10.313) y, θ1 = −sen−1 Lξ + sen−1 Lη (10.314) Además, q 1p (1 + β)2 − γ 2 1 − L2ξ 2 q 1p − (1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η 2 ϕξ,η = − (10.315) Ahora definamos dos nuevas variables (anomalı́as excéntricas): Lη = sen αη ; Lξ = sen αξ (10.316) Entonces (10.314) y (10.315) se convierten en: θ1 = −αξ + αη ϕξ = − 1p (1 + β)2 − γ 2 cos αξ 2 (10.318) 1p (1 + β)2 − γ 2 cos(αη − θ1 ) 2 (10.319) 1p − (1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ 2 ϕη = − 7 Como (10.317) 1p − (1 + β)2 − γ 2 cos αη − αη 2 se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneración. 466 / Mecánica clásica avanzada Las fórmulas (10.318) y (10.319) son ecuaciones trascendentales que permiten en principio expresar a αξ y αη en función de las variables angulares y en consecuencia de (10.313) expresar a ξ y η en función del tiempo, en efecto: ξ= η= p 1 a 1 + β − (1 + β)2 − γ 2 sen αξ 2 (10.320) p 1 a 1 − β − (1 − β)2 − γ 2 sen αη 2 (10.321) De (10.314) se obtiene una ecuación que relaciona a ξ con η y que constituye la ecuación de la órbita en coordenadas parabólicas. El resultado es: s ( 2η a (1 + β)2 − γ 2 1+β− cos θ1 1 − β − ξ= 2 (1 − β)2 − γ 2 a (10.322) #) r 2 4η 4η + −γ 2 + (1 − β) − 2 sen θ1 a a Relación con la solución en coordenadas esféricas. Empecemos por expresar a ǫ en términos de γ, β y θ1 . Para ello basta hallar una expresión para r = ξ + η usando (10.320) y (10.321): r 1 + β2 − γ2 1p r (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 =1− + a 2 2 (10.323) (1) × cos(αξ − αξ ) Donde: (1) tan αξ p p (1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1 p = (1 − β)2 − γ 2 sen θ1 Comparando (10.323) con (10.203) cuando r = rmax , obtenemos: r 1 + β2 − γ2 1p (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 ǫ= + 2 2 (10.324) 8 (10.325) Por otra parte, z, en coordenadas parabólicas y en esféricas es: 8 Esta 1p z 1p (1 + β 2 ) − γ 2 sen αξ + (1 − β)2 − γ 2 sen αη =β− a 2 2 r i z 1 − ǫ2 − γ 2 h p 2 sen ψ sen θ − (ǫ − cos ψ) cos θ − = 1 − ǫ 0 0 a 1 − ǫ2 (10.326) (10.327) fórmula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si β < 0, 0 ≤ |γ| ≤ 1 + β. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 467 Estas expresiones equivalen a: # " r 1+β 2 −γ 2 1 p (2) 2 2 2 2 4 z = a β+ (1−β ) −2γ (1+β )+γ cos θ1 cos(αξ −αξ ) (10.328) − 2 2 z=a r (2) i p 1 − ǫ2 − γ 2 h 2 sen2 θ cos(ψ − ψ (1) ) 1 − ǫ −ǫ cos θ − 0 0 1 − ǫ2 y ψ (1) se definen ası́: p p − (1 + β)2 − γ 2 + (1 − β)2 − γ 2 cos θ1 (2) p tan αξ = (1 − β)2 − γ 2 sen θ1 √ 1 − ǫ2 sen θ0 tan ψ (1) = cos θ0 (10.329) donde αξ De (10.328) se sigue que: máx 2 zmı́n 2 = 1 + β 2 − γ 2 − ǫ2 = β 2 + (1 − ǫ2 ) cos2 θmı́n −β a En tanto que de (10.329): p máx zmı́n = a cos θmı́n −ǫ cos θ0 ± 1 − ǫ2 sen2 θ0 máx De (10.332) y (10.333) obtenemos para β en términos de zmı́n : 2 mı́n zmáx /a + (ǫ2 − 1) cos2 θmı́n β= mı́n /a 2zmáx = (10.330) (10.331) (10.332) (10.333) (10.334) −ǫ cos θ0 cos θmı́n Esto nos muestra que β es esencialmente la componente z del vector de Runge-Lenz: en coordenadas parabólicas depende sólo de variables de acción, pero en coordenadas esféricas depende además de variables angulares. Por otra parte, de (10.325) y (10.334) se tiene la siguiente expresión para cos θ1 en términos de γ, ǫ y cos θ0 , donde se ha llamado C a cos2 θmin : −C + ǫ2 (1 + C sen2 θ0 ) p C 2 − 2ǫ2 C(1 − 2 sen2 θ0 + C sen2 θ0 ) + ǫ4 (1 − C sen2 θ0 )2 (10.335) Cuando la órbita toca el eje z, sen θmı́n = 0. Entonces: cos θ1 = −1 + 2ǫ2 − ǫ2 cos2 θ0 1 − ǫ2 cos2 θ0 (10.336) esto nos permite llegar de (10.322), cuando γ = 0, al expresar a β, θ1 , ξ, η en función de las cantidades esféricas, a la fórmula (10.245). (10.322) es, pues, la ecuación de una elipse en el espacio expresada en coordenadas parabólicas (véase figura 10.12). 468 / Mecánica clásica avanzada También de (10.334) y (10.325) se llega a una expresión para cos θ0 en términos de γ, β y cos θ1 . Las coordenadas ξ y η oscilan entre los lı́mites señalados por la ecuación (10.310). Cuando γ = 0, ξmı́n = ηmı́n = 0. Cuando β = 0, ξmáx = ηmáx y ξmı́n = ηmı́n . Cuando β = γ − 1, ξmı́n = ξmáx y cuando β = 1 − γ, ηmı́n = ηmáx . En general, la trayectoria está confinada a una región en forma de anillo, definida por las paraboloides ξ = ξmı́n , ξ = ξmáx , η = ηmı́n , η = ηmáx . z η = ηmín η = ηmáx ξ = ξmáx ξ = ξmín Figura 10.12 Lı́mites del movimiento en coordenadas parabólicas En el caso β = 0, γ = 1, resulta que ηmı́n = ηmax = ξmı́n = ξmax = a/2 y por tanto el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En este caso según (10.325) ǫ = 0, como debe ser. Cuando β = γ − 1 o β = −γ + 1, el movimiento sólo es posible a lo largo de curvas colocadas sobre la superficie de un casquete lateral. Las órbitas compatibles con valores dados de E, β, γ se caracterizan por tener un vector de Runge-Lenz con componente z definida, por tener un momento angular con componente z definida y por tener un semieje mayor de longitud definida. El ensamble de órbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque la ecuación (10.325) fija el rango de excentricidades posibles. Puede mostrarse que Iβ /2 y θ1 son variables canónicamente conjugadas, en tanto que [Iϕ , θ1 ] = 0. Como de (10.287) se puede hallar que: 1 1 (Iϕ − Iβ ) = I(γ − β) (10.337) 2 2 se sigue que esencialmente Jz y θ1 son variables canónicamente conjugadas y que Jz es el generador infinitesimal de z, las rotaciones que dejan invariante la proyección del vector Jz = La ecuación de Hamilton-Jacobi con variables acción-ángulo / 469 de Laplace en el eje z. En una de estas rotaciones el valor de θ1 cambia y por ende el valor de ǫ. Por tanto las rotaciones generadas por Jz en el espacio de representación de O(4), no dejan rı́gida la órbita; θ1 no es un ángulo que especifique una orientación de una órbita rı́gida, pues al variarse cambia necesariamente, o sea cambia el valor de l. Para precisar, asumamos que γ = 0. Entonces de (10.310) se sigue que ξmı́n = ηmin = 0, o sea que el anillo se convierte en una región llena, limitada por los paraboloides ξmax = a(1 + β) y ηmax = a(1 − β). Según la ecuación de la órbita (10.322) cuando η = ηmı́n , ξ vale: 1 ξ = (1 + β)(1 − cos θ1 ) (10.338) 2 cuando ξ = ξmı́n , η vale: 1 (10.339) η = (1 − β)(1 − cos θ1 ) 2 El punto de la órbita (0, ξ) es x = 0, y = 0, r = z = ξ. El punto de la órbita (η, 0) es x = 0; y = 0, r = −z = η. En coordenadas esféricas estos puntos corresponden a las intersecciones de la órbita vertical con el eje z, para los cuales: a(1 − ǫ2 ) (10.340) 1 ± ǫ cos θ0 expresión que se puede obtener de (10.338) y (10.339). ǫ y θ0 están dados por: r 1 + β 2 + (1 − β 2 ) cos θ1 ǫ= (10.341) 2 s 2 (10.342) cos θ0 = −β 2 1 + β + (1 − β 2 ) cos θ1 r= Cuando θ1 = 0, ǫ = 1 y cos θ0 = −β. Cuando β = 1, ǫ = 1 y cos θ0 = −1. Son dos casos de trayectoria rectilı́nea en un plano que pasa por el eje z. De (10.328) y (10.329) junto con (10.334) y (10.335) se siguen las relaciones entre las variables angulares y las anomalı́as excéntricas: (2) αξ = αξ + ψ − ψ (1) − π (1) ϕr = −ϕξ − αξ (2) (10.343) (10.344) (1) αξ = αξ + ψ (1) + π (10.345) La variable angular ϕϕ , está dada por: ϕϕ = ∂Σ = ϕ+ ∂Iϕ Z ∂E m ∂K1 pϕ ∂pϕ m + − 2 ∂Iϕ ξ ∂Iϕ 4ξ ∂Iϕ q dξ 2 2 2mE − pϕ /(4ξ ) + 2mK1 /ξ ∂E m ∂K2 pϕ ∂pϕ Z m + − 2 ∂Iϕ η ∂Iϕ 4η ∂Iϕ + q dη 2 2 2mE − pϕ /(4η ) + 2mK2 /η (10.346) 470 / Mecánica clásica avanzada usando (10.305), (10.306) y (10.307) obtenemos: ϕϕ = 1 ϕ + (ϕξ + ϕη ) 2 Z dξ 1 q − pϕ 4 ξ 2mEξ 2 + 2mK1 ξ − p2ϕ /4 1 − pϕ 4 Z (10.347) dη q 2 η 2mEη + 2mK2 η − p2ϕ /4 calculando las integrales con la fórmula 14.283 del manual de Spiegel y expresando todas las constantes de movimiento en función de a, β y γ, hallamos: ϕϕ = 1 1 ϕ + (ϕξ + ϕη ) − sen−1 2 2 2ξ γ2 − a 1+β s 2ξ γ2 1− a (1 + β)2 (10.348) 1 − sen−1 2 γ2 2η − a 1−β s 2η γ2 1− a (1 − β)2 debido a la degeneración se cumple que: 1 (ϕξ + ϕη ) = ωt + Constante 2 (10.349) Por tanto podemos definir una nueva constante de movimiento que depende de las variables angulares y que debe su carácter de constante a la degeneración: 1 ϕ1 = ϕϕ − (ϕξ + ϕη ) 2 (10.350) Cuando γ = 0, el plano de la órbita se corta perpendicularmente con el plano x − y en la lı́nea de nodos. En este caso ϕ vale ϕ1 ; luego ϕ1 es el ángulo que hace la lı́nea de intersección del plano de la órbita con el plano ecuatorial 9 . Cuando z = 0, ξ = η, y además ξ = ξmax , se cumple que ϕ = ϕ1 . Entonces ϕ1 es el ángulo de la lı́nea de nodos de aquella elipse que pasa por ξmax en el plano ecuatorial, para otros valores de ξ esto no se cumple. Ejemplo 10.5.1 Hallar la expansión de Fourier para z y x + iy, en coordenadas parabólicas. Véase en Max Born The mechanics of the atom, sección 36. 9 Nótese que (10.347) y (10.348) no son idénticas, pues las integrales indefinidas contienen constantes que se han omitido en (10.348) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 471 De (10.326) y (10.317) se sigue que z depende de las variables angulares ϕξ y ϕη . De (10.317) vemos que αξ no es función par ni impar de ϕξ y que αη no es función par ni impar de ϕη . Por tanto la expansión de fourier de z contiene la forma sen nξ ϕξ y cos nξ ϕξ y similarmente para la dependencia respecto a ϕη . Por esto es más conveniente la siguiente expansión: z= ∞ X ∞ X Anξ nη ei(nξ ϕξ +nη ϕη ) (10.351) nξ =−∞ nη =−∞ como z = ξ − η, los coeficientes de Fourier son: Z 2π Z 2π 1 Anξ nη = (ξ − η)e−i(nξ ϕξ +nη ϕη ) dϕξ dϕη 4π 2 0 0 (10.352) De (10.318), (10.319) se sigue que: p 1h 2 − (1 + β)2 − γ 2 sen αξ 2 i p − (1 − β)2 − γ 2 sen αη dαξ dαη dϕξ dϕη = (10.353) Reemplazando a (10.326) en (10.352), obtenemos: 1 4π 2 A00 = Z 2π 0 Z 2π 0 h 1p (1 + β)2 − γ 2 sen αξ a β− 2 i 1p (1 − β)2 − γ 2 sen αη 2 p 1h × 2 − (1 + β)2 − γ 2 sen αξ 2 i p 3 − (1 − β)2 − γ 2 sen αη dαξ dαη = βa 2 + (10.354) En los coeficientes donde nξ y nη no son ambos cero, el término constante β en z se puede omitir, pues desaparece al efectuar la integral, según se ve en (10.352) directamente. Entonces, usando una notación obvia y una propiedad de los lı́mites de integración en (10.352): Anξ nη = a 4π 2 Z 3π/2 −π/2 Z 3π/2 (−S sen αξ + R sen αη ) −π/2 (1 − S sen αξ − R sen αη ) (10.355) ×einξ (αξ +S cos αξ +R cos αη ) e+inη (αη +S cos αξ +R cos αη ) dαξ dαη 472 / Mecánica clásica avanzada si llamamos n = nξ +nη , y expresamos las funciones sen αξ y sen αη en forma exponencial, obtenemos: −a 16π 2 Anξ nη = Z 3π/2 −π/2 Z 3π/2 −π/2 (2R2 − 2S 2 − 2iSeiαξ + 2iSe−iαξ +2iReiαη − 2iRe−iαη + S 2 ei2αξ (10.356) −R2 ei2αη + S 2 e−i2αξ − R2 e−i2αη ) ×einξ αξ +inS cos αξ +inη αη +inR cos αη dαξ dαη Al sustituir αξ → 3π/2 − αξ y αη → 3π/2 − αη , cada una de las integrales resulta proporcional a una integral de la forma: 1 2π Z 3π/2 eikα+ix cos α dα = −π/2 = ei3k/2 2π Z 2π e−ikα−ix sen α dα 0 eikπ/2 Jk (x) (10.357) donde Jk (x) es la función de Bessel entera de orden k. Expresando a (10.356) en términos de Jk y haciendo uso de las siguientes propiedades de las funciones Bessel: Jk−1 (x) + Jk+1 (x) = 2k Jk (x) x Jk−1 (x) − Jk+1 (x) = 2Jk′ (x) (10.358) (10.359) obtenemos: Anξ nη = ei nπ/2 i ah RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n (10.360) Por tanto, la expansión de Fouurier para z es: z= 3 βa 2 +a nξ ×e ∞ i i nπ/2 h X ′ e RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n =−∞ n =−∞ ∞ X η (nξ ϕξ +nη ϕη ) (10.361) donde la prima en la sumatoria indica que se excluye el término nξ = nη = 0. Cuando nξ + nη = 0 no hay inconveniente porque Anξ nξ se anula. Para hacer la expansión de x + iy, notemos que según (10.290): p x + iy = 2 ξηeiϕ (10.362) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 473 Reemplazando a (10.320) y (10.321) en (10.348) obtenemos: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 p (1 + β 2 ) − γ 2 − (1 + β) sen αξ 1 p − sen−1 2 1 + β − (1 + β)2 − γ 2 sen αξ p (1 − β)2 − γ 2 − (1 − β) sen αη 1 −1 p − sen 2 1 − β − (1 − β)2 − γ 2 sen αη (10.363) √ Luego usamos la fórmula sen−1 x = i ln(−ix + 1 − x2 ) y notamos que en el numerador del argumento se puede formar un cuadrado perfecto para llegar a: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 h αξ p α i2 2 ) − γ 2 + iγ cos ξ (1 + β) sen − (1 + β 1 2 2 − i ln p 2 C 1 + β − (1 + β)2 − γ 2 sen αξ h αη i2 αη p − (1 − β)2 − γ 2 + iγ cos (1 − β) sen 2 2 × p 1 − β − (1 − β)2 − γ 2 sen αη C es una constante que depende de β y γ. Notemos que: p p (x + iy)ei(ϕη −ϕϕ ) = 2 ξη ei(ϕ+ϕη −ϕϕ ) = 2 ξηei(ϕη −ϕϕ )/2 h αξ i αξ p (1 + β 2 ) − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p (1 − β)2 − γ 2 + iγ cos × (1 − β) sen − 2 2 (10.364) (10.365) y según (10.364), a (x + iy)ei(ϕη −ϕϕ ) = √ ei(ϕη −ϕξ )/2 C h αξ i αξ p (1 + β)2 − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p 2 2 (1 − β) − γ + iγ cos × (1 − β) sen − 2 2 (10.366) Cuando αξ = αη = 0 entonces r = ξ + η = a. Por tanto, salvo un factor de fase constante, el valor de C es 1 − β 2 . Born presenta en lugar de (10.366) una expresión que se origina en sus fórmulas (17) de la sección 36. 10 Esto da lugar a una expansión de Fourier con valores erróneos para los coeficientes. 10 Comparar dichas fórmulas con las fórmulas 15.45 y 14.360 del manual de Spiegel. 474 / Mecánica clásica avanzada La expansión de Fourier de (10.366) la escribimos como: (x + iy)ei(ϕη −ϕϕ ) = ∞ X ∞ X Bnξ nη einξ ϕξ +(nη +1)ϕη (10.367) nξ =−∞ nη =−∞ El coeficiente Bnξ nη está dado por: Bnξ nη = a p 4π 2 1 − β 2 Z 3π/2 Z 3π/2 −π/2 −π/2 (1 − S sen αξ − R sen αη ) h αξ i αξ − (2S + iγ) cos × (1 + β) sen 2 2 h αη i αη − (2R + iγ) cos (1 − β) sen 2 2 ×ei(nξ +1/2)αξ +i(nη +1/2)αη +inS cos αξ +inR cos αη (10.368) dαξ dαη donde n = nξ + nη + 1. Al expresar las funciones trigonométricas en forma exponencial, las integrales que aparecen son del tipo de (10.357). En las simplificaciones debe usarse (10.358). El resultado para n 6= 0 es: Bnξ nη = AJnξ +1 (nS) Jnη +1 (nR) + BJnξ (nS) Jnη (nR) × ei(n+1)π/2 n (10.369) donde A y B están dados por: a A= p (1 + β + γ − 2iS)(1 − β + γ − 2iR) 4 1 − β2 a B= p (−1 − β + γ − 2iS)(−1 + β + γ − 2iR) 4 1 − β2 (10.370) (10.371) Para n = 0, las integrales en (10.368) son de tipo exponencial y son diferentes de cero solamente cuando nξ = −1 y nη = 0 o nξ = 0 y nη = −1 ai (2ixy ′ − Syy ′ + Rxx′ ) B−1,0 = p 8 1 − β2 donde: ai (2iyx′ − Ryy ′ + Sxx′ ) B0,−1 = p 8 1 − β2 x = 1 + β + γ − 2iS ; y = −1 + β + γ − 2iS y x′ y y ′ se obtienen de éstas reemplazando a β por −β. (10.372) (10.373) (10.374) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 475 En definitiva: x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ + ∞ X ∞ X ′ Bnξ nη einξ ϕξ +inη ϕη +iϕϕ (10.375) nξ =−∞nη =−∞ donde la prima en la sumatoria indica que n no es cero. Este cálculo fue usado en el contexto de la vieja mecánica cuántica para hallar las intensidades de las lı́neas espectrales del hidrógeno en presencia de un campo eléctrico (efecto Stark). En presencia de un campo eléctrico el problema del átomo de hidrógeno clásico es soluble en coordenadas parabólicas, y cuando el campo eléctrico es muy débil la solución que hemos hallado en este numeral constituye la aproximación cero a este sistema. Para hallar las intensidades se aplica la fórmula (10.225), del ejemplo 10.4.1. Notamos que habrán dos contribuciones diferentes; una proveniente de z 2 , fórmula (10.361) y otra proveniente de x2 +y 2 , fórmula (10.375). Para las componentes de Fourier de z, nϕ = 0 y nξ + nη = n. Las amplitudes de las componentes z corresponden a la radiación polarizada paralelamente al campo eléctrico homogéneo. Para las componentes de Fourier de x ± iy, nϕ = ±1 y nξ + nη + 1 = n. Las amplitudes de las componentes x + iy corresponden a la radiación polarizada perpendicularmente al campo eléctrico homogéneo. Born presenta el análisis que hace Kramers del desdoblamiento de Stark de la lı́nea Hα del hidrógeno, o sea de las transiciones entre los niveles de números cuánticos principales 2 y 3. Ejemplo 10.5.2 Analizar las reglas de selección que se deducen de las expansiones de Fourier (10.269), (10.272), (10.359) y (10.368). En la vieja teorı́a cuántica y en el lı́mite clásico de la moderna teorı́a cuántica las variables de acción están cuantizadas. Ası́, para el átomo de hidrógeno tenemos: 11 1 1 h̄ ; Iθ = l − m + h̄ ; Iϕ = mh̄ Ir = nr + 2 2 |m| − m 1 Iξ = n1 + (10.376) + h̄ ; 2 2 Iη = |m| − m 1 h̄ ; I = mh̄ + n2 + 2 2 El número cuántico principal está asociado a I = Ir + Iθ + Iϕ = Iξ + Iη + Iϕ y vale nr + l + 1 = n1 + n2 + |m| + 1. Ası́ por ejemplo, los estados esféricos y parabólicos para cuando el número cuántico principal vale 2 son: n, l, m = 2, 0, 0; 2, 1, −1; 2, 1, 0; 2, 1, 1 n1 , n2 , m = 0, 0, 1; 0, 1, 0; 1, 0, 0; 0, 0, −1 11 Esta versión de las reglas de cuantización es consistente con la moderna teorı́a cuántica. (10.377) 476 / Mecánica clásica avanzada Los números enteros que aparecen en las expansiones de Fourier (10.361) y (10.375) del problema anterior corresponden a las transiciones entre estados (véase Mecánica cuántica de Laudau, sección 48). Ası́, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ = ∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el desarrollo de Fourier del momento de dipolo eléctrico da las reglas de selección clásicas: respecto a n1 y n2 la regla de selección es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 = 0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0). Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte, de (10.351) se sigue: ∆l − ∆m = nθ (10.378) Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0, nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o cuando nθ = ∓1, nϕ = ±1. En conclusión, del desarrollo de Fourier de ~r en coordenadas esféricas se sigue que: ∆l = 0, ±1 y ∆m = 0, ±1 (10.379) lo cual es consistente con la mecánica cuántica. En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y 10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz cuánticos en el lı́mite clásico (véase, Landau, Mecánica cuántica, sección 48). Para detalles acerca de las reglas de cuantización semiclásicas véase el artı́culo de I.C. Percival y las referencias allı́ contenidas.12 , y la sección 13.4 del capı́tulo 13 del presente texto. El toroide invariante. En coordenadas esféricas es tridimensional y consiste en el lugar geométrico de los puntos del espacio fásico tales que Ir , Iθ , Iϕ tienen valores bien definidos. A partir de la figura 10.11 podemos hallar fácilmente algunas proyecciones del toroide invariante sobre planos del espacio de configuración. La proyección del toroide sobre el plano de la órbita a lo largo de la lı́nea ϕ0 = Constante y θ0 = Constante es una elipse. ϕ0 = Constante define sobre el toroide una superficie bidimensional, cuya proyección sobre el plano de la órbita es una región circular que se obtiene rotando la elipse alrededor del eje z. θ0 = Constante define sobre el toroide una superficie bidimensional cuya proyección sobre el plano ecuatorial es una región circular que se obtiene rotando la proyección de la elipse sobre el plano x − y alrededor del eje z; esta proyección es un cı́rculo de radio rmax . La proyección del toroide sobre el espacio tridimensional es el volumen obtenido al rotar el cı́rculo del plano x − y, de radio rmax , alrededor del eje z, y es un elipsoide de revolución con ejes de longitudes rmax y rmax cos θmı́n es claro que ambas dimensiones de este elipsoide dependen de las constantes de movimiento E, l, lz . En coordenadas parabólicas el toroide invariante es completamente diferente (véase figura 10.13). La excentricidad de la órbita depende de las variables angulares a través de θ1 . 12 Semiclassical theory of Bound States. I.C. Percival. Adv. Chem. Phys. Vol. 36, 1977. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 477 Según (10.325), en el toroide en coordenadas parabólicas son posibles elipses de excentricidades diferentes dentro de un rango definido, que para γ = 0 varı́an entre β y 1. También para γ = 0, cos θ0 varı́a entre −1 y −β. Entonces, para θ1 = 0 la trayectoria es rectilı́nea que hace un ángulo cos−1 (β) con respecto al eje z y para θ1 = π es una elipse de excentricidad β cuyo perihelio está en π. Al barrer θ1 entre 0 y π genera un ensamble de órbitas elı́pticas con perihelio en el tercer cuadrante y envueltas por las parábolas ξmax y ηmax . La rotación de esta región alrededor de z genera la proyección del toroide invariante sobre el espacio tridimensional, que es diferente de la proyección en coordenadas esféricas. z η = (1 – β) a θ1 = π θ1 = 0 ξ = (1 – β) a x Figura 10.13 Toroide invariante en coordenadas parabólicas 478 / Mecánica clásica avanzada 11 Teorı́a de perturbaciones Son muy pocos los problemas mecánicos que poseen soluciones analı́ticas exactas. Por eso son necesarios diferentes métodos de aproximación para afrontar la mayor parte de los problemas realistas. En astronomı́a, donde se consideran sistemas de muchos cuerpos interactuando gravitacionalmente, son indispensables los métodos numéricos y los aproximados, para obtener los cambios en los parámetros de una órbita kepleriana o en los perı́odos, causados por pequeños efectos debidos a la presencia de los otros planetas. En el siglo XIX hubo gran interés en el problema de la estabilidad del sistema solar, que llevó al estudio del movimiento de muchos cuerpos interactuando entre sı́ mediante fuerzas gravitacionales, siendo el más simple el famoso problema de los tres cuerpos, tema que aún es objeto de investigaciones. Los avances han sido notables, en parte como consecuencia de los trabajos matemáticos de Kolmogorov, Arnold y Moser, quienes han obtenido las condiciones de estabilidad de un sistema múltiplemente periódico. Antes del surgimiento de la moderna teorı́a cuántica, la teorı́a clásica de perturbaciones fue muy aplicada a sistemas atómicos, especialmente para el cálculo de efectos debidos a la interacción con campos electromagnéticos. Es notable el trabajo de Max Born (noviembre de 1924).1 Esos esfuerzos no fueron estériles ni inútiles, pues dieron lugar a la teorı́a de perturbaciones de la mecánica cuántica. Hoy esos estudios se aplican con pocas variaciones a cálculos sobre la estructura vibracional en sistemas moleculares, y al análisis de los átomos en estados altamente excitados. La teorı́a clásica de perturbaciones con sus modernos desarrollos se aplica en campos tan disı́miles como la fı́sica de las altas energı́as (estabilidad de haces en un ciclotrón, estabilidad del plasma en una máquina Tokamak, etc.), y la óptica (estabilidad de una cavidad láser, propagación de la radiación láser en una fibra óptica, comportamientos multiestables y caóticos en óptica cuántica, etc.), por ejemplo. 1 Véase el texto The mechanics of the atom de Max Born. 479 480 / Mecánica clásica avanzada 11.1. Teorı́a de perturbaciones dependiente del tiempo En los problemas perturbativos el punto de partida es un sistema para el cual es conocida la solución analı́tica exacta, que se denomina no perturbado, descrito por un hamiltoniano H0 (p, q). El sistema de interés difiere del no perturbado por una pequeña perturbación. Puede asumirse que la magnitud de la perturbación está determinada por cierto parámetro que cuando vale cero hace que el hamiltoniano sea igual a H0 . Entonces el hamiltoniano exacto admite la siguiente expansión en serie de potencias de λ: H(q, p, t; λ) = H0 (q, p, t) + λH1 (q, p, t) + λ2 H2 (q, p, t) + ... (11.1) Por simplicidad denotaremos todos los términos de perturbación con H ′ , H = H0 + H ′ . La teorı́a dependiente del tiempo se caracteriza por encontrar mediante aproximaciones la función generatriz de la transformación canónica de evolución temporal que satisface la ecuación de Hamilton-Jacobi dependiente del tiempo. La transformación se realiza en dos pasos: F (q, q0 , t) = F0 (q, q ′ , t) + F ′ (q ′ , q0 , t) (11.2) donde F0 conecta las variables (q, p) con las (q ′ , p′ ) y es una solución completa de la ecuación de Hamilton-Jacobi dependiente del tiempo del problema no perturbado, o sea que en ausencia de perturbación las (q ′ , p′ ) son constantes. Al aplicar la perturbación, las (q ′ , p′ ) no serán constantes sino funciones que varı́an lentamente con el tiempo, si λ es pequeña. F ′ conecta las variables (q ′ , p′ ) con las constantes (q0 , p0 ) del problema perturbado. Al realizar la transformación (q, p) → (q ′ , p′ ), el hamiltoniano será H + ∂F0 /∂t = H0 + H ′ + ∂F0 /∂t = H ′ , pues por hipótesis H0 + ∂F0 /∂t = 0, y las ecuaciones de movimiento serán: q̇ν′ = ∂H ′ ; ∂p′ν ṗ′ν = − ∂H ′ ∂qν′ (11.3) Estas ecuaciones son rigurosas pues aún no se ha hecho ninguna aproximación, pero usando la pequeñez de H ′ podemos adoptar un esquema de aproximaciones sucesivas. Cuando λ = 0, (q ′ , p′ ) son ciertas constantes que llamaremos (q0′ , p′0 ). Entonces al reemplazar (q ′ , p′ ) en (11.3) al lado derecho por sus valores no perturbados obtenemos: q̇ν′ 1 = ∂H ′ (q0′ , p′0 ) ; ∂p′ν0 ṗ′ν1 = − ∂H ′ (q0′ , p′0 ) ∂qν′ 0 (11.4) donde (q1′ , p′1 ) son las soluciones de (11.3) al primer orden en λ. Las ecuaciones (11.4) pueden ahora integrarse explı́citamente para darnos a (q1′ , p′1 ) en función del tiempo, al primer orden en la perturbación. La corrección de segundo orden se halla usando la solución de primer orden en el lado derecho de (11.3), y ası́ sucesivamente. Podemos encontrar sistemáticamente las correcciones a cualquier orden de aproximación escribiendo en vez de (11.2) una expansión de F en potencias de λ: F (q, q, t) = F (0) (q, q, t) + λF (1) (q, q, t) + λ2 F (2) (q, q, t) + ... (11.5) Teorı́a de perturbaciones / 481 Las funciones F (n) no pueden considerarse como funciones generatrices de una serie de transformaciones canónicas, como F0 y F ′ , por la disposición de los argumentos. Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces: H(q, −∂F/∂q, t) = H(q, ∂F/∂q, t) + ∂F/∂t (11.6) Ahora expandimos los dos lados de (11.6) en potencias de λ usando (11.5) y, H = H0 + λH1 + λ2 H2 + ... (11.7) La expansión de H0 es: ∂F ∂F (0) ∂H0 ∂F (1) H0 q, , t = H0 q, ,t + λ · ∂q ∂q ∂~p ∂~q (1) (2) 2 1 ∂F ∂ H0 ∂F (1) ∂H0 ∂F 2 + ... · + · · +λ ∂~ p ∂~q 2 ∂~q ∂~p∂~q ∂~q La expansión de H1 es: ∂F (0) ∂F ∂H1 ∂F (1) , t = λH1 q, , t + λ2 · + ... λH1 q, ∂q ∂q ∂~p ∂~q (11.8) (11.9) Esto nos conduce a: H = H0 + +λ2 h i ∂F (1) ∂F (0) + λ F (1) , H0 + H1 + ∂t ∂t F (2) , H0 + F (1) , H1 ii h 1h ∂F (2) + F (1) , F (1) , H0 + H2 + 2 ∂t (11.10) ! + ... Si H = 0, entonces F es la solución de la ecuación de Hamilton-Jacobi del problema exacto. Podemos hallar las aproximaciones sucesivas igualando a cero los coeficientes de cada λn : H0 + h h ∂F (0) =0 ∂t i ∂F (1) = −H1 F (1) , H0 + ∂t i ∂F (2) ii i 1h h h F (2) , H0 + F (1) , F (1) , H0 − H2 = − F (1) , H1 − ∂t 2 (11.11) (11.12) (11.13) Las ecuaciones (11.11) y (11.12) forman un conjunto de ecuaciones diferenciales para las F (n) , que se caracteriza porque en cada ecuación el lado derecho depende sólo de cantidades que se han evaluado en una aproximación anterior. 482 / Mecánica clásica avanzada 11.2. Teorı́a de perturbaciones independiente del tiempo Esta teorı́a se aplica fundamentalmente a sistemas conservativos y ligados que poseen soluciones múltiplemente periódicas. El punto de partida es la descripción del sistema no perturbado en términos de las variables acción-ángulo. Luego se adopta un esquema de aproximaciones sucesivas a las variables acción-ángulo del sistema perturbado. Está implı́cita la suposición de convergencia del procedimiento, o sea la existencia de toroides invariantes del sistema perturbado; en general lo anterior no es cierto. El método se basa en hallar una expansión en potencias de λ para la función generatriz de la transformación canónica que lleva a las variables acción-ángulo del sistema perturbado. Se supone conocida la solución para el sistema no perturbado y que éste es no degenerado. Es decir, que no existen números enteros n1 , n2 , ...nl tales que: n1 ω10 + n2 ω20 + ...nl ωl0 = 0 (11.14) donde las ων0 son las frecuencias del sistema no perturbado, y que esta condición se cumple para cualquier conjunto de valores de las variables acción-ángulo no perturbadas. Las variables canónicas (I 0 , ϕ0 ) son variables acción-ángulo sólo para el sistema no perturbado; al aplicar la perturbación siguen siendo canónicas pero dejan de ser variables acción-ángulo. Esto se sigue de las ecuaciones de movimiento: ∂H I˙ν0 = − 0 ; ∂ϕν ϕ̇0ν = ∂H ∂Iν0 (11.15) Las Iν0 dependen del tiempo y las ϕ0ν no son funciones lineales del tiempo. Para λ = 0, H = H0 y en ese caso se cumple que H0 sólo es función de las Iν0 . H, sin embargo, tiene la expresión: H(I 0 , ϕ0 , t) = H0 (I 0 ) + λH1 (I 0 , ϕ0 , t) + λ2 H2 (I 0 , ϕ0 , t) + ... (11.16) Mediante una transformación canónica es posible, si el sistema perturbado es integrable, pasar a unas variables canónicas (I, ϕ) tales que H sea función sólo de las Iν .2 Llamaremos F (ϕ0 , I) a la función generatriz de esa transformación, del tipo F2 . Las siguientes son las fórmulas de transformación: Iν0 = ∂F ; ∂ϕ0ν ϕν = ∂F ∂Iν (11.17) Las nuevas variables deben satisfacer las siguientes condiciones: (a) Las coordenadas del sistema (q, p) deben ser funciones periódicas de las ϕν con perı́odo 2π. (b) H debe transformarse en una función que depende sólo de las Iν . (c) Las variables (ϕ0 , I 0 ) han de ser funciones periódicas de las ϕν con perı́odo 2π. Las coordenadas (q, p) son funciones periódicas tanto de las ϕ0ν como de las ϕν . Esto implica que una celdilla fundamental en el espacio ϕ0ν se transforma en otra del espacio ϕν . Entonces debe cumplirse que ϕν es igual a ϕ0ν más una función periódica de las ϕ0ν con perı́odo 2π. 2 Esta teorı́a fue desarrollada por H. Poincaré (1892) y H. von Zeipel (1916). Teorı́a de perturbaciones / 483 La función F (ϕ0 , I) puede expandirse en una serie de potencias de λ. Cuando λ = 0, F se convierte en la función generatriz de la transformación canónica identidad, de ahı́ que deba ser del tipo F2 : F (ϕ0 , I) = l X ϕ0ν Iν + λF (1) (ϕ0 , I) + λ2 F (2) (ϕ0 , I) + ... (11.18) ν=1 Entonces (11.16) y (11.18) nos conducen a: Iν0 = Iν + λ (2) ∂F (1) 2 ∂F + λ + ... ∂ϕ0ν ∂ϕ0ν ϕν = ϕ0ν + λ (11.19) ∂F (1) ∂F (2) + λ2 + ... ∂Iν ∂Iν (11.20) F (1) , F (2) , ... deben ser funciones periódicas de las ϕ0ν con perı́odo 2π. La ecuación de Hamilton-Jacobi del problema perturbado es: ∂F 0 ∂F 0 ∂F 2 + λH1 ϕ , + λ H2 ϕ , + ... = H(I) H0 ∂ϕ0 ∂ϕ0 ∂ϕ0 (11.21) Ahora reemplazamos (11.19) en (11.21) y expandimos cada término de (11.21) en potencias de λ. Llamamos λn H (n) (I) al n-ésimo término de la expansión de H(I). En seguida igualamos los coeficientes de cada λn y obtenemos una secuencia de ecuaciones diferenciales, ası́: H0 (I) = H (0) (I) (11.22) X ∂H0 (11.23) ν ∂Iν · ∂F (1) + H1 (ϕ0 , I) = H (1) (I) ∂ϕ0ν 1 X X ∂ 2 H0 ∂F (1) ∂F (1) X ∂H0 ∂F (2) · · · + 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕ0µ ∂Iν ∂ϕ0ν ν + X ∂H1 ∂F (1) · + H2 (ϕ0 , I) = H (2) (I) 0 ∂I ∂ϕ ν ν ν (11.24) .................................... n−1 X n−s X l X X s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik (i2 ) · 1 ∂ k Hs ∂F (i1 ) · k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1 =s (ik ) ∂F ∂F ... + Hn (ϕ0 , I) = H (n) (I) ; ∂ϕ0ν2 ∂ϕ0νk n = 0, 1, 2, ... (11.25) 484 / Mecánica clásica avanzada Todas estas ecuaciones son de la forma: l X ∂H0 ∂F (n) · + Φn (ϕ0 , I) = H (n) (I) 0 ∂I ∂ϕ ν ν ν=1 (11.26) donde Φn es una función que depende sólo de F (1) , F (2) , ...F (n−1) . La ecuación (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es función periódica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es cero. Por tanto: H (1) (I) = hH1 (ϕ0 , I)i donde h(...)i denota: 1 (2π)l h(...)i = Z 2π 0 dϕ01 (11.27) Z 0 2π dϕ02 ... Z 0 2π dϕ0l (...) (11.28) La energı́a del movimiento perturbado es, en la primera aproximación, igual a la energı́a del movimiento no perturbado más una corrección dada por el promedio de la función de perturbación sobre el toroide invariante del movimiento no perturbado. Este promedio, cuando se cumpla la hipótesis ergódica, también es igual al promedio temporal de H1 sobre el movimiento no perturbado. Para calcular a F (1) , es necesario resolver la ecuación diferencial: l X ∂H0 ∂F (1) . = − H1 (ϕ0 , I) 0 ∂I ∂ϕ ν ν ν=1 (11.29) donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que puede representarse por una serie de Fourier de la forma: XX X 0 0 0 ′ An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.30) ... {H} = n1 n2 nl donde la tilde en la sumatoria denota la omisión del término con n1 = n2 = ...nl = 0. F (1) tiene una expansión similar: XX X 0 0 0 ′ F (1) = ... Bn1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.31) n1 n2 nl Los coeficientes de Fourier de F (1) se obtienen directamente de los de {H1 } al reemplazar a (11.30) y (11.31) en (11.29): B~n (I) = −A~n (I) i~n · ~ ω 0 (I) (11.32) En la aproximación de primer orden se sigue de (11.20): ϕν = ϕ0ν + λ ∂F (1) (ϕ0 , I) ∂Iν (11.33) Teorı́a de perturbaciones / 485 lo cual nos dice que las variables angulares perturbadas presentan pequeñas oscilaciones con amplitud del orden de λ. El cambio en las frecuencias se obtiene de: ων0 (I) = ∂H(I) ∂H (1) (I) = ων0 (I) + λ ∂Iν ∂Iν (11.34) y resulta ser pequeño. De (11.19) se obtiene para las Iν0 : Iν = Iν + λ ∂F (1) (ϕ0 , I) ∂ϕ0ν (11.35) lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora están sometidas a oscilaciones de amplitud del orden de λ. Que no haya degeneración es una exigencia necesaria para que (11.32) tenga sentido. Ası́ no haya degeneración pueden presentarse los llamados pequeños divisores, o sea valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores pequeños. De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual nos da una ecuación diferencial para F (2) : ∂F (1) ∂F (1) 1 X X ∂ 2 H0 · · 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕµ (11.36) X ∂H0 ∂F (2) X ∂H1 ∂F (1) + H2 (ϕ0 , I) = 0 + · + 0 0 ∂I ∂ϕ ∂I ∂ϕ ν ν ν ν ν ν En tanto que la corrección de segundo orden a la energı́a viene dada por: X ∂H1 ∂F (1) 0 H2 (I) = hH2 (ϕ , I)i + · ∂Iν ∂ϕ0ν ν 1 X X ∂ 2 H0 + 2 µ ν ∂Iµ ∂Iν ∂F (1) ∂F (1) · ∂ϕ0µ ∂ϕ0ν (11.37) Podemos ahora usar (11.31) y (11.32) en (11.37) para obtener: H (2) = hH2 i − l X X n nν A−~ n ′ ∂A~ 0 ∂I ~ n · ω ~ ν ν=1 ~ n + l l 1 X X ∂ωµ0 X ′ A~n A−~n nν nµ 2 µ=1 ν=1 ∂Iν (~n · ~ω 0 )2 (11.38) ~ n donde se ha usado la fórmula: ~ hei(~n+m) · ϕi = δ~n,−m ~ (11.39) 486 / Mecánica clásica avanzada H (2) puede también escribirse en la forma: H (2) = hH2 i − l |A~n |2 ∂ 1 X′ X nν 2 ∂Iν ~n · ω ~0 ν=1 (11.40) ~ n que equivale también a: H (2) = hH2 i − l X X ~ n·~ ω 0 >0 ∂ nν ∂Iν ν=1 |A~n |2 ~n · ~ω 0 (11.41) Para la corrección de orden n, se sigue de (11.26) que: H (n) (I) = hΦn (ϕ0 , I)i (11.42) en tanto que F (n) es solución de la ecuación: l X ων0 ν=1 ∂F (n) = − {Φn } ∂ϕ0ν Podemos expresar a {Φn } como una serie de Fourier: X (n) ′ im· ~ ϕ ~0 {Φn } = Am ~ (I) e (11.43) (11.44) m ~ de donde se sigue que los coeficientes de Fourier de F (n) son: (n) Bm ~ (n) = −Am ~ im ~ ·ω ~0 (11.45) Esto nos dice que a cada orden es necesaria la condición de no degeneración del movimiento no perturbado. Poincaré mostró que las series de Fourier para las F (n) son convergentes en sentido asintótico. Por esto pueden truncarse a partir de valores razonables de los nν y obtenerse resultados precisos, independientemente de la presencia de los “pequeños divisores” que necesariamente aparecen para nν grandes al tomar la serie completa. Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador armónico con perturbación anarmónica. El oscilador anarmónico con correcciones cúbicas y cuárticas es soluble exactamente por cuadraturas. Pero es ilustrativa la manera de aplicar la teorı́a de perturbaciones para obtener las variables acción-ángulo del problema perturbado. El hamiltoniano no perturbado es: H0 = 1 p2 + m(ω 0 )2 q 2 2m 2 (11.46) y la perturbación: H1 = aq 3 ; H2 = bq 4 (11.47) Teorı́a de perturbaciones / 487 De acuerdo con el ejemplo 9.5.5, las variables acción-ángulo del problema no perturbado se hallan mediante la transformación canónica con función generatriz F1 , dada por: F (q, ϕ0 ) = 1 mω02 cot ϕ0 2 (11.48) que da lugar a la transformación: 0 1/2 2I sen ϕ0 ; p = (2mI 0 ω 0 )1/2 cos ϕ0 q= mω 0 (11.49) Expresando a H0 , H1 y H2 en términos de I 0 y ϕ0 , obtenemos: H0 = I 0 ω 0 (11.50) H1 = a 2I 0 mω 0 3/2 H2 = b 2I 0 mω 0 2 sen3 ϕ0 (11.51) sen4 ϕ0 (11.52) De (11.27) obtenemos directamente: H (1) = hH1 i = 0 (11.53) Como ∂H0 /∂I 0 = ω 0 , se sigue de (11.29) que F (1) obedece la ecuación: ∂F (1) a =− 0 ∂ϕ0 ω 2I mω 0 3/2 sen3 ϕ0 (11.54) Es decir, el término cúbico en la perturbación no da lugar a cambio en la energı́a del oscilador. Pero como F (1) es diferente de cero, las expresiones (11.49) para p y q sı́ resultan modificadas al primer orden. Al introducir la perturbación, I 0 deja de ser constante, pues de (11.35) y (11.54) se sigue que presenta oscilaciones de frecuencias w0 y 3w0 . Ahora, usemos (11.24) para hallar a H (2) : ∂H1 ∂F (1) (2) 0 (11.55) · H (I) = hH2 (ϕ , I)i + ∂I ∂ϕ0 El cálculo nos da: H (2) = − 15a2 I2 I2 3b + 3 0 4 2 4 m (ω ) 2 m (ω 0 )2 (11.56) De (11.54) se sigue la siguiente expresión para F (1) : F (1) = a 3ω 0 2I mω 0 3/2 sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.57) 488 / Mecánica clásica avanzada 0por tanto: ∂F λa ϕ= = ϕ0 + ∂I 2Iω 0 2I mω 0 3/2 sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.58) Ahora resolvemos esta ecuación para ϕ0 en términos de ϕ, al primer orden en λ: 3/2 λa 2I 0 ϕ =ϕ− sen2 ϕ cos ϕ + 2 cos ϕ (11.59) 2Iω 0 mω 0 A este mismo orden, I 0 en función de (I, ϕ) es: 3/2 λa 2I 0 I =I− 0 sen3 ϕ ω mω 0 (11.60) Al reemplazar (11.59) y (11.60) en la expresión (11.49) para q, que sigue siendo válida en el sistema perturbado, obtenemos: 1/2 λaI 2I sen ϕ − 2 0 3 (3 + cos 4ϕ) (11.61) q= mω 0 m (ω ) Ejercicio 11.2.1 Aplicar la teorı́a de perturbaciones al péndulo simple, tomando como parámetro pequeño la relación entre la energı́a de libración y la energı́a de la separatriz (pequeñas oscilaciones). Mostrar que: H(I) = ω 0 I − F (1) λGI 16 2 (11.62) GI 2 =− (8 sen ϕ − sen 4ϕ) 192ω 0 ver el ejemplo 10.3.2. 11.3. Multiplicidad de conjuntos de variables acciónángulo en los sistemas degenerados Los ejemplos 10.3.5 y 10.4.4 ilustran la propiedad general de los sistemas degenerados consistente en que la separación de variables de la ecuación de Hamilton-Jacobi es posible en diferentes sistemas de coordenadas, lo que a su vez conlleva a la posibilidad de definir diferentes conjuntos de variables acción-ángulo. Entonces un sistema múltiplemente periódico con degeneración se caracteriza por poseer diferentes conjuntos de perı́odos, correspondientes a los diferentes conjuntos de variables acción-ángulo. Si f denota alguna coordenada o momento generalizado, cuando el sistema es degenerado existen varios conjuntos de variables acción-ángulo (I,ϕ), (I ′ ,ϕ′ ), ..., con lo cual f posee la propiedad: f (I1 , I2 , ...Il ; ϕ1 + 2π, ϕ2 + 2π, ...ϕl + 2π) = (11.63) f (I1 , I2 , ...Il ; ϕ1 , ϕ2 , ...ϕl ) Teorı́a de perturbaciones / 489 f (I1′ , I2′ , ...Il′ ; ϕ′1 + 2π, ϕ′2 + π, ...ϕ′l + 2π) = (11.64) f (I1′ , I2′ , ...Il′ ; ϕ′1 , ϕ′2 , ...ϕ′l , ), etc. Es decir, las diferentes expresiones de f en variables acción-ángulo poseen propiedades de periodicidad similares. Como ilustración, ver las fórmulas (10.269) ejemplo 10.4.2, y (10.361) ejemplo 10.5.1, mediante las cuales se expresa a z en términos de las variables acción-ángulo esféricas y parabólicas en el caso de una partı́cula en un potencial 1/r. Se ve que la relación entre los diferentes conjuntos de variables no es trivial y que las variables de acción esféricas dependen no sólo de las variables de acción parabólicas sino también de las variables angulares parabólicas. La ecuación (10.344) nos da la relación entre ϕr y las variables acción-ángulo parabólicas: −1 A + B cos(αη − αξ ) ϕr = −ϕξ − tan (11.65) B sen (αη − αξ ) que nos muestra que ϕr es igual a una función lineal de las variables angulares parabólicas más una función periódica de esas variables. Teorema 11.3.1 Todos los sistemas de variables angulares en que una función f (I, ϕ) tiene perı́odo fundamental 2π, están conectados entre sı́ por las fórmulas: ϕν = l X nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ ) (11.66) µ=1 ν = 1, 2, ...l donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν son funciones periódicas de las ϕ′ν con perı́odo 2π. Según el teorema, buscamos una transformación: ϕν = fν (ϕ′ , I ′ ) (11.67) para la cual es preservada la periodicidad de cualquier variable dinámica F (como la z citada anteriormente): F (ϕ, I) = F ′ (ϕ′ , I ′ ) (11.68) Ahora llamemos ϕν a: ϕν = fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) (11.69) Entonces: F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = (11.70) F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl ) 490 / Mecánica clásica avanzada Lo cual significa que ϕν y ϕν difieren por un múltiplo de 2π entero que llamaremos 2πnν1 : fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnν1 (11.71) De manera similar se cumple: fν I ′ ; ϕ′1 , ϕ′2 , ...ϕ′µ + 2π, ...ϕ′l = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnνµ ; ν, µ = 1, 2, ...l (11.72) esto sólo es posible si fν es de la forma: fν (I ′ , ϕ′ ) = l X nνµ ϕ′µ + ψν (ϕ′ , I ′ ) (11.73) µ=1 donde ψν es función periódica de las ϕ′µ con perı́odo 2π. Claramente vemos que (11.65) es una realización de la fórmula (11.66). Evidentemente la expresión para ϕ′ν en términos de (ϕ) es de la forma (11.66). Esto requiere que la matriz inversa de (nνµ ) tenga igualmente elementos enteros. La condición necesaria para esto es que det (nνµ ) = ±1. Función generatriz de la transformación (ϕ, I)→ (ϕ′ , I ′ ). La transformación (11.66) se puede escribir como: ϕν = l X nνµ ϕ′µ + ψν (ϕ′ , I) ; ν = 1, 2, ...l (11.74) µ=1 Lo cual indica que la transformación canónica se puede obtener mediante una función generatriz de la forma G(ϕ′ , I), del tipo F3 : ϕν = − ∂G ; ∂Iν Iν′ = − ∂G ; ∂ϕ′ν ν = 1, 2, ...l (11.75) Con lo cual G es de la forma: G(ϕ′ , I) = − l X nνµ Iν ϕ′µ + ψ (ϕ′ , I) (11.76) ν,µ=1 lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir: ∂ψµ ∂ψν = ∂Iµ ∂Iν (11.77) Las fórmulas de transformación para las Iν′ son: Iν′ = l X µ=1 nνµ Iν − ∂ψ ∂ϕ′ν La función ψ debe ser periódica en las ϕν y en las ϕ′ν . Por tanto: X ψ= C~n (I)ei~n·ϕ~ ~ n (11.78) (11.79) Teorı́a de perturbaciones / 491 Entonces (11.74) y (11.78) toman la forma: ϕν = l X nνµ ϕ′µ − X ∂C~n (I) nνµ Iν − i X µ=1 Iν′ = l X µ=1 ∂Iν ~ n ei~n·ϕ~ ′ C~n (I)nν ei~n·ϕ~ (11.80) ′ (11.81) ~ n Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acción-ángulo, las (I, I ′ ) deben ser constantes y las (ϕ, ϕ′ ) deben ser funciones lineales del tiempo. Esto implica una de las dos condiciones siguientes: C~n (I) = 0 para ~n 6= 0 (11.82) o que en el exponente de la serie de Fourier sólo aparecen combinaciones de las ϕ′ν tales que: n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t (11.83) +n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante Claramente la condición (11.83) requiere que el sistema sea degenerado, ~n · ω ~ ′ = 0. En conclusión, para un sistema no degenerado, hay varios conjuntos de variables acción-ángulo, conectados entre sı́ mediante las fórmulas: ϕν = l X µ=1 nνµ ϕ′µ − ∂ψ ; ∂Iν Iν′ = l X nνµ Iν (11.84) µ=1 con función generatriz: G(ϕ′ , I) = − l X l X nνµ Iν ϕ′µ + ψ(I) (11.85) ν=1 µ=1 donde nνµ es una matriz de elementos enteros y determinante ±1. En el caso degenerado, asumimos que entre las ων′′ existen l − s relaciones de conmensurabilidad: l X nν ων′′ = 0 (11.86) ν=1 Es posible realizar una transformación canónica auxiliar a nuevas variables acciónángulo (I ′ , ϕ′ ) tal que l − s de las frecuencias ων′ sean idénticamente cero y las s restantes sean no nulas e independientes entre sı́: ωα′ ; α = 1, 2, ...s (Inconmensurables) (11.87) ωρ′ = 0 ; ρ = s + 1, s + 2, ...l 492 / Mecánica clásica avanzada La función generatriz de tal transformación es de la forma: F =− l X Cνµ Iν′′ ϕ′µ (11.88) ν,µ=1 De donde: ϕ′′ν = l X Cνµ ϕ′µ ; Iν′ = l X Cνµ Iµ′′ (11.89) µ=1 µ=1 donde las ων′′ satisfacen las relaciones (11.86). Claramente: ϕ′ν = l X Cνµ ϕ′′µ (11.90) µ=1 lo cual implica que para satisfacerse (11.87) es necesario: l X Cµρ ϕ′′µ = 0 para ρ = s + 1, s + 2, ...l (11.91) µ=1 Es decir, las Cµρ se obtienen de los nµ que aparecen en las l − s relaciones de conmensurabilidad (11.86). Ejemplo 11.3.1 Considerar el movimiento de una partı́cula en un potencial 1/r. Este problema es degenerado. Realizar una transformación a variables acción-ángulo tales que las frecuencias satisfagan las condiciones (11.87). En coordenadas esféricas las dos condiciones de degeneración pueden escribirse como: ωr − ωθ = 0 ; ωϕ − ωθ = 0 (11.92) De la función generatriz F = (ϕϕ − ϕθ )I1 + (ϕr − ϕθ )I2 + ϕr I3 se sigue que las variables acción-ángulo buscadas son: ϕ1 = ϕϕ − ϕθ ; ϕ2 = ϕr − ϕθ ; ϕ3 = ϕr (11.93) y, I1 = Iϕ ; I2 = Iθ + Iϕ ; I3 = Ir + Iθ + Iϕ (11.94) mk 2 I33 (11.95) Las nuevas frecuencias son: ω1 = 0 ; ω2 = 0 ; ω3 = En coordenadas parabólicas la transformación buscada puede obtenerse con la función generatriz: ϕξ + ϕη − ϕ I1 + (ϕξ − ϕη )I2 − ϕξ I3 (11.96) F = 2 Teorı́a de perturbaciones / 493 que da lugar a la transformación: I1 = Iϕ ; I2 = Iη + ϕ1 = ϕϕ − ϕξ + ϕη ; 2 Iϕ ; 2 I3 = Iξ + Iη + Iϕ ϕ2 = ϕη − ϕξ ; ϕ3 = ϕξ (11.97) (11.98) En tanto que ω1 , ω2 y ω3 están dadas por las fórmulas (11.95). Con esta transformación, los resultados del capı́tulo 10 referentes a las constantes de movimiento que resultan de la degeneración se expresan como: θ1 = −ϕ2 ; φ1 = ϕ1 (11.99) La clasificación dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acciónángulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen constantes en el curso del movimiento. El número s de frecuencias ωα′ no nulas e independientes se llama el grado de periodicidad del sistema y el número l − s se llama el grado de degeneración. Consideraremos ahora las fórmulas de transformación (11.80) y (11.81) en el caso degenerado. Con el fin de que la división entre variables degeneradas y no degeneradas persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de las ϕα . Esto implica que los elementos nρα se anulen. Las fórmulas de transformación que toman en cuenta lo anterior y además que las ϕα y las ϕ′α son funciones lineales del tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son: ϕα = l X nαµ ϕ′µ + ψα (ϕ′σ , I) (11.100) µ=1 ϕρ = l X nρσ ϕ′σ + ψρ (ϕ′σ , I) (11.101) σ=s+1 Iα′ = s X nβα Iβ l X nνρ Iρ − i (11.102) β=1 Iρ′ = ν=1 X C~nσ (I)nρ ei~nσ ·ϕ~ σ (11.103) ~ nσ donde el subı́ndice σ se coloca a los vectores para indicar que solamente tienen componentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple que: det nνµ = ±1 y det nαβ = ±1 (11.104) En conclusión, las variables de acción no degeneradas están determinadas unı́vocamente, aparte de una transformación lineal entera homogénea de determinante ±1. Por 494 / Mecánica clásica avanzada su parte, las variables de acción degeneradas no necesitan transformarse integralmente y pueden depender de variables angulares degeneradas; los nνρ no necesitan ser enteros. Esto podemos ilustrarlo con el ejemplo 11.3.1 y las fórmulas de la sección 10.5, referentes al problema de Kepler. Las variables angulares no degeneradas son ϕ′3 = ϕξ y ϕ3 = ϕr , las variables angulares degeneradas son ϕ′2 = ϕη − ϕξ , ϕ′1 = ϕϕ − (ϕξ + ϕη )/2, ϕ2 = ϕr − ϕθ y ϕ1 = ϕϕ − ϕθ . Vemos la correspondencia entre las fórmulas (11.65) y (11.100). Por otra parte, I3′ = Iξ + Iη + Iϕ y I3 = Ir + Iθ + Iϕ , o sea que I3′ = I3 , que corresponde a (11.102). Una fórmula del tipo (11.103) es la que expresa a I2 = Iθ + Iϕ en términos de I3′ , I2′ , I1′ , ϕ′2 , que se obtiene fácilmente de la fórmula (10.325), sección 10.5. h i p I22 = 12 I3′2 1 − β 2 + γ 2 − (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos ϕ′2 (11.105) 11.4. Teorı́a de perturbaciones de sistemas degenerados En la sección 11.2 obtuvimos las fórmulas para las correcciones a la energı́a y a la función generatriz cuando un sistema no degenerado se somete a una perturbación. Ya en la fórmula (11.45) encontramos un resultado que no se puede aplicar cuando hay degeneraciones. En la fórmula (11.42), para las correcciones a la energı́a, aparece un promedio sobre todas las variables angulares, pero hemos visto que en un sistema degenerado hay l − s nuevas constantes de movimiento, las l − s variables angulares que permanecen constantes, con valores dependientes sólo de las condiciones iniciales. Por esto la trayectoria de fases no ocupa una región l-dimensional sino una de sólo s dimensiones. Un promedio sobre las variables angulares degeneradas es más bien un promedio sobre todos los movimientos que resultan de cambiar las condiciones iniciales, o sea un promedio sobre un ensamble, lo cual es inadmisible cuando se considera un solo sistema. En conclusión, en (11.42) no tiene sentido promediar sobre las ϕ0ρ , quedando H (n) dependiente de las variables angulares ϕ0ρ : (11.106) H (n) Iα ; ϕ0ρ , Iρ Esto tiene una razón fı́sica más profunda: las variables (ϕ0 , I 0 ) que se obtienen de las variables del problema perturbado (ϕ, I) al hacer λ = 0 no están determinadas por el movimiento no perturbado sino por la perturbación. Es decir, no podemos partir de cualquier conjunto de variables acción-ángulo del sistema no perturbado sino que antes debemos encontrar un conjunto de variables acción-ángulo “exactas en la aproximación cero”. Este comportamiento se refleja en la teorı́a cuántica de perturbaciones de sistemas degenerados, donde se deben formar combinaciones lineales de las funciones de onda degeneradas para obtener las funciones de onda exactas en la aproximación cero, que son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mecánica cuántica equivale a buscar una combinación lineal de las funciones degeneradas que diagonalice la perturbación, en teorı́a de perturbaciones degeneradas de primer orden.3 3 Véase la sección 12.5, capı́tulo 12. Teorı́a de perturbaciones / 495 Debido a su carácter degenerado, otras variables de acción degeneradas, conectadas con las Iρ0 por relaciones de la forma (11.103), deben introducirse en lugar de las Iρ0 mediante una adecuada elección de las coordenadas. Tal elección, obviamente, está determinada por la perturbación (o más exactamente, por las simetrı́as que tenga la perturbación). Debemos realizar una transformación canónica preliminar, escogida de tal manera que, al primer orden, H1 dependa sólo de variables de acción. La transformación es (I 0 , ϕ0 ) → (I 0 ′ , ϕ0 ′ ), con función generatriz: G(ϕ0 , I 0 ′ ) = l X Iν0 ′ ϕ0ν + V (ϕ0ρ , I 0 ′ ) (11.107) ν=1 La fórmulas de transformación son: Iα0 = ∂G = Iα0 ′ ; ∂ϕ0α ϕ′α = ∂G ∂V = ϕ0α + 0 ′ ; ∂Iα0 ′ ∂Iα Iρ0 = ∂G ∂V = Iρ0 ′ + ∂ϕ0ρ ∂ϕ0ρ ′ ϕ0ρ ′ = ∂G ∂V = ϕ0ρ + 0 ′ ∂Iρ0 ′ ∂Iρ (11.108) (11.109) G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la cual se halla resolviendo la ecuación de Hamilton-Jacobi siguiente: 0 0 ∂G = H (1) (I 0 ′ ) (11.110) H1 Iα , ϕρ , ∂ϕ0ρ En este punto está garantizando que la perturbación no dependerá de variables angulares al promediar sobre las variables angulares no degeneradas y que se cumple siempre la condición m ~ ·~ ω 0 6= 0. Ahora expresamos a H en términos de (I ′ , ϕ′ ): H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ... (11.111) y, como en la sección 11.2, buscamos una transformación canónica (I ′ , ϕ′ ) → (I, ϕ), lo cual dará lugar nuevamente a las fórmulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en lugar de (ϕ0 ′ , I 0 ′ ). Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene: s X ∂H0 ∂F (n) · = H (n) (I) − Φn (ϕ0 , I) 0 ∂I ∂ϕ α α α=1 (11.112) Al primer orden, en vez de (11.29) tenemos: s X ∂H0 ∂F (1) · = − H1 (ϕ0 , I) 0 ∂Iα ∂ϕα α=1 (11.113) donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4 Es claro que la ecuación (11.113) no permite determinar completamente a F (1) , pues 4 La solución de la forma (11.32) aún existe, siendo bien definida salvo posibles divergencias debidas 0 ≈ 0. a la presencia de pequeños denominadores en los armónicos altos, ~ nα · ~ ωα 496 / Mecánica clásica avanzada cualquier solución de (11.113) está indeterminada por la adición de una función de Iν y ϕ0ρ . Llamaremos G(1) a la parte de F (1) determinada por (11.113), de modo que: F (1) = G(1) + R(1) (11.114) donde R(1) deberá quedar determinada en la siguiente aproximación. Ahora, la ecuación (11.24) puede escribirse como: s s 1 X X ∂ 2 H0 ∂G(1) ∂G(1) · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1 + l X ∂H 0 α=1 ∂Iα (2) · l X ∂H1 (11.115) (1) ∂F ∂F + · + H2 (ϕ0 , I) = H (2) (I) 0 ∂ϕ0α ∂I ∂ϕ ν ν ν=1 De esta ecuación podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) . Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν completas por hh...ii. Entonces: H (2) (I) = hhΦ2 ii (11.116) donde Φ2 es completamente conocida: s Φ2 = s 1 X X ∂ 2 H0 ∂G(1) ∂G(1) · · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1 + s X ∂H1 α=1 ∂Iα (11.117) ∂G(1) · + H2 (ϕ0 , I) ∂ϕ0α R(1) es solución a la ecuación: l X ∂H1 ∂R(1) . = −{hΦ2 i} ∂Iρ ∂ϕ0ρ ρ=s+1 (11.118) donde: {hΦ2 i} = hΦ2 i − hhΦ2 ii (11.119) F (2) es solución a: s X ∂H0 ∂F (2) · = −{Φ2 } ∂Iα ∂ϕ0α α=1 (11.120) pero (11.120) determina sólo una parte G(2) , quedando por determinar una función R(2) que depende de ϕ0ρ y Iν , en la aproximación siguiente. La ecuación secular. Consideremos primero el cambio en los coeficientes de Fourier de una variable dinámica al pasar de un sistema de variables acción-ángulo a otro, (I, ϕ) → (I, ϕ). Asumamos que la transformación canónica es del tipo G(I, ϕ), Teorı́a de perturbaciones / 497 de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las expansiones de Fourier de f (I, ϕ) = f (I, ϕ): X X im· ~ ϕ ~ f (I, ϕ) = f~n (I)ei~n·ϕ~ = f (I, ϕ) = fm (11.121) ~ (I)e ~ n m ~ Entonces, claramente f m n (I), ası́: ~ (I) pueden expresarse en función de f~ I I I X 1 ~ f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ ... fm (11.122) ~ (I) = (2π)l ~ n Llamaremos i~ α ·~ a e ϕ: ′ gα~⋆ α~ ′ (I) a los coeficientes de la expansión de Fourier de ei~α·ϕ~ respecto ~′ ~ ei~αϕ~ = gα~⋆ α~ ′ (I) eiα ·ϕ (11.123) donde se supone que ϕ puede expresarse en términos de (I, ϕ). Ahora en (11.122) sea ~n = α ~ −α ~′ y m ~ = β~ − β~ ′ . Entonces (11.122) y (11.123) nos conducen fácilmente a: XX f β− gα~⋆ β~ (I) fα~ −~α′ (I) gα~ ′ β~′ (I) ~ β ~ ′ (I) = α ~ = α ~ XX α ~ α ~′ (11.124) g+ ~ −~ α′ (I) gα ~ ′ (I) ~ (I) fα ~ ′β β~ α ⋆ donde g + ~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124) ~ α = gα ~β β~ nos dice que f~n y fm ~ están conectados por medio de una transformación unitaria. Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables canónicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las fórmulas (11.108) y (11.109). La transformación canónica buscada, por definición, conduce a una expresión que no depende de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresión en términos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuación de Hamilton-Jacobi (11.110) con la (11.124). La transformación canónica buscada debe dar lugar a coeficientes de Fourier de la forma: ′ 0′ (1) 0 ′ fβ− (I )δβ, ~β ~′ ~ β ~ ′ (I ) = H Por tanto (11.124) para este caso puede escribirse ası́: i h XX 0 0 (1) 0 g+ (I )δα~ α~ ′ gα~ ′ β~ ′ (I 0 ) = 0 ~ −~ α′ (I ) − H ~ (I ) fα β~ α α ~ (11.125) (11.126) α ~′ donde hemos usado la fórmula X + gβ~ ~ ′ = δβ, ~β ~′ ~ α gα ~β (11.127) α ~ En otras palabras, la transformación canónica es tal que diagonaliza la matriz fα~ −~α′ (I 0 ) formada con los coeficientes de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables angulares degeneradas. H (1) (I 0 ′ ) se obtienen resolviendo la ecuación secular: i h (11.128) det fα~ −~α′ (I 0 ) − H (1) (I 0 ′ )δα~ α~ ′ = 0 498 / Mecánica clásica avanzada en tanto que la transformación canónica se obtiene a partir de los vectores propios de la matriz fα~ −~α′ (I 0 ), suministrando la conexión entre las variables angulares ϕ0ρ y ϕ0ρ ′ . Debe notarse que las matrices que aparecen en este desarrollo son de dimensión infinita; por tanto (11.128) debe entenderse como el paso al lı́mite de una secuencia de determinantes. Vemos que encontrar las variables acción-ángulo exactas en la aproximación cero equivale a diagonalizar la matriz formada con los coeficientes de Fourier de la perturbación. También encontramos que resolver la ecuación de Hamilton-Jacobi independiente del tiempo, equivale, siempre, a diagonalizar la matriz de los coeficientes de Fourier del respectivo hamiltoniano. Ejemplo 11.4.1 Encontrar las variables de acción perturbadas en el efecto Stark del átomo de hidrógeno clásico, en coordenadas esféricas. El hamiltoniano para este problema es de la forma H = H0 + λH1 , donde: H0 = − m(Ze2 )2 2(I30 )2 (11.129) es la energı́a del movimiento kepleriano en ausencia del campo y: λH1 = eEz (11.130) es la perturbación. z está dada por la fórmula (10.268), " 0 2 #1/2 I1 z = 1− (x0 cos ϕ02 − y 0 sen ϕ02 ) I20 (11.131) x0 y y0 son las coordenadas cartesianas del electrón en el plano de la órbita, y el eje menor es x. La única variable angular no degenerada es ϕ03 , de la cual dependen x0 y y 0 , según las fórmulas (10.222) y (10.223). Por tanto: 3 hx0 i = − ǫ0 a0 ; 2 hy 0 i = 0 (11.132) En consecuencia, tomando a E como λ: hH1 (I30 , ϕ02 , I10 , I20 )i = " 0 2 #1/2 " 0 2 #1/2 I1 I2 3 0 . 1− cos ϕ02 − ea 1 − 0 2 I2 I30 (11.133) a0 es igual a: a0 = (I30 )2 mZe2 (11.134) En esta expresión no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes durante el movimiento perturbado y aparecen como parámetros. Las únicas variables son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la órbita no permanece Teorı́a de perturbaciones / 499 rı́gida sino que presenta oscilaciones de la excentricidad y del perihelio en el plano de la órbita, el cual a su vez gira uniformemente alrededor del eje z y oscila alrededor de la lı́nea de nodos (Véase la figura 10.11). La ecuación de Hamilton-Jacobi (11.110) que nos determina la variable de acción I20 exacta en la aproximación cero para este caso es: " 0 2 0 2 0 2 #1/2 0 3ea E I2 I1 I1 − cos ϕ02 1− = H (1) (I 0 ′ ) (11.135) − + 2 I30 I20 I30 la cual nos da explı́citamente a I20 = ∂G/∂ϕ02 y entonces a G. Las integrales resultan bastante difı́ciles. Si sólo queremos hallar a H (1) (I 0 ′ ), notemos que (11.108) al ser integrada sobre un perı́odo de ϕ02 , nos da: I I ∂V1 1 1 0′ 0 0′ dϕ02 (11.136) I2 dϕ2 − I2 = 2π 2π ∂ϕ02 y que según (11.109) V1 es una función periódica de ϕ02 , con lo cual: I 1 I20 ′ dϕ02 I20 ′ = 2π (11.137) lo cual nos suministra la expresión para H (1) que buscamos. Llamemos (I30 )2 = A, (I10 )2 = B, [2H (1) /(3ea0 E)]2 = C y (I20 )2 = x. Por tanto 0 2I2 dI20 = dx, o sea: √ 2 x dI20 = dx (11.138) lo cual nos permite escribir: I I √ dϕ02 1 1 ∂ϕ0 x I20 ′ = dx I20 02 dI20 = 2π dI2 2π dx (11.139) De (11.135) se sigue que: cos2 ϕ02 = C x B B 1− − + A x A Por tanto: d(sec 2 ϕ02 ) 1 = C 1 B − + 2 dx A x (11.140) (11.141) En consecuencia: √ dϕ02 (x2 − AB) AC = √ dx 2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2 Entonces (11.139) nos da: √ I (x2 − AB) dx AC I20 ′ = 4π (A − x)(x − B)[(A − x)(x − B) − ACx]1/2 (11.142) (11.143) 500 / Mecánica clásica avanzada La integral se hace usando el método de los residuos, teniendo en cuenta que en el plano complejo el integrando es una función biforme (positivo entre xmı́n y xmáx y negativo entre xmáx y xmı́n ), presentando una lı́nea de ramificación. Por otra parte el integrando posee singularidades en x = A, x = B y x = ∞, con polos en esos puntos. El residuo en x = A vale −2π/C 1/2 , el residuo en x = B vale 2π[B/(AC)]1/2 y el residuo en x = ∞ vale 2π (el cual se obtiene con la sustitución y = 1/x). En consecuencia: √ √ 1 √ I20 ′ = A − B − CA (11.144) 2 que es lo mismo que: " # (1) 1 0′ 0′ 0′ 0 ′ 22 H I2 = I − I3 − (I2 ) (11.145) 2 2 3ea0 Por tanto H (1) vale: H (1) (I 0 ′ ) = ± 3eEa0 ′ 0 ′ (I1 − I30 ′ − 2I20 ′ ) 2I10 ′ (11.146) Este ejemplo ilustra el método de las perturbaciones seculares, que hacen que las variables angulares degeneradas, que en el problema no perturbado son constantes, pasen a ser funciones lineales del tiempo dando lugar a oscilaciones en los parámetros de la órbita que aumentan con la intensidad de la perturbación. En efecto, las frecuencias perturbadas son: ω30 ′ = ω30 + λ ω20 ′ = λ ∂hH1 i ∂I30 ′ ∂hH1 i ; ∂I20 ′ (11.147) ω10 ′ = λ ∂hH1 i ∂I10 ′ (11.148) Las frecuencias que en el movimiento no perturbado son nulas, en el perturbado pasan a ser “frecuencias lentas”, en tanto que las frecuencias no degeneradas son “frecuencias rápidas”. Ejemplo 11.4.2 Calcular las correcciones de segundo orden en el átomo de Hidrógeno clásico en un campo eléctrico uniforme (efecto Stark cuadrático). Si trabajamos con coordenadas parabólicas, H (0) y las frecuencias están dadas por (10.300) y (10.306). Entonces la ecuación (11.37) para la corrección de segundo orden de la energı́a toma la forma: H (2) (I) = 1 ∂ 2 H0 2 ∂I32 * ∂F (1) ∂ϕ03 2 + + ∂ω ∂F (1) . ∂I2 ∂ϕ02 + ∂ω ∂F (1) . ∂I3 ∂ϕ03 (11.149) y F (1) es solución a la ecuación: ω0 ∂F (1) + W (I, ϕ0 ) = 0 ∂ϕ03 (11.150) Teorı́a de perturbaciones / 501 siendo W igual a: 3 W = H1 − hH1 i = eEz − eEaβ (11.151) 2 Podrı́amos partir de la expresión para W en coordenadas parabólicas para calcular a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como en coordenadas parabólicas el promedio de eEz sobre las variables angulares es igual al promedio temporal, debido a que heEzit no contendrá variables angulares, podemos realizar inicialmeste los promedios temporales en coordenadas esféricas. Luego, antes de promediar sobre la otra variable angular pasamos de coordenadas esféricas a coordenadas parabólicas usando las ecuaciones (10.326) y (10.327). El resultado será el mismo que si se calculan los promedios temporales en coordenadas parabólicas. Finalmente, promediando sobre θ1 obtenemos a H (2) en coordenadas parabólicas. heEzit y eEz están dados por: heEzit = 3 eEaǫ cos θmı́n cos θ0 2 (11.152) eEz = eF a cos θmı́n −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ Por tanto W en coordenadas esféricas es: W = eF a cos θmı́n 1 × −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ 2 (11.153) La ecuación (11.150) toma la forma: ∂F (1) eF a = cos θmı́n 0 ∂ϕ3 2ω 0 h i × 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ (11.154) Usando la ecuación de Kepler se cumple: ∂F (1) ∂ψ ∂F (1) 2π ∂F (1) = = · · 0 0 ∂ϕ3 ∂ψ ∂ϕ3 ∂ψ 1 − ǫ cos ψ (11.155) por tanto tenemos que: ∂F (1) = ∂ψ h eF a cos θ 2(1 − ǫ2 )1/2 sen θ0 sen ψ mı́n 4πω 0 +ǫ cos θ0 + 2 cos θ0 cos ψ −2ǫ(1 − ǫ2 )1/2 sen θ0 sen ψ cos ψ −ǫ2 cos θ0 cos ψ − 2ǫ cos θ0 cos2 ψ (11.156) i 502 / Mecánica clásica avanzada Integrando respecto a ψ hallamos la siguiente expresión para F (1) , luego de omitir una constante de integración que no contribuirá a H (2) ya que W tiene media cero: F (1) = h eF a − 2(1 − ǫ2 )1/2 sen θ0 cos ψ cos θ mı́n 4πω 0 + cos θ0 sen ψ − ǫ(1 − ǫ2 )1/2 sen θ0 sen2 ψ −ǫ2 cos θ0 sen ψ − ǫ cos θ0 sen ψ cos ψ (11.157) i Esta función satisface el requisito de la teorı́a canónica de perturbaciones de ser una función periódica de θ1 y ϕξ , como puede verse fácilmente usando (10.328), (10.329), (10.341) a (10.345). Si quisiéramos aplicar la fórmula (11.149) directamente en coordenadas esféricas, deberı́amos haber tomado hH1 i = 0 lo cual darı́a lugar a la aparición en F (1) y ∂F (1) /∂ϕ02 de un término proporcional a ψ, que se incrementa linealmente con el tiempo (llamado secular); esto evidencia que la fórmula (11.36) sólo puede aplicarse en coordenadas en las cuales la perturbación sea “diagonal”, es decir, que no contenga variables angulares. Usando la propiedad: ∂F (1) ∂F (1) = − ∂ϕ02 ∂θ0 (11.158) Llegamos a la siguiente expresión para ∂F (1) /∂20 : ∂F (1) = ∂ϕ02 h eF a cos θmı́n 2(1 − ǫ2 )1/2 cos θ0 cos ψ 0 2ω +(2 − ǫ2 )sen θ0 sen ψ 2 1/2 +ǫ(1 − ǫ ) (11.159) 2 cos θ0 sen ψ −ǫ sen θ0 sen ψ cos ψ i Por otra parte, usando las siguientes relaciones: ∂ cos θmı́n = ∂I2 γ2 I3 (1 − ǫ2 )3/2 cos θmı́n ∂ǫ = ∂I2 −(1 − ǫ2 − γ 2 ) I3 (1 − ǫ2 )1/2 ǫ cos2 θmı́n ∂ψ = ∂I2 − I2 sen ψ I32 ǫ (1 − ǫ cos ψ) (11.160) Teorı́a de perturbaciones / 503 donde γ = I1 /I3 , obtenemos al hacer todos los cálculos: n h ∂W −eEa γ 2 ǫ cos θ0 = 2 3/2 ∂I2 2I3 (1 − ǫ ) cos θmı́n +2(1 − ǫ2 )1/2 sen θ0 sen ψ + 2 cos θ0 cos ψ i h +(1 − ǫ2 )(1 − ǫ2 − γ 2 ) − ǫ−1 cos θ0 + 2(1 − ǫ2 )−1/2 ×sen θ0 sen ψ − + (11.161) 2(1 − ǫ2 )1/2 ǫ−1 sen θ0 cos ψ sen ψ 1 − ǫ cos ψ 2ǫ−1 cos θ0 sen2 ψ io 1 − ǫ cos ψ Usando la siguiente relación: Z 2π 1 ∂W ∂F (1) ∂W ∂F (1) · · (1 − ǫ cos ψ) dψ = 0 ∂I2 ∂ϕ2 t 2π 0 ∂I2 ∂ϕ02 (11.162) obtenemos usando (11.159), (11.161) y (11.162) después de un cálculo largo pero directo: h (eEa)2 ∂W ∂F (1) (9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 ) . = − ∂I2 ∂ϕ02 t 16ω 0 I3 (1 − ǫ2 ) (11.163) i +(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0 Por otra parte podemos escribir los otros dos términos de la ecuación (11.149) ası́: * 2 + 1 ∂ 2 H0 ∂W ∂F (1) ∂F (1) · 2 ∂I32 ∂ϕ03 ∂I3 ∂ϕ03 t t 3ω 0 =− 2I3 =− 1 2ω 0 * W ω0 2 + 3 ∂ + I3 ∂I3 + t ∂W · ∂I3 −W ω0 (11.164) t hW 2 it De (10.268) se sigue que: 1 hW 2 it = (eE)2 a cos2 θmı́n (1 − ǫ2 + 5ǫ2 cos2 θ0 ) 2 (11.165) Con este resultado (11.164) puede escribirse como: − (eEa)2 [20(1 − ǫ2 ) + (4 + 10ǫ2 ) cos2 θ0 ] (1 − ǫ2 − γ 2 ) · 16I3 ω 0 1 − ǫ2 (11.166) 504 / Mecánica clásica avanzada Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos a: ∂W ∂F (1) · ∂I2 ∂ϕ02 t + ∂W ∂F (1) · ∂I3 ∂ϕ03 1 ∂ 2 H0 + 2 ∂I32 t * ∂F (1) ∂ϕ03 2 + t (11.167) 2 =− (eEa) [(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θmı́n cos2 θ0 ] 16I3 ω 0 Si ahora pasamos a coordenadas parabólicas mediante las ecuaciones (10.325), (10.341) a (10.345), llegamos a la siguiente expresión para el lado derecho de (11.167): (eEa)2 h − · 17 − 3β 2 − 9γ 2 16I3 ω 0 i p − 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1 (11.168) El promedio sobre la variable angular ϕ2 (θ1 = −ϕ2 ) nos conduce a la expresión final para H (2) : H (2) (I) = − (eEa)2 (17 − 3β 2 − 9γ 2 ) 16I3 ω 0 (11.169) que expresada en términos de las Iν es: H (2) (I) = − (eE)2 I 4 [17I 2 − 3(Iξ − Iη )2 − 9Iϕ2 )] 16m3 (Ze2 )4 (11.170) Este es el mismo resultado de Epstein en (1916) usando un método de aproximaciones sucesivas, expuesto por Born (Op. cit., p. 591). El método de aproximaciones descrito en la sección 11.2 puede también fallar cuando el sistema no perturbado no posee degeneración intrı́nseca pero ocurre que las frecuencias se tornan conmensurables para ciertas condiciones iniciales. Cuando esto ocurre se habla de degeneración accidental. En este sentido es incorrecta la distinción que algunos textos de mecánica cuántica hacen al referirse a la degeneración presente en los niveles de energı́a del átomo de hidrógeno respecto al número cuántico orbital l como “accidental”. En astronomı́a se presenta este tipo de degeneración, como en el caso del movimiento de algunos planetas menores (Aquiles, Patroclo, Héctor y Néstor) que tienen casi el mismo perı́odo de revolución que Júpiter. En la mayorı́a de los sistemas la degeneración accidental es más frecuente que la degeneración intrı́nseca. 11.5. Perturbaciones adiabáticas Perturbaciones pequeñas y perturbaciones lentas. Veamos la diferencia en una expansión de perturbaciones para perturbaciones pequeñas y para perturbaciones adiabáticas. En el primer caso hay un parámetro pequeño en el sistema determinado por la intensidad de la perturbación. El parámetro pequeño de una perturbación lenta está dado por la relación entre la frecuencia de la perturbación y las frecuencias Teorı́a de perturbaciones / 505 rápidas del sistema. Cuando el parámetro toma el valor cero, el sistema posee solamente oscilaciones rápidas, y a medida que aumenta el valor del parámetro, aparecen las contribuciones de las frecuencias lentas. Asumamos que el sistema posee sólo una frecuencia rápida y que el hamiltoniano se puede separar en la forma: H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt) (11.171) donde I y ϕ son las variables acción-ángulo del movimiento no perturbado (λ = 0) del grado de libertad rápido, y ~ y = (q, p) son las variables canónicas de los restantes grados de libertad, no necesariamente expresadas en variables acción-ángulo. Debido a que cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable. Construcción de invariantes adiabáticos canónicos. Para calcular el efecto de la perturbación buscamos una transformación canónica de (I, ϕ, ~y ) a (I, ϕ, ~y) tal que el nuevo hamiltoniano no dependa de la variable angular rápida ϕ. La función generatriz es de la forma: F = Iϕ + ~p~q + λF (1) I, ϕ, ~p, ~q, t + ... (11.172) y las fórmulas de transformación de primer orden son: I =I +λ ∂F (1) ; ∂ϕ (1) ∂F p~ = ~p + λ ; ∂~q ϕ=ϕ−λ ∂F (1) ∂I (11.173) (1) ∂F ~q = ~q − λ ∂~p (11.174) Ahora reemplazamos a (11.173) y (11.174) en (11.171) y expandimos al primer orden en λ para obtener: ∂F (1) H0 (I, λ~y , λt) = H0 I, λ~y, λt + λω ∂ϕ siendo ω = ∂H0 /∂I la frecuencia rápida. Con la transformación canónica el nuevo hamiltoniano total será: ∂F (1) I, ϕ, λ~y, λt H I, ϕ, λ~y, λt = H(I, ϕ, λ~y , λt) + λ ∂(λt) (11.175) (11.176) En esta expresión ahora retenemos sólo los términos de primer orden en λ: ∂F (1) H I, ϕ, λ~y , λt = H0 (I, λ~y , λt) + λω + λH1 I, ϕ, λ~y , λt ∂ϕ Al orden cero (11.177) nos da: H 0 I, λ~y , λt = H0 (I, λ~y , λt) (11.177) (11.178) y al primer orden: ∂F (1) + H1 I, ϕ, λ~y , λt H 1 I, ϕ, λ~y , λt = ω ∂ϕ (11.179) 506 / Mecánica clásica avanzada Como por definición la transformación canónica elimina en H la dependencia de ϕ, se debe cumplir que F (1) satisfaga la ecuación diferencial: ω ∂F (1) = −{H1 } ∂ϕ (11.180) En tanto que la energı́a al primer orden satisface la expresión: H I, λ~y, λt = H0 I, λ~y, λt + λhH1 i (11.181) donde {...} y h...i denotan aquı́ la parte oscilante y el promedio respectivamente, respecto a la variable angular ϕ. En (11.180) vemos que no hay complicaciones, como en (11.29) y (11.32), debidas a posibles resonancias entre ω y armónicos superiores de las frecuencias lentas. La ecuación (11.173) nos da los invariantes adiabáticos a orden cero en λ e I, y a primer orden en λ e I: I (I, ϕ, λ~y , λt) = I − λ ∂F (1) ∂ϕ (11.182) o equivalentemente: I =I+ λ {H1 } ω (11.183) Realmente cualquier función de I puede escogerse como un invariante adiabático. Mediante la construcción de un invariante adiabático, si existe, se reduce el sistema de l grados de libertad a l − 1 grados de libertad. Esto se logra al encontrar la transformación canónica que elimina en H la dependencia respecto a ϕ, con lo cual I queda como un parámetro constante. Si uno de los restantes l − 1 grados de libertad sufre una oscilación rápida en comparación a los demás grados de libertad, podemos introducir un segundo parámetro pequeño, transformar a variables acción-ángulo el grado de libertad rápido y hallar un segundo invariante adiabático. El proceso puede continuarse para obtener una secuencia de invariantes adiabáticos, hasta que el sistema es reducido a un grado de libertad, que puede integrarse para obtener el invariante final. Esto significa que todo sistema posee l invariantes adiabáticos aproximados obtenidos mediante promedios, ası́ no sea integrable (es decir que no posea l constantes de movimiento en involución). Ejemplo 11.5.1 Este ejemplo se refiere a un sistema hamiltoniano no autónomo de un grado de libertad, que por tanto posee un comportamiento análogo al de un sistema de dos grados de libertad. Se trata de un oscilador lineal sometido a una variación adiabática de sus parámetros: Ho.l. = 1 1 G(λt) p2 + F (λt) q 2 2 2 (11.184) Podemos hallar las variables acción ángulo mediante la función generatriz: 1/2 1 F q 2 tan ϕ (11.185) F1 = − 2 G Teorı́a de perturbaciones / 507 Entonces el hamiltoniano transformado toma la forma siguiente: H = ω0 I − λR′ I sen 2ϕ 2R (11.186) p √ donde R(λt) = F/G, ω0 (λt) = F G y la prima denota derivada respecto a λt. La ecuación (11.186) tiene ahora la forma (11.171) y podemos aplicar los resultados de la teorı́a de los adiabáticos canónicos. Al orden cero el invariante adiabático es: I= H0 = constante ω0 (11.187) La ecuación (11.183) nos da el invariante de primer orden: I = I (1 + λP sen 2ϕ) (11.188) donde P (λt) = −R′ /(2ω0 R). O sea que al primer orden I tiene una pequeña componente que oscila con una frecuencia el doble de la frecuencia rápida ω0 . De (11.188) se sigue: I˙ = λṖ I sen 2ϕ + 0(λ2 ) (11.189) Como Ṗ = λP ′ , vemos que efectivamente I˙ es del orden de λ2 , siendo I un invariante al primer orden. Veamos las posibles resonancias entre ω0 y los armónicos de las frecuencias asociadas a los cambios adiabáticos de los parámetros. Para ello expandamos a Ṗ en una serie de Fourier: X ′ Ṗ = λ an einω1 λt (11.190) n siendo ω1 λ la frecuencia de la oscilación lenta y ω1 /ω2 del orden de la unidad. Entonces, según (11.189) y (11.190), I˙ tendrá la siguiente expansión de Fourier: i I X′ h i(nω1 λt+2ϕ) I˙ = λ2 an e − ei(nω1 λt−2ϕ) 2i n (11.191) Ahora, integremos a I˙ sobre un perı́odo de la oscilación lenta. Esto nos dará: " λ2 X′ ∆I e2i(2πω0 /(λω1 )+ϕ0 ) − e2iϕ0 = an 2i n i(nω1 λ + 2ω0 ) I # e−2i(2πω0 /(λω1 )+ϕ0 ) − e−2iϕ0 (11.192) − i(nω1 λ − 2ω0 ) Vemos que ∆I/I será del orden de λ2 , a no ser que haya una conmensurabilidad entre las oscilaciones en t y en ϕ: s ω0 = (11.193) λω1 2 508 / Mecánica clásica avanzada donde s es un entero del orden de 1/λ. En este caso los términos con n = ±s en (11.192) serán constantes en t, y ∆I/I será del orden de λ: 2π ∆I ≈ λ|as | I ω1 (11.194) O sea que si la resonancia es mantenida por tiempos del orden de un perı́odo de la oscilación lenta, 2π/(λω1 ), el invariante de primer orden es destruido. 11.6. Sistema de osciladores lineales con acoplamiento no lineal Consideremos l osciladores lineales con frecuencias propias ω10 , ω20 , ...ωl0 acoplados anarmónicamente. El hamiltoniano es de la forma H = H0 + λH1 + λ2 H2 + ..., donde: X p2 1 ν (11.195) + m(ων0 )2 qν2 H0 = 2m 2 ν H1 = X aν qν3 + ν H2 = XX µ X bν qν4 + ν + ′ XXX µ XX µ ν aµν qµ2 qν + ν XXX µ ′ ′ ν ′ aµνλ qµ qν qλ (11.196) λ (bµν qµ2 qν2 + b′µν qµ3 qν ) ν bµνλ qµ2 qν qλ + XXXX µ λ ν λ (11.197) ′ bµνλρ qµ qν qλ qρ ρ donde µ, ν, λ y ρ varı́an entre 1 y l. Los coeficientes a y b presentan en sus ı́ndices las mismas propiedades de simetrı́a que los productos de los qν que multiplican. La prima en la sumatoria significa que se omiten los términos con ı́ndices iguales. Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no degeneradas. En las variables acción-ángulo (ϕ0 , I 0 ), H0 es: H0 = l X ων0 Iν0 (11.198) ν=1 H1 y H2 en función de (ω 0 , I 0 ) se obtienen sustituyendo: qν = Qν sen ϕν ; Qν = 2Iν0 mων0 1/2 ; ϕν = ϕ0ν (11.199) Como en H1 sólo entran productos de sen ϕν un número impar de veces, se sigue que: H (1) = hH1 i = 0 (11.200) Teorı́a de perturbaciones / 509 Para hallar a H (2) aplicamos la fórmula (11.40), lo cual requiere hallar los coeficientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la identidad trigonométrica: 4 sen α sen β sen γ = −sen (α + β + γ) + sen (−α + β + γ) (11.201) +sen (α − β + γ) + sen (α + β − γ) la cual nos da: 1X aν Q3ν [−sen (3ϕν ) + 3sen ϕν ] 4 ν H1 = + 1X aµν Q2µ Qν [−sen (2ϕµ + ϕν ) 4 µν +2 sen ϕν + sen (2ϕµ − ϕν )] + (11.202) 1X aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ ) 4 µνλ +3 sen (ϕµ + ϕν − ϕλ )] La ecuación (11.202) tiene la forma de una serie de Fourier seno: X H1 = B~n sen (~n · ϕ ~) (11.203) ~ n donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto: 1X 3 aµν Q2µ Qν B1ν = aν Q3ν + 4 2 µ (11.204) 1 B3ν = − aν Q3ν 4 (11.205) 1 νµ B21 = − aνµ Q2ν Qµ 4 (11.206) µν B2−1 = 1 aνµ Q2ν Qµ 4 3 νµλ B111 = − aνµλ Qν Qµ Qλ 2 νµλ B11−1 = 3 aνµλ Qν Qµ Qλ 2 (11.207) (11.208) (11.209) En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n están relacionadas con los B~n por: A~n = B~n − B−~n 2i (11.210) 510 / Mecánica clásica avanzada entonces: |A~n |2 = 1 (B~n − B−~n )2 4 (11.211) con lo cual los |A~n |2 diferentes de cero son: 1 |Aν1 |2 = Cν = 64 3aν Q3ν + 2 X aµν Q2µ Qν µ ! (11.212) 1 2 6 a Q 64 ν ν |Aν3 |2 = Cν′ = 2 |Aνµ 21 | = Cνµ = (11.213) 1 2 4 2 a Q Q 64 νµ ν µ (11.214) 9 2 a Q2 Q2 Q2 16 νµλ ν µ λ 2 |Aνµλ 111 | = Cνµλ = (11.215) luego (11.40) toma la forma: 1XX 3X bν Q4ν + bνµ Q2ν Q2µ 8 ν 4 ν µ H (2) = − X 1 ∂ (Cν + Cν′ ) 0 ∂I ω ν ν ν − − XX ν µ 2 0 ∂Cνµ 0 ∂Cνµ − ω 4ω µ ν 4(ων0 )2 − (ωµ0 )2 ∂Iν ∂Iµ XXX ν µ λ (11.216) ∂Cνµλ 1 ων0 + ωµ0 + ωλ0 ∂Iν 1 + 0 ων + ωµ0 − ωλ0 ∂Cνµλ ∂Cνµλ ∂Cνµλ + − ∂Iµ ∂Iµ ∂Iλ Según (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las Iν , de modo que todos los términos de H (2) son cuadráticos en las Iν . La energı́a total tiene entonces la siguiente dependencia de las variables de acción: X 1 XX 0 ω Iν Iµ (11.217) H(I) = ων0 Iν + 2 ν µ νµ ν Es claro que la condición de inconmensurabilidad de las frecuencias queda reducida a excluir los casos: 2ων0 = ωµ0 ; ων0 + ωµ0 = ωλ0 para todos los valores de ν, µ, λ. (11.218) Teorı́a de perturbaciones / 511 Ejemplo 11.6.1 Aplicar la teorı́a de perturbaciones de estados degenerados al sistema construido por dos osciladores lineales con frecuencias conmensurables, sometidos a una perturbación anarmónica del tipo (11.196). Las trayectorias en el espacio de configuración para el movimiento no perturbado son las figuras de Lissajous. H0 es: H0 = 1 2 px + p2y + m(ωx0 )2 x2 + m(ωy0 )2 y 2 2m (11.219) donde rωx0 = sωy0 , siendo r y s enteros. La perturbación es de la forma: H1 = ax x3 + ay y 3 + axy x2 y + ayx y 2 x (11.220) La solución al movimiento no perturbado en variables acción-ángulo está dada por (11.198) y (11.199). Para tratar la degeneración es conveniente separar la frecuencia no degenerada mediante una transformación canónica de la forma (11.89), que para este caso es: ϕ01 = ϕ′x ; ϕ02 = −rϕ′x + sϕ′y Ix′ = I10 − rI20 ; Iy′ = sI20 (11.221) (11.222) donde las primas denotan las variables de acción originales. H0 en términos de las I 0 es: H0 (I 0 ) = ω10 I10 (11.223) donde las frecuencias están dadas por: ω10 = ωx0 ; ω20 = 0 (11.224) La solución al movimiento no perturbado es: x= 2(I10 − rI20 ) mω10 y= 2s2 I20 rmω10 1/2 1/2 sen ϕ01 (11.225) (rϕ01 + ϕ02 ) sen s El promedio de H1 sobre un ciclo de la variable angular ϕ01 es: 1/2 s I10 − rI20 2I20 ϕ0 = − axy sen 2 δr,2s 0 0 2 mω1 rmω1 s 1/2 2s2 I20 I10 − rI20 ϕ0 sen 2 2 δs,2r 0 0 rmω1 mω1 s hH1 (I10 , I20 , ϕ02 )i 1 + ayx 2 (11.226) 512 / Mecánica clásica avanzada Si r 6= 2s o s 6= 2r el procedimiento falla porque hH1 i = 0, pero el resultado (11.218) es válido en ese caso, mostrando que sólo hay correcciones de orden superior al primero. Para precisar asumamos que 2ωx0 = ωy0 . Entonces: q 0 −axy 0 0 I2 sen ϕ02 hH1 (I10 , I20 , ϕ02 )i = I − 2I (11.227) 1 2 2(mω10 )3/2 La ecuación de Hamilton-Jacobi para este problema es: q A x C=− x3 − I10 + C = 0 ; x = I20 ; 2 sen ϕ02 Las raı́ces dependen del signo del discriminante: 0 3 0 3 2 I1 I A2 C =− 1 D= − + + 6 2 6 4 sen2 ϕ02 (11.228) (11.229) que depende esencialmente de la magnitud de H (1) , o sea de la energı́a. Si D > 0, una raı́z es real y dos son complejo conjugadas. Si D = 0, todas las raı́ces son reales, siendo dos de ellas iguales entre sı́; esto ocurre para valores de H (1) (I) y ϕ02 bien determinados. Si D < 0, todas las raı́ces son reales y diferentes entre sı́. Para D > 0, la raı́z real es: 3/2 2/3 I10 C √ C √ 0 + (11.230) I2 = + − + D + D 3 2 2 Cuando D = 0 las raı́ces son: I10 I10 I0 ; I20 = 2 1 ; 3 6 6 Cuando D < 0 las raı́ces son: I10 2θ I10 2θ 2π 0 I2 = 1 + cos ; 1 + cos + 3 3 3 3 3 I10 2θ 4π 1 + cos + 3 3 3 (11.231) (11.232) donde cos θ = (6/I10 )3/2 C/2. La figura 11.1 muestra el comportamiento de las raı́ces reales en función de C −1 . CT es el valor de C para el cual D = 0, que ocurre cuando: 0 3/2 0 3/2 I (1) ′ (mω1 ) =2 1 (11.233) −C = H (I ) axy sen ϕ02 6 √ Para A muy grande tenemos que D ≈ C/2. En ese caso se cumple que: I20 ≈ C 2/3 = A2/3 (sen ϕ02 )−2/3 ; A2 ≫ (I10 )3 (11.234) De (11.108) vemos que I20 ′ es igual al valor medio de I20 sobre un perı́odo de ϕ02 . Entonces: H (1) (I ′ ) = axy (I20 ′ )3/2 0 3/2 (mω1 ) h(sen ϕ02 )−2/3 i3/2 (11.235) Teorı́a de perturbaciones / 513 I 20/ 3 2 I 10 / 3 I 10/ 3 1/CT 1/C Figura 11.1 Raı́ces reales en función de C −1 11.7. Movimiento cerca de una resonancia aislada Para precisar, sea un sistema de dos grados de libertad sometido a una perturbación pequeña. Si se presenta una resonancia entre las frecuencias no perturbadas: r ω2 = ω1 s (11.236) entonces debemos usar la teorı́a de perturbaciones de sistemas degenerados. Primero realizamos una transformación canónica del tipo (11.88) para aislar una de las frecuencias. Una función generatriz adecuada es: F2 = (rϕ1 − sϕ2 )I 1 + ϕ2 I 2 (11.237) que da lugar a las fórmulas de transformación: I1 = rI 1 ; I2 = I 2 − sI 1 ϕ1 = rϕ1 − sϕ2 ; ϕ2 = ϕ2 (11.238) (11.239) Cuando se aplica la perturbación, como vimos en el efecto Stark lineal, ϕ̇1 pasa a ser una frecuencia lenta y ϕ̇2 es una frecuencia rápida. Si en la expansión de Fourier de H1 en las variables acción-ángulo iniciales, (I, ϕ), efectuamos la transformación (11.238) y (11.239), obtenemos: H1 = XX l m Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r (11.240) 514 / Mecánica clásica avanzada Ahora, en vez de “diagonalizar” a H1 como en la sección 11.4, podemos usar la teorı́a de las perturbaciones adiabáticas teniendo en cuenta que en resonancia, ϕ̇2 ≫ ϕ̇1 . La fórmula (11.181) nos da para este caso: H = H 0 (I) + λhH 1 i (11.241) donde hH 1 i es el promedio sobre ϕ2 . Como el promedio da lugar al factor δm,−sp : X (11.242) hH 1 i = H−pr,ps (I)e−ipϕ1 p Como H no depende de ϕ2 , se cumple que I 2 = constante = I 20 . Notemos que I 2 = I2 + (s/r)I1 ; por tanto la resonancia modifica sustancialmente las constantes de movimiento. Si s ≫ r, I 2 es simplemente un múltiplo de I1 , o sea que la modificación más importante ocurre para las resonancias con s pequeños. Con I 2 constante, el movimiento en el plano I 1 − ϕ1 es el de un sistema de un grado de libertad, que es integrable. Chirikov5 ha mostrado que para cualquier sistema ese movimiento es aproximadamente como el de un péndulo o como el de un oscilador armónico, según la degeneración sea accidental o intrı́nseca. Como el movimiento no perturbado es degenerado, en la superficie de sección I 1 −ϕ1 , con ϕ2 = constante, habrán s puntos formando una circunferencia de radio I 1 (ver sección 10.2). Para λ 6= 0 la perturbación altera el toroide y las intersecciones de la trayectoria con la superficie de sección modificando por tanto las soluciones periódicas. Si existen, los puntos fijos sobre la superficie de sección, que llamaremos P0 (I 10 , ϕ10 ), son solución al sistema de ecuaciones: ∂H ∂I 1 = 0; P0 ∂H ∂ϕ1 =0 (11.243) P0 que representan las soluciones periódicas para el hamiltoniano perturbado. Cuando λ = 0, todas las soluciones son periódicas, pero para λ 6= 0 sólo quedan las soluciones periódicas dadas por (11.243). Las amplitudes de Fourier en (11.242) generalmente decaen cuando p aumenta. Entonces podemos describir el movimiento en las variables integrables (I 1 − ϕ1 ) usando solamente los términos con p = 0, ±1: H = H 0 (I) + λH00 (I) + 2λHr,−s (I) cos ϕ1 (11.244) notando que los coeficientes con p = 1 y p = −1 sólo difieren en la fase, de modo que puede hacerse H−r,s = Hr,−s con la simple adición a ϕ1 de una constante. Las fórmulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la localización de los puntos fijos: ∂H00 (I) Hr,−s (I) ∂H 0 (I) +λ + 2λ cos ϕ10 = 0 ∂I 10 ∂I 10 ∂I 10 2λHr,−s (I) sen ϕ10 = 0 5 Chirikov, B.V., 1979, en Physics Reports, pp. 265-379. (11.245) Teorı́a de perturbaciones / 515 Entonces los puntos fijos están localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 está determinado por: Hr,−s ∂H00 ±2 =0 ∂I 10 ∂I 10 (11.246) Para puntos de la superficie de sección diferentes a los puntos fijos, se cumple que: I˙ 1 = −2λHr,−s sen ϕ1 ϕ̇1 = (11.247) ∂H00 ∂Hr,−s ∂H 0 +λ + 2λ cos ϕ1 ∂I 1 ∂I 1 ∂I 1 (11.248) O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de λ. En cuanto a ϕ1 , el comportamiento es diferente según la degeneración sea accidental o intrı́nseca. Si la degeneración es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneración es intrı́nseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y las oscilaciones de ϕ1 son del orden de λ. Degeneración accidental. En este caso I 1 permanece en las cercanı́as del punto fijo, pero ϕ1 puede alejarse del mismo. Entonces podemos escribir: I 1 = I 10 + ∆I 1 (11.249) Esto nos permite expandir a H(I) en las cercanı́as de I 10 . Para ello usamos en (11.244) las expresiones: H 0 (I) = H 0 (I 0 ) + ∂H 0 1 ∂2H 0 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10 (11.250) H00 (I) = H00 (I 0 ) + ∂H00 1 ∂ 2 H00 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10 (11.251) Hrs (I) = Hrs (I 0 ) + ∂Hrs 1 ∂ 2 Hrs (∆I 1 )2 + ... ∆I 1 + 2 ∂I 2 ∂I 10 10 (11.252) Reteniendo los términos de orden más bajo en λ y ∆I 1 obtenemos: ∆H = H − H 0 (I 0 ) − λH00 (I 0 ) = 1 ∂2H 0 (∆I 1 )2 + 2λHr,−s cos ϕ1 2 ∂I 2 10 (11.253) ∆H describe el movimiento en las cercanı́as de la resonancia, y puede escribirse como: ∆H = 1 G(∆I 1 )2 − F cos ϕ1 2 (11.254) 516 / Mecánica clásica avanzada donde: G(I 0 ) = ∂ 2H 0 2 ∂I 10 ; F (I 0 ) = −2λHr,−s (I 0 ) (11.255) Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para cualquier sistema, es aproximadamente similar al de un péndulo (el diagrama de fases presenta rotación, separatriz y vibración, ver ejemplo 10.3.2). Si GF > 0, el punto fijo estable está en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π. La frecuencia del movimiento en I 1 − ϕ1 para la libración cerca al punto estable es baja: !1/2 2 √ ∂ H 0 ω1 = F G = λ1/2 −2Hr,−s · (11.256) 2 ∂I 10 y, según la fórmula (10.104), se hace cero en la separatriz. El máximo desplazamiento en ∆I 1 está dado en la mitad de la separatriz y vale: 1/2 r −2H F r,−s (11.257) = λ1/2 2 máx ∆I 1 = 2 G ∂ H0 2 ∂I 10 Degeneración intrı́nseca. En este caso, de (11.247) y (11.248), se sigue que tanto I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0. En las proximidades del punto elı́ptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto: 1 cos ϕ1 = 1 − (∆ϕ1 )2 + ... ; ϕ1 ≈ 0 (11.258) 2 En las proximidades del punto hiperbólico ϕ10 = π (o ϕ10 = −π) escribimos ϕ1 = ±π + ∆ϕ1 y por lo tanto: 1 cos ϕ1 = −1 + (∆ϕ1 )2 + ... ; 2 ϕ1 ≈ ±π (11.259) En este caso ∆H en vez de (11.254) toma la forma: ∆H = 1 1 G(∆I 1 )2 + F (∆ϕ1 )2 2 2 (11.260) donde: G= ∂2H 0 2 ∂I 10 +λ ∂ 2 H00 2 ∂I 10 +λ ∂ 2 Hr,−s (11.261) 2 ∂I 10 F = ∓2λHr,−s (11.262) 2 Como para degeneración intrı́nseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del orden de λ. Cerca del punto fijo elı́ptico la frecuencia de oscilación es: " !#1/2 √ ∂ 2 H00 ∂ 2 Hr,−s ω1 = F G = λ −2Hr,−s (11.263) + 2 2 ∂I 10 ∂I 10 Teorı́a de perturbaciones / 517 y la relación de semiejes de la elipse es: ∆I = ∆ϕ1 r 1/2 F −2Hr,−s = 2 G ∂ (H00 + Hr,−s ) (11.264) 2 ∂I 10 Cerca del punto fijo hiperbólico no hay oscilaciones. Las órbitas no son elı́pticas sino hiperbólicas, siendo el ángulo entre las ası́ntotas: r F (11.265) tan χ = G Vemos que no hay gran diferencia cualitativa entre las trayectorias de fase en los casos con degeneración intrı́nseca y accidental, sólo que en el segundo caso las oscilaciones en ∆I 1 tienen amplitud muy pequeña en comparación con las de ϕ1 . Lo anterior suponiendo que G 6= 0. Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal del ejemplo 11.6.1. En este caso la degeneración es intrı́nseca, con r = 2, s = 1. H1 está dado por (11.227), de modo que, reemplazando sen ϕ02 por cos ϕ02 y haciendo λ = axy : hH1 i = −1 (I 0 − 2I20 )(I20 )1/2 cos ϕ02 2(mω10 )3/2 1 (11.266) Entonces: 2H2,−1 = −1 (I 0 − 2I20 )(I20 )1/2 2(mω10 )3/2 1 (11.267) en tanto que H0 (I0 ) = ω10 I10 . Por tanto: 2 ∂ 2 H2,−1 2 ∂I 20 = i h 1 −3/2 −1/2 I (I ) + 6(I ) 10 20 20 2(mω10 )3/2 (11.268) En cercanı́as del punto elı́ptico F y G serán: F = λ (I 10 − 2I 20 )(I 20 )1/2 (mω10 )3/2 (11.269) G= h i λ −3/2 −1/2 I (I ) + 6(I ) 10 20 20 4(mω10 )3/2 (11.270) ω1 será: ω1 = 1/2 λ (I 10 − 2I 20 )(I 10 + 6I 20 ) 2(mω10 )3/2 I 20 (11.271) 518 / Mecánica clásica avanzada Libración Rotación Resonancia: Separatriz I20 = I20 ϕ02 = ϕ20 I20 ϕ20 λ=0 Punto hiperbólico a Punto elíptico b Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal. Superficie de sección I20 − ϕ02 . La relación entre las oscilaciones máximas en I20 y ϕ02 está dada por: 1/2 ∆I20 = 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 ) 0 ∆ϕ2 (11.272) La figura 11.2 muestra la superficie de sección I20 − ϕ02 , en coordenadas polares, con y sin perturbación. Resonancias de orden superior. Si λ no es demasiado pequeña, el hamiltoniano (11.240) puede dar lugar a contribuciones seculares que modifiquen o destruyan el invariante adiabático I 2 . Tales resonancias son entre armónicos de la oscilación pendular I 1 − ϕ1 , de frecuencia ω1 , y la frecuencia fundamental ω2 . En el lı́mite adiabático esas resonancias dan lugar a cadenas de “islas”, o sea, a movimientos pendulares alrededor de los puntos fijos en el plano J1 − χ1 de las variables acción-ángulo del movimiento pendular I 1 − ϕ1 [ver ecuaciones (10.99) y (10.100)]. Nuevamente se debe efectuar una transformación canónica que elimine la frecuencia degenerada, o sea, pasar a las variables angulares χ1 y χ2 dadas por χ1 = pχ1 − qϕ2 ; χ2 = ϕ2 , donde p y q son los números enteros de la resonancia de segundo orden. El paso siguiente consiste en encontrar los parámetros que describen el movimiento pendular alrededor de los puntos fijos de J1 − χ1 . El hamiltoniano que describe la resonancia primaria es de la forma (11.254) o (11.260), que en las cercanı́as del punto elı́ptico se comportan similarmente, y para pequeñas libraciones puede expandirse, de acuerdo con la ecuación (10.105), en la forma: 1 λGJ12 + ... (11.273) 16 donde J1 y χ1 son las variables acción-ángulo del movimiento pendular en el plano ∆I 1 − ϕ1 alrededor de un punto elı́ptico, dadas en el ejemplo 10.3.2. Si el movimiento K0 (J1 , J2 ) = H 0 (I 10 , J2 ) + ω1 J1 − Teorı́a de perturbaciones / 519 es “exactamente” pendular, J1 es constante. Cuando hay resonancias secundarias, el movimiento en el plano ∆I 1 − ϕ1 no es exactamente pendular, sino como el mostrado en la figura 11.3, que muestra la cadena de islas asociada a la resonancia cuando 5ω1 = ω2 , donde ω1 = χ̇1 . A la resonancia secundaria le corresponden cinco puntos fijos elı́pticos, en cada uno de los cuales es generado un movimiento pendular secundario. ∆I1 cos ϕ1 J1 sen χ1 ∆I1 cos ϕ1 a b Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas de libración; b. Cadena de islas formadas en la resonancia secundaria. En la figura 11.3a, aparecen las separatrices y las curvas de libración. Las lı́neas punteadas corresponden a la resonancia primaria y las lı́neas continuas corresponden a las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las “islas” de la resonancia secundaria a variables acción-ángulo. En un paso siguiente, uno podrı́a transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de la figura 11.2b. Para tener en cuenta la forma como una resonancia secundaria modifica la solución, ′ reintroducimos los términos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a (11.242): ′ H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i (11.274) que tiene la expansión de Fourier: ′ H 1 (I, ϕ) = XX l ′ H lm (I)eilϕ1 /r+i(ls+mr)ϕ2 /r (11.275) m donde la prima indica que se suprimen los términos d.c. en ϕ2 , ls + mr = 0. En las cercanı́as del punto elı́ptico ϕ10 = 0: ′ H1 = XX l m ′ H lm (I 10 + ∆I 1 , I 2 )eil∆ϕ1 /r+i(ls+mr)ϕ2 /r (11.276) 520 / Mecánica clásica avanzada Ahora transformemos esta expresión a variables acción-ángulo, mediante la fórmula: ∆ϕ1 = 2J1 R 1/2 sen χ1 ; R= F R 1/2 (11.277) Si estamos en las cercanı́as de punto elı́ptico, con movimiento de libración, ∆I 1 y ∆ϕ1 son pequeñas, por lo que J1 /R ha de ser pequeño. Entonces (11.276) al orden más bajo en ∆I 1 y ∆ϕ1 nos da para el nuevo hamiltoniano, tomando χ2 = ϕ2 y J2 = I 2 : √ XX i(l/r) 2J1 /R sen χ1 +i(ls/r+m)χ2 ′ K1 = (11.278) H lm (I 10 , J2 )e l m Usando la fórmula: eix sen θ = ∞ X Jn (x) einθ (11.279) n=−∞ donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como: XXX ′ (11.280) K1 = Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2 l donde: m n " 1/2 # l 2J1 Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn r R (11.281) En (11.280) resulta claro que pueden existir resonancias entre χ1 y χ2 cuando: ls χ̇2 r+m √ √ o sea, cuando ω 1 = χ̇1 = F G = 0( λ) y ω 2 = 0(1) son conmensurables, nχ̇1 = − p ω2 = ; ω1 q p, q : enteros (11.282) (11.283) Resulta ahora que la frecuencia χ̇1 = pχ̇1 − q χ̇2 es mucho menor que χ̇2 . Entonces χ̇2 puede ser eliminada con una transformación canónica mediante: F2 = (pχ1 − qχ2 )J 1 + χ2 J 2 lo cual nos da para para K 1 : XXX ′ K1 = Γlmn ei[nχ1 +p(nq+p(ls/r+m))χ2 ]/p l m (11.284) (11.285) n Ahora la variable angular χ2 puede ser eliminada mediante una transformación canónica adecuada, que equivale a promediar sobre χ2 . Introduciendo un nuevo parámetro pequeño λ1 , (11.273) y (11.285) nos conducen a: K = K 0 (J 1 , J 2 ) + λ1 K 1 (J 1 , J 2 , χ1 ) (11.286) Teorı́a de perturbaciones / 521 en K 1 sólo aparecen los términos con n dados por: ls +m =0 nq + p r (11.287) siendo nq, ls/r y mp enteros. Esto equivale a dejar en (11.280) sólo los términos con: nχ1 + ls + mr χ2 = −jpχ1 + (ks + jq − ks)χ2 = j(qχ2 − pχ1 ) r (11.288) o sea, con: l = k ; m = jq − ks ; j, k : enteros r Entonces la expansión (11.280) toma la forma: X K−jp,jq e−ijχ1 K1 = n = −jp ; (11.289) (11.290) j donde: K−jp,jq = X Γkr,jq−ks,−jp (11.291) k Ahora, como K no depende de χ2 , J 2 es constante: q J 2 = J2 + J1 = constante p (11.292) que es el invariante adiabático para las oscilaciones que dan lugar a las “islas”. El movimiento en J 1 − χ1 es integrable, siendo las oscilaciones de ∆J 1 y χ1 alrededor del punto fijo elı́ptico, como en (11.254), de forma pendular y por tanto aplicables los resultados para este tipo de movimiento. Como K 1 proviene de la parte oscilante de H 1 , el armónico más bajo en (11.290) se obtiene para j = ±1. Asumamos que q = 1, que corresponde a la resonancia con el fundamental de la oscilación χ2 = ϕ2 . Entonces el coeficiente de Fourier del término dominante en (11.290) es: ! r X l 2J1 H kr,±1−ks J−p (11.293) K−p,±1 = r R k p o sea, proporcional a Jp [(l/r) 2J1 /R]. De (11.256) se sigue que ω1 = 0(λ)1/2 y de (11.283) que ω2 = pω1 . Como ω2 = O(1), se cumple que p espun entero del orden de λ−1/2 . De (11.257) se sigue que máx ∆I 1 = 2R, por lo tanto 2J1 /R es del orden de la unidad. El desarrollo asintótico de Jn (x) para n grande es: x n (11.294) Jn (x) ≈ (2πn)1/2 en 2n como λ es pequeño, p es grande y podemos escribir: ! !p r r 2J1 l 2J1 l −1/2 p Jp ≈ (2πp) e r R 2rp R h √ √ i (11.295) = O (e λ)1/ λ 522 / Mecánica clásica avanzada lo cual nos muestra la pequeñez del término dominante en K 1 . F , el término de interacción en el movimiento pendular secundario es, de acuerdo con (11.255), proporcional a Kp,±1 , o sea a Jp . De (11.256) se sigue que las oscilaciones pendulares en las “islas” es muy baja, en tanto que de (11.257) se concluye que la amplitud de las oscilaciones √ 1/(2√λ) 1/(4√λ) √ J1 , que son muy pequeñas y además “islas” es proporcional a λ1 (e λ) decrecen rápidamente cuando J1 decrece. Para λ pequeño, las oscilaciones “islas” son despreciables, pero para λ relativamente grande, se sigue de (11.295) que pueden llegar a ser importantes, incluso comparables a las de la resonancia primaria. La rápida reducción del tamaño de las cadenas de “islas” de orden superior cerca a los puntos fijos nos indica que dichos puntos son relativamente estables cuando las perturbaciones no son muy grandes. Pero para perturbaciones grandes aparecerán muchos nuevos puntos fijos elı́pticos y cadenas de “islas” de orden superior de tamaño apreciable, ası́ como frecuencias de libración, que alteran drásticamente los invariantes adiabáticos o sea los toroides invariantes. 11.8. Movimientos regulares e irregulares Se denomina irregular, caótico o estocástico al movimiento de un sistema de varios grados de libertad en que por aumento de una perturbación desaparecen constantes de movimiento uniformes, alterando la topologı́a de los toroides invariantes. El teorema de Kolmogorov, Arnold y Moser establece que para perturbaciones suficientemente pequeñas existen aún toroides invariantes (movimientos regulares), si el sistema satisface ciertas condiciones. La existencia de toroides invariantes usualmente se cuantifica por medio de la medida de la región del espacio fásico ocupada por toroides invariantes. La estocasticidad global se presenta cuando la región ocupada por toroides invariantes tiene una medida suficientemente pequeña, o sea que el movimiento esencialmente es caótico, y se puede caracterizar por el valor del parámetro de perturbación. Aplicaciones de una superficie de sección en sı́ misma. Sobre el toroide invariante de un sistema de dos grados de libertad, el movimiento puede ser parametrizado por las variables angulares ϕ1 , ϕ2 , o por el tiempo, ası́: ϕ1 = ω1 t + ϕ10 ; ϕ2 = ω2 t + ϕ20 (11.296) Como ω1 y ω2 son funciones de las variables de acción I1 , I2 , que para un sistema integrable son constantes de movimiento uniformes, se sigue entonces que la razón entre ω1 y ω2 es igualmente una constante: ~ = α(I) ~ ω1 (I) ~ ω2 (I) (11.297) Para α = r/s, con r y s números enteros, ω1 y ω2 son conmensurables y el movimiento degenera en una curva bidimensional, que se repite después de r giros en ϕ1 y s giros en ϕ2 . Como r y s pueden ser grandes, y entre cualquier par de números racionales siempre hay muchos racionales, se sigue que las órbitas periódicas son arbitrariamente próximas entre sı́ en el espacio fásico. Teorı́a de perturbaciones / 523 El concepto de movimiento sobre un toro puede generalizarse a más de dos grados de libertad. Si se toma t = 0 cuando la trayectoria cruza la superficie de sección en el punto x0 , en t = 2π/ω2 cruzará en el punto x1 , en t = 4π/ω2 cruzará en x2 y ası́ sucesivamente. Entre dos intersecciones consecutivas ϕ1 avanza por ω1 ∆t = 2πα, donde α es el número r/s. Como la energı́a E es función de I1 e I2 , para E fija, α puede asumirse función de I1 solamente. Los puntos de las sucesivas intersecciones con la superficie de sección están relacionados entre sı́ mediante cierto mapeo o aplicación discreta, llamada aplicación canónica. Llamando x al conjunto (I, ϕ): xn+1 = C(xn ) (11.298) o explı́citamente: x1,n+1 = I1,n ; ϕ1,n+1 = ϕ1,n + 2πα(I1,n+1 ) (11.299) donde escribimos a α como una función de I1,n+1 . La anterior es la aplicación “twist”, que aplica cı́rculos en cı́rculos, pero con un número de rotación α que en general depende del radio. La figura 11.4 muestra la aplicación para α irracional (lı́neas continuas) y para α racional (lı́neas a trazos) con s = 6. Trayectoria de fases Puntos fijos con r entero y s = 6 I1 x0 x1 ϕ1 I2 x2 ϕ2 ϕ2 = constante a α irracional b Figura 11.4 Toroide invariante de un sistema de dos grados de libertad ϕ1 y ϕ2 . A la izquierda, curva bidimensional que se repite después de r giros en ϕ1 y s giros en ϕ2 . Al lado derecho, mapa de Poincaré formado por puntos xi donde la trayectoria cruza la superficie de sección. Directamente de (11.299) se sigue que: I1,n+1 , ϕ1,n+1 =1 J I1,n , ϕ1,n (11.300) o sea que la aplicación transforma una región arbitraria de la superficie de sección en otra conservando el área. 524 / Mecánica clásica avanzada Lo anterior es válido para sistemas integrables. Si este sistema es perturbado ligeramente, el hamiltoniano será ahora función de los ángulos: ~ ϕ ~ + λH1 (I, ~ ϕ H(I, ~ ) = H0 (I) ~) (11.301) En la superficie de sección I1 − ϕ1 definida por ϕ2 = constante (módulo 2π), esperamos que la aplicación “twist” cambie en una aplicación “twist” perturbada: In+1 = In + λf (In+1 , ϕn ) (11.302) ϕn+1 = ϕn + 2πα(In+1 ) + λg(In+1 , ϕn ) donde se ha omitido el subı́ndice 1. f y g son funciones periódicas de ϕn . Como la transformación de n a n + 1 es generada por las ecuaciones de Hamilton, la aplicación (11.302) debe conservar el área. Esta aplicación puede tomarse como una transformación canónica con función generatriz: F2 (In+1 , ϕn ) = In+1 ϕn + 2πA(In+1 ) + λB(In+1 , ϕn ) (11.303) donde: α= ∂A ; ∂In+1 f =− ∂B ; ∂ϕn g= ∂B ∂In+1 (11.304) La condición de conservación del área (11.300) implica ahora que: ∂f ∂g + =0 ∂In+1 ∂ϕn (11.305) Cuando f no depende de I y g = 0, entonces de (11.302) se obtiene la aplicación “twist” radial perturbada: In+1 = In + λf (ϕn ) ϕn+1 = ϕn + 2πα(In+1 ) (11.306) Cuando f = sen ϕn esta aplicación se llama la aplicación estándar (o aplicación de Chirikov). Una involución C = i es una aplicación canónica tal que al repetirse dos veces reproduce las condiciones iniciales. Entonces: xn+2 = i(xn−1 ) = i2 (xn ) = xn (11.307) La aplicación “twist” radial es un producto de involuciones si f (−ϕ) = −f (ϕ). Las dos involuciones que dan lugar a la aplicación “twist” radial son: I = In + f (ϕ)n ; ϕ = −ϕn (11.308) ϕn+1 = −ϕ + 2πα(I) (11.309) y, In+1 = I ; La factorización en involuciones ayuda a determinar los puntos fijos, pues los puntos fijos de las involuciones son de perı́odo 1. Por ejemplo, (11.308) tiene los puntos fijos Teorı́a de perturbaciones / 525 dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )− 2πm con m entero. A partir de las ecuaciones de Hamilton podemos hallar la correspondiente aplicación sobre una superficie de sección. Las ecuaciones de Hamilton del hamiltoniano (11.301) son: dIi ∂H1 ; = −λ dt ∂ϕi dϕi ∂H1 ∂H0 +λ = dt ∂Ii ∂Ii (11.310) La ecuación para I1 sobre la superficie de sección ϕ2 = constante = ϕ20 , entre la n y la n + 1-ésima iteración, es: ∂H1 dI1 (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) = −λ dt ∂ϕ1 (11.311) donde I2 , ω1 y ω2 son funciones de In+1 . En la n-ésima iteración en (11.311) t = 0 y en la n + 1-ésima iteración t = T2 . Luego el salto en la acción I1 en una iteración es: Z T ∂H1 ∆I1 = −λ dt (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.312) ∂ϕ1 0 Entonces de (11.302) se sigue que: λf (In+1 , ϕn ) = ∆I1 (In+1 , ϕn+1 ) (11.313) La función g que define el cambio en ϕn se obtiene de la condición de conservación del área, (11.305): Z ϕ ∂f g(I, ϕ) = − dϕ (11.314) ∂I El problema inverso consiste en hallar el hamiltoniano asociado a la aplicación canónica. Para la aplicación (11.306), podemos asumir que el ı́ndice n hace las veces del parámetro “tiempo”. La función delta periódica permite seleccionar los tiempos de cruce de la trayectoria con la superficie de sección: δ1 (n) = ∞ X m=−∞ δ(n − m) (11.315) Entonces (11.306) toma la forma: dI = λf (ϕ)δ1 (n) ; dn dϕ = 2πα(I) dn (11.316) donde In y ϕn son I(n − ǫ) y ϕ(n − ǫ). Estas ecuaciones son de forma hamiltoniana con: Z I Z θ H(I, ϕ, n) = 2π α(I ′ )dI ′ − λδ1 (n) f (ϕ′ )dϕ′ (11.317) que es un hamiltoniano no autónomo de un grado de libertad. 526 / Mecánica clásica avanzada Ejemplo 11.8.1 Construir un hamiltoniano para la aplicación estándar (11.306). Dicha aplicación es: In+1 = In + K sen ϕn ϕn+1 = ϕn + In+1 (11.318) Las ecuaciones de movimiento según (11.316) son: dI = K sen ϕ δ1 (n) ; dn dϕ =I dn (11.319) y el hamiltoniano según (11.317) es: H= 1 2 I + Kδ1 (n) cos ϕ 2 (11.320) Es conveniente usar la expansión de Fourier de la función delta periódica, (11.315): δ1 (n) = 1 + 2 ∞ X cos 2πqn (11.321) q=1 entonces: H= ∞ X 1 2 I + K cos ϕ ei2πnm 2 m=−∞ (11.322) donde el número de iteración n es una variable temporal, resultando H no autónomo. H puede también escribirse en la forma: H = H 0 + H1 (11.323) donde: H0 = 1 2 I + K cos ϕ 2 (11.324) y, H1 = 2K cos ϕ ∞ X cos 2πqm (11.325) q=1 Como se ve, H0 es el hamiltoniano de un péndulo y H1 es una perturbación consistente en una serie de impactos periódicos en el tiempo. Ejemplo 11.8.2 Construir la aplicación correspondiente al movimiento en las cercanı́as de la separatriz, en una superficie de sección, para un sistema de dos grados de libertad. Teorı́a de perturbaciones / 527 Por aplicar la teorı́a de las perturbaciones seculares a una resonancia dada en un sistema cuasi-integrable y promediando sobre las variables angulares rápidas, el hamiltoniano que describe el movimiento cerca a la resonancia toma la forma (11.254): 1 H = H0 (I) + Gp2 − λF cos q 2 (11.326) Como este hamiltoniano describe un movimiento cuasiperiódico, con una parte rápida: I = constante ; ϕ = ωϕ (I)t + ϕ0 (11.327) y una parte lenta correspondiente al movimiento integrable de un péndulo, la aplicación en cualquier superficie de sección, ϕ = constante o q = constante, es la aplicación canónica (11.299). Para hallar la aplicación perturbada, correspondiente a (11.302), debemos considerar los términos resonantes que fueron despreciados al promediar la resonancia ω2 /ω1 = r/s sobre la variable angular rápida ϕ como en (11.242). Entonces, de (11.240), el hamiltoniano completo, que contiene resonancias entre ϕ y el movimiento lento q, y movimiento caótico en cercanı́as de la separatriz, es: 1 H = H0 (I) + Gp2 2 − λF cos q + λ X l>1,m6=0 Hlm cos lϕ mq − + ∆lm r r (11.328) donde G, F , Hlm y ∆lm dependen sólo de I. Ahora podemos aplicar la fórmula (11.312) para hallar a f de la aplicación perturbada en una superficie de sección, que depende sólo de los términos reintroducidos en (11.328). La figura 11.5 muestra el movimiento en las superficies de sección p − q y I − ϕ, donde la parte rayada representa el movimiento en la separatriz junto con la componente estocástica. Ver más adelante. Por conveniencia, buscamos la aplicación sobre la superficie de sección I − ϕ con q ≈ ±π. Como los coeficientes de Fourier decaen al aumentar l y m, retendremos sólo el término dominante con l = m = 1. Entonces (11.328) y (11.312) nos dan: Z ∞ ϕ q i ∂ h f (In+1 , ϕn ) = − dt H11 cos (11.329) − + ∆11 ∂ϕ r r −∞ Según la ecuación (10.105), para la trayectoria separatriz se cumple: q = 4 tan−1 (eω0 t ) − π donde ω02 = λF G. f toma la forma: Z ωϕ (In+1 )t ϕn A(In+1 ) +∞ q dt − − f (In+1 , ϕn ) = sen r r r r −∞ (11.330) (11.331) donde A es H11 y ∆11 ha sido incluido en ϕn que mide a ϕ en el n-ésimo cruce por la superficie de sección colocada en la separatriz, q ≈ ±π. Teniendo en cuenta que 528 / Mecánica clásica avanzada p q ωq +π –π Superficie de sección ϕ = constante a Iy ϕ Ix ωϕ Superficie de sección q = constante b Figura 11.5 Movimiento en las superficies de sección para un sistema de dos grados de libertad: a. Sección p − q; b. Sección I − ϕ. q(−ω0 t) = −q(ω0 t), expandiendo la función seno y notando que sólo la parte simétrica contribuye a la integral, obtenemos: f (In+1 , ϕn ) = A −ϕn α2 (Q0 ) sen ω0 r r (11.332) donde: mq(s) αm (Q0 ) = cos − Q0 s ds 2r −∞ Z ∞ (11.333) es la integral de Arnold-Melnikov, y: Q0 = ωϕ rω0 (11.334) Teorı́a de perturbaciones / 529 La integral (11.333) es impropia pero consta de una parte oscilante que promedia a cero durante el movimiento sobre la separatriz y una parte constante que viene de la región con s ≤ 1/Q0 . Melnikov la evaluó, siendo para Q0 ≫ m:6 αm (Q0 ) = 4π (2Q0 )m−1 e−πQ0 /2 (m − 1)! (11.335) Como ω02 = λF G, entonces Q0 ≈ λ1/2 y vale la expansión asintótica (11.335). Entonces podemos escribir: f = f0 sen ϕn ; f0 = 8πA 2 −πQ0 /2 Q e ωϕ 0 (11.336) De acuerdo con el ejemplo 10.3.1, para las oscilaciones de un péndulo en las cercanı́as de la separatriz se cumple que el perı́odo vale: T = ω0−1 ln 32 ωϕ I 1+ λF (11.337) El cambio en ϕ durante este tiempo es ωϕ T , lo cual conduce al número de rotación de la aplicación “twist”: 2πα = 32 ωϕ ln ω0 |W | (11.338) donde: W = −F − ωϕ I λF (11.339) Si escogemos a ωϕ independiente de I, con lo cual el problema no se altera esencialmente, resulta que f no depende de I, y según (11.314) podemos tomar g ≡ 0. Es conveniente cambiar de variables de I a W . En las variables W , ϕ, la aplicación separatriz es: Wn+1 = Wn − W0 sen ϕn ϕn+1 = ϕn + Q0 r ln 32 |Wn+1 | (11.340) donde: W0 = 8πA 2 −πQ0 /2 ωϕ I0 = Q0 e F F (11.341) No degeneración y no degeneración isoenergética. Tratemos de explorar las consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos en una superficie de sección.7 6 Véase 7 Véase 1976. el apéndice A, en Chirikov, Op. cit. el texto de V. Arnold, Les méthodes mathématiques de la mécanique classique, Mir, Moscú, 530 / Mecánica clásica avanzada Asumamos que hay una relación entre las frecuencias, para dos grados de libertad, de la forma: f (ω1 , ω2 ) = 0 (11.342) Diferenciando hallamos de df = 0: ∂ω1 ∂ω2 ∂f ∂I1 ∂I1 ∂ω1 ω̃I f~ω = ∂ω ∂ω2 ∂f 1 ∂I2 ∂I2 ∂ω2 Si f es de la forma: f = m1 ω 1 + m2 ω 2 = 0 =0 (11.343) (11.344) con m1 y m2 enteros, f~ω es un vector con componentes m1 y m2 . Entonces (11.343) se satisface solamente si se cumple la condición necesaria: det ω̃I = 0 (11.345) det ω˜I 6= 0 es la condición necesaria de no degeneración de las frecuencias (o de no dependencia lineal de las frecuencias). En el caso no degenerado los movimientos son cuasiperiódicos con un número de frecuencias igual al número de grados de libertad, con lo cual existen toroides invariantes l-dimensionales. Las curvas de fase son hélices sobre los toroides y las frecuencias de revolución cambian de un toroide a otro. En el caso general no sólo las dos frecuencias sino su relación α varı́a de un toroide a otro. Si la derivada de α respecto a la variable de acción que numera los toros es diferente de cero para un valor dado de la energı́a, diremos que el sistema es isoenergéticamente no degenerado. La condición de no degeneración isoenergética se escribe como: ∂ω1 ∂ω2 ω1 ∂I1 ∂I1 ∂ω ∂ω2 1 6= 0 (11.346) det ω2 ∂I2 ∂I2 ω1 ω2 0 la cual se deduce fácilmente de las expresiones dα(I1 , I2 ) 6= 0 y dE = ω1 dI1 +ω2 dI2 = 0. Las condiciones de no degeneración y de no degeneración isoenergética son independientes, es decir, la una no implica la otra. Consideremos la aplicación “twist” sobre el punto de intersección de una curva de fases con la superficie de sección. Esa aplicación deja invariantes los cı́rculos meridianos concéntricos de intersección de los toros invariantes con la superficie de sección. Cada cı́rculo gira un ángulo igual a 2πα. Si el sistema no es isoenergéticamente degenerado, el ángulo de rotación de los cı́rculos invariantes sobre la superficie de sección cambiará de un cı́rculo a otro, es decir, α necesariamente cambia al pasar de un cı́rculo a otro. Como α es una función continua de I1 , con E constante, al ir variando I1 , α tomará tanto Teorı́a de perturbaciones / 531 valores racionales como irracionales, de modo que en ciertos cı́rculos habrá puntos fijos discretos y en otros no. Una y otra clase de cı́rculos forman un conjunto denso, pero en casi todos los cı́rculos el ángulo de rotación no será un múltiplo racional de 2π. Si ahora la aplicación es perturbada, como en (11.306), la propiedad de un cı́rculo con α racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar una pequeña perturbación llenará todos los puntos del toro. En tanto que si el toro es no resonante, una perturbación pequeña no ocasiona un cambio grande en las trayectorias de fase y en la topologı́a misma del toro. En una resonancia particular, ω1 /ω2 = r/s, la condición de no degeneración isoenergética (11.346) se convierte en: r2 ∂ 2 H0 ∂ 2 H0 ∂ 2 H0 + s2 − 2rs 6= 0 2 2 ∂I1 ∂I2 ∂I1 ∂I2 (11.347) Esta condición a la vez es una condición de no linealidad del movimiento alrededor de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos que es descrito por un hamiltoniano de la forma (11.253): ∆H = ∂2H 0 2 ∂I 1 (∆I 1 )2 + 2λHr,s cos ϕ1 (11.348) 2 tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al orden λ2 y el ancho de la separatriz no estará restringido a ser del orden de λ1/2 , según (11.256). Entonces la condición de no linealidad es, de (11.255): G= ∂2H 0 2 ∂I 1 6= 0 (11.349) 2 Esta condición separa los sistemas con degeneración accidental (∂ 2 H 0 /∂I 6= 0) o 2 fuertemente no lineales, de los sistemas con degeneración intrı́nseca (∂ 2 H 0 /∂I = 0) o débilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformación canónica (11.238) y (11.239): ∂2H 0 ∂ ∂H0 ∂I1 ∂H0 ∂I2 = . . 6= 0 (11.350) + ∂I12 ∂I2 ∂I 1 ∂I 1 ∂I1 ∂I 1 y como según (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a (11.347). O sea que la condición de no degeneración isoenergética es a la vez una condición de no linealidad del movimiento en proximidades de una resonancia aislada. El teorema de K. A. M. Si un sistema integrable es perturbado, hemos visto en (11.45) que las resonancias entre los grados de libertad pueden destruir la convergencia de las expansiones en series de potencias alrededor del sistema no perturbado. Sin embargo el teorema de K. A. M. dice que “si un sistema hamiltoniano es no degenerado, entonces la mayor parte de los toroides invariantes no resonantes no desaparecen bajo una perturbación hamiltoniana lo suficientemente pequeña, sino que se deforman ligeramente de modo que en el espacio de fases del sistema perturbado existen igualmente 532 / Mecánica clásica avanzada toroides invariantes, o sea adherencias de las curvas de fase que son hélices cuasiperiódicas con un número de frecuencias igual al número de grados de libertad. Tales toroides son la mayorı́a en el sentido que la medida del complemento de su unión es del orden de λ”. Las condiciones a ser satisfechas son: (i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias son independientes: ~ 6= 0 m.~ ~ ω(I) (11.351) donde ω ~ = ∂H0 /∂ I~ y m ~ es un vector de componentes enteras. (ii) La perturbación es función de clase C M , o sea que posee derivadas continuas hasta de orden M . (iii) El estado del sistema es lo suficientemente alejado de una resonancia para satisfacer que: |m ~ ·~ ω| ≥ C|m| ~ −τ (11.352) para todo m, ~ donde τ depende de l y M , y C depende de λ, de la magnitud del hamiltoniano de perturbación H1 , y de la no linealidad G del hamiltoniano no perturbado H0 . Como (11.352) no puede satisfacerse para C muy grande y C se incrementa con λ, |H1 | y 1/G, hay una condición de “perturbación suficientemente pequeña” para que existan toros de K. A. M. (i) y (iii) también implican una condición de no linealidad moderada. Este teorema fue probado por Arnold (1961) para H1 analı́tica y por Moser (1962) para cuando H1 es de clase C M , basados en una conjetura de Kolmogorov (1954). La dificultad de la prueba del teorema radica en los pequeños denominadores que aparecen en todo el procedimiento de expansión en series de potencias. Las pruebas utilizan los métodos de convergencia rápida (superconvergentes), análogos al método de Newton para resolver numéricamente una ecuación algebraica, que permite neutralizar el efecto de los pequeños divisores que aparecen en cada aproximación. Para ilustrar esto, consideremos la aplicación “twist” perturbada con dos grados de libertad, (11.302), correspondiente a las intersecciones de la trayectoria con la superficie de sección: I1 (ϕ1 + 2πα) = I1 (ϕ1 ) + λf (ϕ1 ) Usemos expansiones de Fourier respecto a ϕ1 : X X bk eikϕ1 I1 (ϕ1 ) = ak eikϕ1 ; λf (ϕ1 ) = (11.353) (11.354) Entonces: I1 (ϕ1 + 2πα) − I1 (ϕ1 ) = X ak eik2πα − 1 eikϕ1 (11.355) con lo cual se obtiene la siguiente relación entre los coeficientes: ak = bk ik2πα e −1 (11.356) Teorı́a de perturbaciones / 533 Los módulos de estos coeficientes se relacionan por: |bk | (11.357) 2 sen πkα Vemos que ak no tiende a cero tan rápido como bk y que son indefinidos cuando α es racional. El anterior es el problema de los denominadores nulos que impide la convergencia de las series de perturbaciones. Pero como α es función de I1 , el valor de I1 puede escogerse de modo que el denominador nunca sea resonante. Básicamente el método de cálculo consiste en variar las condiciones iniciales en cada paso del procedimiento de expansión para asegurarse de estar lo suficientemente lejos de las resonancias y poder proseguir la expansión al paso siguiente. En una expansión superconvergente la aproximación n + 1-ésima se realiza alrededor de los valores de las variables obtenidos de la n-ésima aproximación y no alrededor de los valores no perturbados, como se hace en una expansión ordinaria. Como hemos visto, si hay una resonancia entre los dos grados de libertad del sistema no perturbado, la perturbación induce un cambio en las trayectorias del espacio de fases, lo mismo que en las frecuencias. Si la acción perturbada I1 es próxima a la no perturbada I0 , pueden existir curvas invariantes de K. A. M. “cercanas” a las curvas invariantes no perturbadas. El anterior es el significado de la condición de independencia lineal m ~ ·~ ω 6= 0, que garantiza que I1 → I0 cuando λ → 0. Para un valor fijo de λ, la no linealidad necesaria en G puede estimarse de la condición ∆I1 ≪ I0 , siendo I0 la acción no perturbada y ∆I1 el máximo valor de la diferencia I1 − I0 . De (11.238) se sigue que: |ak | = (11.358) ∆I1 = r∆I 1 Para un sistema con degeneración accidental, (11.257) nos dice que: 1/2 2λHrs ∆I 1 = 4 G (11.359) Por tanto ∆I1 ≪ I0 impone la condición: G≫ 32r2 λHrs I02 (11.360) La condición de suavidad de la perturbación, (ii), puede asociarse con la propiedad de las curvas de K. A. M. de existir solamente separadas de todas las “islas” de perturbaciones. Si las “islas” entre dos resonancias de orden bajo llenan todo el espacio de fases entre ellas, podemos razonablemente esperar que no haya una curva de K. A. M. ¿Cómo relacionar esto con la condición (ii) del teorema?. Asumamos que ω1 /ω2 = s y que H0 depende linealmente de I2 , de modo que ω2 es una constante independiente de I1 e I2 . En la siguiente resonancia, ω1 /ω2 = s + 1, de modo que la diferencia en ω1 entre dos resonancias sucesivas es δω1 = ω2 , como puede verse en la figura 11.6. Entre dos resonancias primarias hay una serie de resonancias secundarias en ω1 /ω2 = s+p/q (p, q enteros y p < q). El hamiltoniano tiene la expresión: X H = H0 + λ Hlm ei(lϕ1 −mϕ2 ) (11.361) l,m 534 / Mecánica clásica avanzada Tomemos en la sumatoria los valores de l que dan lugar a resonancias secundarias, l = q, 8 ω 1 /ω 2 = s ω 1 /ω 2 = s + 1 a 4 2λG′H 1m 4 2λG′H 1m 4 2λG′H 1m 0 1/4 1/3 1/2 2/3 3/4 b 1 G′∆I 1 ω2 Figura 11.6 Intervalos que muestran resonancias. m(p, q) = p + sq (11.362) y analicemos el movimiento en las cercanı́as de una resonancia secundaria. De (11.359) el ancho de la separatriz en cada resonancia es: ∆I 1 = 4 2λHqm G 1/2 (11.363) 8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo con la condición de suavidad de la perturbación. (iii) En la figura 11.6b los intervalos rayados muestran resonancias secundarias. La suavidad de la perturbación exige que las resonancias secundarias sean aisladas. Teorı́a de perturbaciones / 535 y de las expresiones ∆I1 = q∆I 1 y g = q 2 ∂ 2 H0 /∂I12 = q 2 G′ , obtenemos para la contribución de todas las resonancias secundarias sobre el valor de ∆I1 : 1/2 X X 2λ 1/2 Hqm (11.364) ∆I1 = 4 G′ p,q y para el ensanchamiento de las frecuencias: X X ∂ω1 X ∆I1 = G′ ∆I1 ∆ω1 = ∂I1 1/2 X 2λ 1/2 = 4 Hqm G′ p,q (11.365) La relación entre la suma de los anchos de las islas secundarias y la separación entre las resonancias primarias es: P X ∆ω1 1/2 = 4(2λG′ )1/2 ω2−1 Hqm (11.366) δω1 p,q Si H1 tiene M derivadas continuas respecto a ϕ1 y ϕ2 , las derivadas altas tienen la forma: X (11.367) Hqm (iq)k1 (−im)M−k1 ei(qϕ1 −mϕ2 ) p,q Las cuales serán continuas a condición de que Hqm sean lo suficientemente pequeñas para q y m grandes. Para que la serie converja, es necesario que para q y m grandes los términos se comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362). Entonces las amplitudes de Fourier para q grandes han de comportarse como: Hqm ≈ A q M+2 (11.368) con el fin de que λH1 sea de clase C M . Según (11.362) y la desigualdad p < q, hay q coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto: X 1/2 1/2 Hqm ≈ qHqm′ (11.369) donde m′ es un valor de m convenientemente escogido. De (11.366), (11.368) y (11.369) se sigue entonces que: √ P ∞ X ∆ω1 4 2ω1 σ ≈ 4(2λG′ A)1/2 ω2−1 (11.370) q −M/2 = δω1 ω2 q=1 donde: σ=ζ M 2 , ω1 = (λAG′ )1/2 (11.371) 536 / Mecánica clásica avanzada y ζ es la función zeta de Riemann. ζ(1) = ∞, ζ(2) = 1, 64493, ζ(3) = 1, 20205 y ζ(x) → 1 para x → ∞. Entonces (11.370) existe si M > 2. De modo que independientemente del valor del coeficiente de la sumatoria, obtenemos la importante condición para la existencia de una superficie de K. A. M.: que el número de derivadas continuas de la perturbación satisfaga que M >2 (11.372) Podemos comparar este resultado con la condición (iii) de K. A. M., (11.352), escrita para dos dimensiones como: ω1 r − > C ′ sτ −1 ω2 s (11.373) El lado izquierdo es el ancho de una resonancia secundaria aislada. Tomando el ancho total a ser examinado como la distancia entre dos resonancias de orden inferior, o sea el intervalo unidad, hay a lo sumo s valores de r en tal intervalo que deben ser excluidos según la condición (i) del teorema. La medida de Lebesgue M de las resonancias excluidas se obtiene multiplicando a (11.373) por s y sumando sobre s: M = C′ ∞ X s−τ = C ′ ζ(τ ) (11.374) s=1 Comparando a (11.374) con (11.370) vemos que: C′ ≈ ω1 ; ω2 ω1 = √ λAG′ ; τ= M 2 (11.375) Entonces τ > 1 es suficiente para que exista una superficie de K. A. M. Chirikov ha determinado la condición necesaria correspondiente a (11.372) para l grados de libertad: M ≥ 2l − 2 (11.376) y Moser la condición suficiente: M ≥ 2l + 2 (11.377) suponiendo que C tiende a cero con λ y es tomada suficientemente pequeña. Asumiendo que la suma en (11.370) converge a σ, vemos que las superficies de K. A. M. no existen si α = ω1 /ω2 cae dentro de una de las regiones rayadas en la figura 11.6b. Como el ancho de esas regiones es proporcional a (λG)1/2 y decrece con el incremento de q, α debe estar lo suficientemente lejos de un número racional p/q. Para λ pequeño es fácil cumplir esto, pero cuando λ se incrementa, solamente aquellos irracionales que son más difı́ciles de aproximar por racionales pueden dar lugar a √ superficies de K. A. M. El número “más irracional” en este sentido es la media dorada ( 5 − 1)/2. La condición sobre el valor de λ se obtiene de (11.370) haciendo el lado izquierdo igual a uno: λG′ ≤ ω22 32Aσ 2 (11.378) Teorı́a de perturbaciones / 537 Por otra parte (11.360) y (11.378) dan la condición de λ no linealidad moderada: ω22 32λA < G′ < 2 I0 32Aσ 2 λ (11.379) usando r2 Hrs /q 2 ≈ A. El teorema de Poincaré-Birkhoff. Cualquier punto del cı́rculo con α(I) = r/s es un punto fijo de la aplicación “twist” no perturbada (11.299) con perı́odo s. El teorema dice que para algún múltiplo par de s, 2ks con k = 1, 2, ..., permanecen 2ks puntos fijos al colocarse una perturbación, siendo ks de ellos elı́pticos y ks hiperbólicos. Asumamos que α(I) aumenta al aumentar I. Entonces hay una curva de K. A. M. por fuera de la curva racional, que se mueve en sentido contrario a las agujas del reloj (flechas externas), α > r/s, y una curva de K. A. M. dentro de la curva racional que se mueve en sentido de las agujas reloj, para s iteraciones de la aplicación “twist” perturbada (11.302). Por tanto entre estas dos debe haber una curva cuya coordenada angular ϕ no cambia después de s iteraciones de la aplicación (curva sólida, que no es una curva de K. A. M). Iy Curva estacionaria Circunferencia K.A.M. α > r/s Circunferencia α = r/s Ix Circunferencia K.A.M. α < r/s s = 3, k = 1 Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del reloj y una curva sólida que no es de K. A. M. Ahora mediante una aplicación que preserve el área llevamos los puntos de la curva sólida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas continua y rayada deben encerrar la misma área. Esto es posible sólo si las curvas se cruzan entre sı́ un número par de veces. Cada intersección cuando es iterada s veces retorna a 538 / Mecánica clásica avanzada su posición inicial, es un punto fijo. De modo que para un número par de intersecciones, debe haber 2ks de tales puntos, que son los puntos fijos de Poincaré-Birkhoff. El teorema no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente de naturaleza elı́ptica e hiperbólica. Los puntos con α 6= r/s cercanos a un punto elı́ptico tienden a girar alrededor de él, en tanto que los puntos cercanos a un punto hiperbólico mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo. En la sección 11.7 mediante transformación a un sistema de coordenadas fijo en un punto elı́ptico estudiamos el comportamiento de los puntos cercanos a él y encontramos que tienen un movimiento pendular. Luego encontramos que las resonancias de orden superior dan lugar a la aparición de nuevos puntos fijos en las cercanı́as del punto elı́ptico, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud mucho más pequeña, según (11.295) proporcional a (1/s)s+1/2 . Hasta aquı́ vemos un cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el comportamiento estocástico no resulta de las resonancias de orden superior, sino que puede ocurrir en resonancias de orden bajo como resultado de la bifurcación de las separatrices. Hablando a grosso modo podemos decir que los punto elı́pticos están asociados a la estructura de islas del espacio fásico y los puntos hiperbólicos al comportamiento estocástico de la región entre toroides de K. A. M. En el apéndice 9 del libro de Arnold hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones canónicas.9 Bifurcación de las separatrices. Sabemos que un péndulo tiene una separatriz que une suavemente las órbitas hiperbólicas que pasan por los puntos de equilibrio inestable en π y −π. El teorema de Poincaré-Birkhoff nos dice que hay ks puntos hiperbólicos en un sistema integrable. Hay una separatriz suave que une un punto hiperbólico a sus vecinos próximos para tales sistemas. En un sistema cuasi-integrable con dos o más grados de libertad la situación es más compleja. Basta recordar que en los hamiltonianos usados para obtener la estructura de islas, (11.244) o (11.286), hay una serie de términos que han sido despreciados al construir los correspondientes invariantes. La estructura de islas corresponde pues a un sistema truncado. En cualquier singularidad hiperbólica convergen cuatro curvas, correspondientes a las dos trayectorias separatrices incidentes Γ+ y a las dos trayectorias separatrices salientes Γ− . Un punto x pertenece a Γ+ si la transformación repetida T n x cuando n → ∞ trae a x a la singularidad, y pertenece a Γ− si la transformación inversa T −n x cuando n → ∞ trae a x a la singularidad. Como el perı́odo sobre la separatriz del sistema truncado es infinito, lo mismo será sobre la separatriz del sistema verdadero, y el movimiento de x hacia la singularidad resulta más y más lento mientras x esté más cerca del punto fijo hiperbólico. Ahora consideremos la separatriz Γ− que sale del punto singular hiperbólico adyacente. En vez de llegar suavemente coincidiendo con Γ+ , como sucede con el péndulo o con cualquier separatriz de un sistema integrable, la curva Γ− que sale de un punto hiperbólico se cruza con la curva Γ− que sale de un punto hiperbólico vecino desplazado 2π/(ks). Esta intersección se llama un punto homoclı́nico. Las intersecciones entre trayectorias de resonancia vecinas diferentes se llaman puntos heteroclı́nicos. En esto consiste la bifurcación de las separatrices, en que una curva Γ+ no coincide con una curva Γ− . Esto establece una diferencia fundamental entre el comportamiento de 9 Véase V. Arnold, Op. cit. Teorı́a de perturbaciones / 539 Curva K.A.M. x′′′ x′′ x′ Curva K.A.M. Punto elíptico x Γ+ Γ– Γ– Γ+ Curva K.A.M. Curva K.A.M. Figura 11.8 Bifurcación de las separatrices Γ. Las lı́neas punteadas indican la separatriz del sistema truncado integrable. Las lı́neas continuas indican la separatriz del sistema completo no integrable. las trayectorias del sistema truncado y del sistema completo integrable. Si hay una intersección, entonces hay un número infinito de intersecciones, todas puntos homoclı́nicos. La intersección en el punto homoclı́nico x implica el cruce en x′ y luego en x′′ , con x′′ más próximo a x′ que x′ a x. Como las áreas encerradas por las intersecciones (áreas sombreadas en la figura 11.8) son aplicaciones unas de otras, son conservadas, de modo que Γ− oscila más y más, siendo las intersecciones sucesivas más próximas entre sı́ y las oscilaciones de amplitud mayor en virtud de la conservación de las áreas. En la figura 11.8 se muestran sólo las primeras intersecciones. Los puntos homoclı́nicos por sı́ solos no describen completamente el comportamiento de la región próxima a las separatrices. Como el número α(I) local en las cercanı́as de los puntos singulares elı́pticos tiende a infinito en la separatriz debido a que el perı́odo del movimiento sobre ésta es infinito, entonces en las cercanı́as de la separatriz hay un número infinito de resonancias secundarias correspondientes a valores grandes de α. Cada uno tiene su propio conjunto de puntos singulares hiperbólicos y elı́pticos que alternan, con la correspondiente bifurcación de separatrices y con múltiples puntos he- 540 / Mecánica clásica avanzada teroclı́nicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para dos grados de libertad limitado por dos superficies de K. A. M. La intersección de las trayectorias en puntos homoclı́nicos demuestra que un toroide de K. A. M. no puede existir en tales puntos puesto que hay un drástico cambio de topologı́a. Cuando la perturbación aumenta, según el teorema de K. A. M., la medida de la región de toroides disminuye y aumenta la de la región estocástica. La magnitud de la bifurcación de las separatrices para λ pequeño es exponencialmente pequeña, razón por la cual pasa desapercibida en las diferentes formas de la teorı́a de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series de perturbaciones. Si esas series fueran convergentes, el sistema no tendrı́a bifurcación de las separatrices ni estados de movimiento irregular. Aplicación completa sobre una superficie de sección para un sistema no integrable de dos grados de libertad. Asumamos que en la superficie de sección al aumentar I1 disminuye la frecuencia ω1 y que en I1 = 0 el número de rotación es irracional, por ejemplo α(0) = 1/π. Al aumentar I1 , ω1 decrece hasta alcanzar la primera resonancia de orden bajo en ω1 = ω2 /4, dando lugar como en la figura 11.3, a una cadena de islas; es decir hay cuatro puntos fijos que como resultado de la perturbación y según el teorema de Poincaré-Birkhoff pasan a ser ocho, alternándose los elı́pticos e hiperbólicos, con una isla alrededor de cada punto elı́ptico. Cerca de los cuatro puntos fijos hiperbólicos la presencia de puntos homoclı́nicos y heteroclı́nicos está asociada a una región de movimiento caótico limitada por dos superficies de K. A. M. “rotacionales”. Al aumentar I1 , la siguiente resonancia de orden bajo aparece en ω1 = ω2 /5, que da lugar a cinco puntos elı́pticos y a una cadena de cinco islas. Al aumentar I1 aparecen nuevas resonancias. Hay además infinidad de resonancias intermedias cuya amplitud es pequeña. Por ejemplo, entre ω1 = ω2 /4 y ω1 = ω2 /5 hay una resonancia en ω1 = 2ω2 /9. De acuerdo con (11.257) la amplitud de una resonancia es del orden de: 1/2 λH r,−s ∆I1 ≈ 2 ∂ H0 (11.380) 2 ∂I 1 Según (11.293) el coeficiente de Fourier dominante en el hamiltoniano que describe el movimiento en las islas es aproximadamente: máx Hr,−s ≈ Js (π) (11.381) de modo que la relación de amplitudes en s = 5 y s = 9 es aproximadamente: J9 (π) ∆I1 (s/r = 9/2) ≈ 0, 1 (11.382) ≈ ∆I1 (s/r = 5) J5 (π) Además, en cada punto hiperbólico de las resonancias secundarias se genera una región de movimiento caótico. La figura 11.9 muestra esquemáticamente la apariencia de la superficie de sección. Las lı́neas sólidas son superficies de K. A. M. Las que rodean el origen, I1 = 0, son distorsión de los cı́rculos no perturbados y corresponden al nuevo invariante I1 = constante, Teorı́a de perturbaciones / 541 el cual es calculado aplicando el teorema de la media, descrito en la sección 11.5. Las lı́neas sólidas que rodean los puntos singulares elı́pticos no se pueden calcular con este método sino con el de las perturbaciones seculares (sección 11.7). Para las trayectorias cercanas a las separatrices no hay un invariante y las trayectorias llenan toda el área comprendida entre dos lı́neas de K. A. M. “rotacionales”. Figura 11.9 Superficie de sección de resonancias secundarias En cada una de las “islas” alrededor de un punto elı́ptico podemos transformar de las variables I 1 , ϕ1 a unas variables acción-ángulo J1 , χ1 . Esto transforma la cadena de islas en un conjunto de cı́rculos concéntricos como en la figura 11.3b. Las resonancias entre la frecuencia del movimiento alrededor del punto fijo y las frecuencias fundamentales crean cadenas de islas de segundo orden, similares a las de primer orden. Análisis de la estabilidad. En los sistemas hamiltonianos no integrables la estabilidad lineal parece ser una condición necesaria y suficiente para la estabilidad no lineal, en el sentido que la estabilidad lineal garantiza la existencia de superficies de K. A. M. cerca a un punto fijo. El análisis de la estabilidad de un estado de movimiento en un sistema hamiltoniano se reduce al análisis de la estabilidad de la correspondiente aplicación canónica en una superficie de sección de Poincaré. Un punto fijo x0 de una aplicación que preserve el área T se dice que es estable si para cada vecindad U de x0 existe una subvecindad V ⊆ U tal que para todo k siempre se cumple que T k (V ) ⊆ U . Poniendo el orı́gen de coordenadas en x0 y linealizando T alrededor de ese punto, hallamos que su parte lineal es una matriz 2 × 2 de coeficientes reales, Ã, que es simplicial. Debido a esto, si λ es un autovalor de Ã, entonces 1/λ también lo es, y por ser real, λ y λ⋆ son autovalores. De modo que los autovalores λ, λ⋆ , 1/λ, 1/λ⋆ , están determinados por la ecuación λ2 − λ tr à + 1 = 0 donde tr es la traza de Ã. Si los autovalores son complejo conjugados, λ1,2 = e±iσ , representan soluciones estables con tr à = 2 cos σ y |trÃ| < 2. Si son reales y recı́procos, por ejemplo λ1,2 = e±σ , con |tr Ã| = |2 cosh σ| > 2, se tienen soluciones creciente y decreciente. El caso inestable puede dividirse en dos posibilidades, tr à > 2 (λ1 > 1) y tr à < −2 (λ1 < −1). Las raı́ces pueden ser iguales con 542 / Mecánica clásica avanzada λ1 = λ2 = ±1, y corresponden a la transición exacta entre los casos estable e inestable. El movimiento linealizado presenta entonces tres clases de órbitas: elı́pticas, hiperbólicas y rectilı́neas. Un punto fijo hiperbólico es inestable y las órbitas cercanas a él se separan exponencialmente. Un punto fijo elı́ptico es estable y las órbitas cercanas a él se separan linealmente. Si en un punto elı́ptico hay resonancias de orden bajo, sabemos, el análisis de estabilidad lineal no es suficiente pues pueden presentarse nuevos puntos fijos hiperbólicos, de acuerdo con el teorema de Poincaré-Birkhoff. Ejemplo 11.8.3 Hacer el análisis de estabilidad de la aplicación separatriz (11.340): Wn+1 = Wn − W0 sen ϕn ϕn+1 = ϕn + Q0 r ln 32 |Wn+1 | (11.383) Los puntos fijos de perı́odo 1, o sea de una sola iteración, están en: Q0 r ln o sea: 32 = 2πm |W1 | (11.384) W1 = ±32e−2πm/(Q0r) , ϕ1 = 0, π m : entero (11.385) Si llamamos x1 = (W1 , ϕ1 ) y T la aplicación, estos puntos satisfacen x1 = T x1 . Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn : ∆xn+1 = à ∆xn (11.386) siendo à la matriz jacobiana de la aplicación: ∂W ∂W n+1 ∂Wn à = ∂ϕn+1 ∂Wn n+1 ∂ϕn ∂ϕn+1 ∂ϕn (11.387) Para evaluar la estabilidad se requiere la traza de Ã: tr à = 2 + W0 Q0 r cos ϕ W1 (11.388) Para estabilidad se requiere que tr à < 2, de modo que para W1 > 0 los puntos fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando: W1 > Ws = W0 Q0 r 4 (11.389) o sea: W1 > 2πrA 3 −πQ0 /2 Q0 e F (11.390) Teorı́a de perturbaciones / 543 Es de esperarse que el valor de Ws que marca el lı́mite entre los puntos con ϕ1 = π estables e inestables represente un importante parámetro indicativo de estocasticidad cuando W < Ws . La aplicación separatriz es de importancia para comprender el comportamiento caótico de los sistemas cuasi-integrables, pues las separatrices siempre rodean las resonancias de esos sistemas. La aplicación separatriz, que describe el comportamiento en las cercanı́as de la separatriz, claramente exhibe comportamiento caótico para W → 0. Ejercicio 11.8.1 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la aplicación de Fermi: Un+1 = |Un + sen ϕn | ϕn+1 = ϕn + 2πM Un+1 (177) (11.391) donde M es una constante. Ejercicio 11.8.2 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la aplicación estándar (11.318). Ejercicio 11.8.3 Mostrar que la aplicación estándar es una aproximación a la aplicación de Fermi y a la aplicación separatriz linealizadas. Irregularidad global. La existencia de regiones caóticas está asociada con las resonancias y se da aun para valores pequeños del parámetro λ. No hay una transición brusca entre los regı́menes regular e irregular en algún valor crı́tico de λ. Sin embargo es útil poder cuantificar el grado de “estocasticidad” y decir cuando el movimiento es dominantemente estocástico. Chirikov (1979) ha observado que al aumentar la perturbación ocurre en algún valor más o menos definido que las superficies de K. A. M. rotacionales que encierran una región estocástica de un sistema de dos grados de libertad se “rompen”, permitiendo que las trayectorias estocásticas ocupen una región más grande del espacio fásico. Con esta idea elaboró el concepto de sobreposición de las separatrices y definió un parámetro de estocasticidad. Hay muchos otros criterios pero este es de los más usados, al menos como un indicador del orden de magnitud de la perturbación para el cual el sistema se comporta de modo esencialmente irregular. Si (∆Imáx )1 y (∆Imáx )2 son los anchos de las separatrices vecinas separadas por una lı́nea de K. A. M. rotacional, y δI12 es la distancia entre las resonancias correspondientes, o sea entre los puntos fijos centrales de las “islas”, el criterio de estocasticidad global puede formularse como: (∆Imáx )1 + (∆Imáx )2 2 ≥ δI12 3 (11.392) Cuando existen las superficies de K. A. M. que limitan las regiones estocásticas se habla de estocasticidad local o aislada y cuando tales superficies desaparecen se habla de estocasticidad global o conectada. En el ejemplo 11.8.3 hallamos un parámetro crı́tico para el cual se pierde la estabilidad lineal de las principales resonancias en la aplicación separatriz; este parámetro también da una burda estimación de la estocasticidad, pero por no ser una condición necesaria para la estocasticidad conectada resulta ser un criterio 544 / Mecánica clásica avanzada demasiado fuerte. Greene (1979)10 halló que aunque la pérdida de estabilidad lineal de las islas de perı́odo 1 es una condición muy fuerte, tal criterio aplicado a islas de perı́odo alto cercanas a una superficie de K. A. M. puede dar una mejor descripción. Este es un criterio alterno al de Chirikov y más exacto en muchos casos. Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicación estándar (11.318). (a) Pérdida de estabilidad de los puntos fijos elı́pticos de perı́odo 1. Tales puntos están en: I1 = 2πm , m : entero ; La matriz à es: 1 ±K à = 1 1±K ϕ1 = 0, 1 (11.393) (11.394) donde el signo más corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condición de estabilidad: |2 ± K| < 2 (11.395) nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos elı́pticos de perı́odo 1 si: K>4 (11.396) (b) Sobreposición de separatrices de resonancias primarias. Es conveniente considerar el hamiltoniano de la aplicación, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ varı́a lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuación (11.325), contribuirá sólo el término de variación más lenta, de modo que: 1 2 I + K cos ϕ + 2K cos ϕ cos 2πn (11.397) 2 La parte correspondiente a H0 , ecuación (11.324), describe un movimiento pendular, siendo la frecuencia de libración alrededor del punto elı́ptico ϕ = π: √ ω0 = K (11.398) H= El máximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o sea H0 = K. Entonces el valor máximo de I está en cos ϕ = −1: √ ∆Imáx = 2 K (11.399) De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a 2π, y por tanto la relación entre el ancho total de la separatriz y la distancia entre dos resonancias consecutivas es: 2∆Imáx 4ω0 = (11.400) δI 2π 10 Véase el texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, SpringerVerlag, Nueva York, 1983. Teorı́a de perturbaciones / 545 La frecuencia de H1 es 2π, de modo que el número de rotación local cerca al punto elı́ptico de libración α0 = ω0 /2π. Entonces: 2∆Imáx = 4α0 (11.401) δI La observación numérica dice que la transición a la estocasticidad global ocurre aproximadamente cuando aparecen las islas de sexto orden, con α ≈ 1/6, entonces (11.401) nos conduce a la “regla de los dos tercios”, 2∆Imáx /δI ≈ 2/3. Sin embargo, un estimado de K puede obtenerse directamente de (11.400) tomando simplemente 2∆Imáx /δI ≈ 1 como un indicativo de la sobreposición de las separatrices: √ 4 K = 2π , K ≈ 2, 47 (11.402) Con la regla de los dos tercios se obtiene: K ≈ 1, 46 (11.403) (c) Sobreposición del primero y del segundo armónicos. Definimos la condición de sobreposición del primero y del segundo armónicos como: ∆I1 máx + ∆I2 máx = δI12 = π (11.404) donde los subı́ndices indican resonancias de perı́odos 1 y 2 respectivamente. Para calcular el ancho ∆I2 necesitamos el segundo armónico de Fourier en la expansión de H en potencias de K ya que en (11.397) K cos ϕ contiene sólo el primer armónico. El hamiltoniano describe un sistema no autónomo de un grado de libertad, que equivale a uno de dos grados de libertad según la sección 9.2. Como la región del espacio fásico en que aparece el segundo armónico está alejada de las resonancias primarias, la teorı́a de perturbaciones ordinaria puede usarse para hacer la expansión de H hasta el segundo orden en K donde esperamos que aparezca el segundo armónico. El hamiltoniano (11.323) puede escribirse como: H= +∞ X 1 2 I + λK cos(ϕ − 2πmn) 2 m=−∞ (11.405) El término de orden cero I 2 /2, describe un movimiento en I − ϕ cuya solución es ϕ = In + ϕ0 , I = constante, siendo ϕ0 una constante. Según (11.393) los puntos fijos de la aplicación estándar están en I = 2pπ para las resonancias primarias. Entonces la perturbación dará lugar a puntos fijos de las resonancias secundarias en: I = (1p + 1)π ; p : entero (11.406) que se encuentran entre dos resonancias primarias. La frecuencia del movimiento de orden cero es (2p + 1)π y la frecuencia de la fuerza impulsora externa es 2πm, presentando resonancias de la forma r/s = (2p + 1)/m. Los punto fijos en 0 y π de (11.393) corresponden a m = 0, o sea al movimiento pendular, con lo cual las resonancias secundarias vienen de r = 2p + 1 y s = 1 y basta tomar a H como (11.397), escrito en la forma: 1 H = Iχ + Iϕ2 + K cos ϕ + 2K cos ϕ cos χ 2 (11.407) 546 / Mecánica clásica avanzada Realicemos una transformación canónica para obtener una variable angular rápida y una lenta: Iχ = rI χ ; Iϕ = I ϕ − sI χ ϕ = rχ − sϕ ; (11.408) χ=χ Entonces: 2 1 I ϕ − sI χ 2 rχ − ϕ rχ − ϕ + K cos + 2K cos cos χ s s H + = rI χ + (11.409) Ahora ϕ es una variable angular lenta y podemos aplicar la teorı́a de perturbaciones adiabáticas, sección 11.5, válida aquı́ por no haber divisores nulos. Para buscar una expansión en potencias de K, al orden cero aplicamos (11.178): H 0 = rI χ + 2 1 I ϕ − sI χ 2 (11.410) Al primer orden promediamos la perturbación sobre la variable angular rápida χ: H1 = 0 (11.411) Entonces, según (11.180): 2π ∂F (1) = − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ ∂χ (11.412) y por tanto: −2πF (1) = 1 1 sen (rχ − ϕ) + sen [(r − 1)χ − ϕ] r r−1 1 sen [(r + 1)χ − ϕ] + r+1 (11.413) y, 2π ∂F (1) = ∂χ 1 1 cos(rχ − ϕ) + cos[(r − 1)χ − ϕ] r r−1 (11.414) 1 + cos[(r + 1)χ − ϕ] r+1 Para hallar a H 2 , aplicamos la fórmula (11.37) con los promedios tomados sobre χ: H2 = (1) 2 2 ∂F ∂F (1) 1 X X ∂ 2 H0 2 µ=1 ν=1 ∂I ν ∂I µ ∂ϕν ∂ϕµ (11.415) Teorı́a de perturbaciones / 547 Con el resultado, al segundo orden: 2 K 1 2 cos 2ϕ H= I − 2 4 (11.416) donde se ha omitido una constante y regresado a la notación inicial. ϕ es la variable angular lenta, dada por (11.408): ϕ = −ϕ + (2p + 1)πn (11.417) y describe el movimiento alrededor de las islas de resonancias secundarias. Según la ecuación (11.416) la máxima oscilación de I es ∆I2 máx = K/2, con lo cual y con (11.399) y (11.404) toma la forma: √ K = π K ≈ 1, 46 (11.418) 2 K+ 2 que es el resultado obtenido por Chirikov, y que además justifica la regla de los “dos tercios”. Experimentalmente, o sea resolviendo numéricamente la aplicación (11.318), se obtiene que la transición a la estocasticidad global según Chirikov ocurre cuando K ≈ 0, 99. Chirikov mejoró el resultado (11.418) tomando el espesor de la capa estocástica en cercanı́as de la separatriz. Ejemplo 11.8.5 Calcular el efecto del espesor de la separatriz sobre el valor de K a partir del cual ocurre la transición a la estocasticidad global. El cálculo se basa en el ejemplo 11.8.2. La función W en (11.339) proviene de 1 − κ2 del ejemplo 10.3.2, que se puede escribir como: E − Es (11.419) 1 − κ2 = − 2Es notando que la energı́a de la separatriz es precisamente F . Entonces W es: W = E − Es Es (11.420) o sea la desviación de la energı́a respecto a la separatriz dividida por la energı́a de la separatriz. Según el ejemplo 11.8.1, la aplicación separatriz (11.340) linealizada toma la forma de la aplicación estándar si: In = − Q0 ∆Wn W1 y K= Q0 W0 W1 (11.421) siendo según (11.334) Q0 igual a: 2π Q0 = √ K (11.422) Hemos tomado r = 1 (resonancia de orden 1) y √ tomado las frecuencias impulsora y de la aplicación según (11.398) y (11.393) iguales a K y 2π respectivamente. 548 / Mecánica clásica avanzada Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421) y (11.341) podemos obtener el parámetro de estocasticidad K en función de Q0 y W1 : K= 8πQ30 −πQ0 /2 e W1 (11.423) donde K está asociado al ancho de las separatrices de las “islas” de segundo orden. Tal ancho, según (11.420), está descrito por W , o sea por W1 en (11.423), que según (11.422) puede expresarse en función de K: W1 = 4(2π)4 K −5/2 e−π 2 √ / K (11.424) √ De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energı́a del lı́mite exterior de la capa estocástica cercana a la separatriz es igual a la energı́a de la separatriz, K, más el ancho de la capa, dado según (11.420) por ∆E = W F , o sea que: K + ∆E = K(1 + W1 ) (11.425) es la energı́a del lı́mite exterior de la capa estocástica. Como E = I 2 /2 + K cos ϕ para el péndulo, en ϕ = π es igual a I 2 /2 − K, encontramos que: 1 2 I − K = K(1 + W1 ) , 2 I 2 = 2K(2 + W1 ) (11.426) y como W ≪ 1: √ W1 I =2 K 1+ 4 (11.427) De modo que el ancho de la separatriz respecto a la acción es: ∆Is = I − I0 = √ 1 W1 K 2 (11.428) Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposición mejorado: h √ i √ 2 K 1 + (2π)4 K −5/2 e−π / K 2 K + =π 2 (11.429) K ≈ 1, 2 (11.430) del cual se obtiene el valor: que coincide un poco más con el valor experimental K ≈ 0, 99. 12 Correspondencia con la mecánica cuántica de Heisenberg En este capı́tulo presentaremos la mecánica clásica con una notación similar a la usada en la mecánica cuántica de Heisenberg, conocida también como mecánica matricial. Las fórmulas no tendrán suposiciones cuánticas y serán válidas clásicamente. Con esto podremos hacer énfasis en las diferencias y correspondencias que existen entre los formalismos clásico y cuántico, y a la vez retomar las ideas originales de Werner Heisenberg expuestas en su trabajo famoso de julio de 1925.1 Veremos que la representación de las variables dinámicas por medio de matrices y la asignación de valores propios a las variables dinámicas son posibles dentro de un formalismo puramente clásico. Veremos también el punto exacto donde la mecánica clásica admite el reemplazo de los corchetes de Poisson por conmutadores y la no conmutatividad de las matrices. Finalmente señalaremos dónde están las verdaderas diferencias entre las mecánicas clásica y cuántica. Para ilustrar la correspondencia entre la mecánica cuántica y la mecánica clásica mostraremos cómo el procedimiento de diagonalización de la matriz hamiltoniana corresponde con el de resolver la ecuación de Hamilton-Jacobi, y presentaremos las fórmulas de la teorı́a clásica de perturbaciones con la notación matricial. Se corrobora ası́ la idea expresada por Dirac en su artı́culo de noviembre de 1925: “En un reciente artı́culo Heisenberg planteó una nueva teorı́a donde sugiere que no son erróneas las ecuaciones de la mecánica clásica, sino más bien que son las operaciones matemáticas mediante las cuales se extraen resultados fı́sicos a partir de ellas las que requieren modificación. Toda la información sumunistrada por la teorı́a clásica puede ser usada en la nueva teorı́a”.2 1 Traducido al inglés por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva York, 1968. 2 Reproducido por van der Waerden, Op. cit. 549 550 / Mecánica clásica avanzada 12.1. Representación matricial de variables dinámicas Consideraremos un sistema acotado l-dimensional en un estado de movimiento regular, es decir, integrable y que por tanto se puede describir mediante variables acción-ángulo. Tal sistema es múltiplemente periódico y cualquier variable dinámica puede expresarse como una serie de Fourier. El formalismo podrı́a extenderse a estados no acotados mediante la sutitución de las series por integrales de Fourier. Representación de variables dinámicas por matrices hermı́ticas infinitas. Sea f una variable dinámica y (I, ϕ) un conjunto de variables acción-ángulo del sistema, entonces: X f (I, ϕ) = f~n (I) ei~n·ϕ~ (12.1) ~ n donde ~n son vectores l-dimensionales de componentes enteras. Es conveniente escribir a ~n como la diferencia entre dos vectores de componentes enteras, ~n = α ~ −α ~ ′ . El vector ~ α ~ puede escribirse de modo que I = α ~ ∆I, donde ∆I es un número lo suficientemente pequeño con las dimensiones de acción;3 por tanto las componentes de α ~ son números enteros muy grandes, si I~ es grande. Sumar en (12.1) sobre todos los valores de las I~ (que varı́an entre cero e infinito) equivale a sumar sobre α ~ , o sea: X XX ′ fα~ −~α′ (~ α ∆I)ei(~α−~α )·ϕ~ (12.2) f (~ α ∆I, ϕ ~) = α ~ α ~ α ~′ Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α ~ en (12.2) puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto corresponde con las dificultades de normalización de las ondas planas en la mecánica cuántica. Si formamos el producto de dos variables dinámicas, sus coeficientes de Fourier dependen de los coeficientes de Fourier de cada variable, ası́: X (f g)β− fβ−~ (12.3) ~ β ~ ′ (I) = ~ α (I)gα ~ ′ (I) ~ −β α ~ La convergencia de la expansión (12.1) exige que los coeficientes para ~n altos sean pequeños, por tanto sólo son de interés los ~n bajos. Por otra parte, si ∆I es pequeño, siempre los α ~ en I~ = α ~ ∆I serán grandes, es decir que |~n| es del orden de la unidad y: |~n| ≪ |~ α| (12.4) Entonces se cumple para toda función de I~ que: F (~ α ∆I) = F (~ α′ ∆I) + (~ α−α ~ ′) · 3 Puede ∂F ∆I ∂ I~ considerarse a ∆I como la resolución en las medidas de las Iν . (12.5) Corespondencia con la mecánica cuántica de Heisenberg / 551 Esto nos permite definir matrices clásicas aproximadamente hermı́ticas, ası́: fα~ ,~α′ ≡ fα~ −~α′ (~ α ∆I) (12.6) entonces es claro que: fα~⋆′ ,~α = fα~⋆′ −~α (~ α′ ∆I) = fα~ ,~α′ + (~ α′ − α ~) · ∂fα~ −~α′ ∆I ∂ I~ (12.7) es aproximadamente autoadjunta. Como α ~ y α ~ ′ pueden recorrer todos los vectores de ′ componentes enteras resulta que las fα~ ,~α son matrices infinitas. Correspondencia con las matrices cuánticas. En mecánica cuántica I~ y ϕ ~ son operadores cuyos vectores propios los denotaremos respectivamente por |~ αi y |~ ϕi. En el conjunto de estados |~ αi deben incluirse, si existen, los estados del continuo para tener un conjunto completo. La transformación de la representación I~ a la representación ϕ ~ es: X X ′ |~ ϕi = |~ α′ ih~ α′ |~ ϕi = |~ α′ i e−i~α ·ϕ~ (12.8) α ~′ α ~′ El valor esperado de una variable dinámica f en el estado |~ ϕi está dado por: XX ′ h~ ϕ|f |~ ϕi = h~ α|f |~ α′ i ei(~α−~α )·ϕ~ (12.9) α ~ α ~′ Comparando (12.2) con (12.9) resulta clara la correspondencia de los coeficientes de Fourier fα~ −~α′ y las matrices clásicas fα~ ,~α′ , con las matrices cuánticas h~ α|f |~ α′ i. e−i~α·ϕ~ son las funciones de onda de la representación ϕ ~ con valores definidos de α ~, ~ i∂/∂ ϕ o sea funciones propias del operador hermı́tico asociado a I, ~: − 1 ∂ −i~α·ϕ~ e =α ~ e−i~α·ϕ~ i ∂ϕ ~ (12.10) Ciertamente hay algunas dificultades en la definición de las variables acción-ángulo en mecánica cuántica, analizadas en el artı́culo de Augustı́n y Rabitz (1979).4 En la sección §48 del libro de mecánica cuántica de Landau-Lifshitz (ver bibliografı́a) está demostrada la correspondencia entre los elementos de matriz de un operador cuántico y los coeficientes de Fourier de la correspondiente variable dinámica clásica. No tenemos hasta ahora ninguna justificación para relacionar la matriz clásica fα~ ,~α′ con transiciones entre estados cuantizados descritos por α ~ yα ~ ′ . El ejemplo 10.5.2 sobre radiación dipolar da una evidencia de la asociación entre emisión de radiación y transiciones en mecánica clásica. Cambio de representación. Si por medio de una transformación canónica pasamos de un conjunto de variables acción-ángulo (I, ϕ) a otro (I, ϕ), por medio de una 4 Action-angle variables in quantum mechanics, Journal of Chemical Physics, 71 (12), 4956, (1979). 552 / Mecánica clásica avanzada función generatriz G3 (I, ~ϕ), las variables angulares y de acción se deben transformar ~ I~ = −∂G3 (I, ϕ)/∂ ϕ, ~ las funciones e−i~α·ϕ~ como: como ϕ ~ = −∂G3 (I, ϕ)/∂ I, X ′ ~ (12.11) gα~ ,~α′ (I)e−i~α ·ϕ e−i~α·ϕ~ = α ~′ y las amplitudes de Fourier de las variables dinámicas como: XX fβ− g+ ~ β ~ ′ (I) = ~ −~ α′ (I) gα ~ (I) ~ (I) fα ~ ′ ,β β,~ α α ~ (12.12) α ~′ ⋆ donde g + ~ (I). ~ α (I) = gα ~ ,β β,~ Podemos tomar los resultados de la sección 11.3, referentes a los cambios de sistemas de variables acción-ángulo. Para sistemas no degenerados, las fórmulas (11.84) y (11.85) de tal sección establecen que: l X ∂ ψ(I) ; ϕν = nνµ ϕµ − ∂I ν µ=1 Iν = l X nµν Iµ (12.13) µ=1 donde nνµ es una matriz ñ de elementos enteros y determinante ±1 y ψ depende sólo de las variables de acción. Entonces: ~ ~ e−i~α·ϕ~ = e−i~α·(ñϕ)−i~α·δ (12.14) siendo α ~ ·~δ una fase que sólo depende de I~ y de α ~ . Por tanto para sistemas no degenerados: ~ gα~ ·~α′ = e−i~α·δ δα~ ′ ,~αñ (12.15) Para sistemas degenerados rigen las fórmulas (11.100) a (11.103): ϕβ = l X nβν ϕν + ψβ (ϕσ , I) ; ν=1 ϕτ = l X Iβ = s X nγβ Iγ γ=1 nτ σ ϕσ + ψτ (ϕσ , I) (12.16) ν=s+1 Iτ = l X nντ Iτ − i ν=1 X σ σ C~nσ (I) nτ ei~n ·ϕ~ ~ nσ Las variables no degeneradas tienen subı́ndices β = 1, 2, ...s, y las degeneradas σ = s + 1, s + 2, ...l. El superı́ndice σ indica vectores de l − s componentes. Las variables angulares ϕστ son constantes y los números nτ σ no necesitan ser enteros. ψν (ϕσ , I) son funciones periódicas de las variables angulares degeneradas. Entonces, usando el convenio de la suma: α ~ ·ϕ ~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I) (12.17) Corespondencia con la mecánica cuántica de Heisenberg / 553 ei~α·ϕ~ puede escribirse en la forma: eα~ ·ϕ~ = eiαβ nβτ ϕτ h(ϕσ , I) (12.18) donde las ϕτ son no degeneradas y h es una función periódica de las gα~ ,~α′ = hα~ σ ,~ασ′ δα~ τ ′ ,~ατ ñτ ϕστ . En consecuencia: (12.19) siendo α ~ = (~ ασ , α ~ τ ). Notemos que: X g+ ~β ~ ′ = δβ, ~′ ~ gα ~ ,β (12.20) β,~ α α ~ y por tanto: X h+ ~σ α ~σ β ,~ ασ hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ (12.21) o sea que g y h son matrices unitarias de dimensión infinita. Las matrices unitarias de cambio de representación son no conmutativas. Si se realizan dos transformaciones sucesivas, descritas por las matrices g̃ y k̃, se cumple: ~ ~ ~ ~ gα~ ,~α′ kα~ ′ ,β~ = e−i~α·(δg +ñg δk ) δβ,~ ~ αñg ñk kα~ ,~α′ gα~ ′ ,β~ = e−i~α·(δk +ñk δg ) δβ,~ ~ αñk ñg (12.22) Como puede verse, las matrices unitarias que describen las transformaciones canónicas satisfacen una álgebra no conmutativa. Aquı́ estamos considerando solamente transformaciones canónicas entre diferentes conjuntos de variables acción-ángulo, que cambian expansiones de Fourier en expansiones de Fourier. Es claro que al pasar a variables canónicas que no sean de acción-ángulo una expansión de Fourier se cambia por una expansión en otro conjunto de funciones ortogonales igualmente válida; en la formulación de la mecánica cuántica este trabajo fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925. Valores propios y vectores propios de una variable dinámica. Dada una variable dinámica f , ¿existe algún conjunto de variables acción-ángulo para el cual la función dependa sólo de las variables de acción?. Si existe, en tales variables se debe cumplir: (12.23) f I(I, ϕ), ϕ(I, ϕ) = f (I) Esto significa que en la expansión de Fourier de f sólo aparece la componente constante o d.c.: f β− ~ β ~ ′ = f 0 (I) δβ, ~β ~′ (12.24) o en términos de las matrices clásicas (12.6): ~ f β, ~β ~ ′ = f 0 (β ∆I) δβ, ~β ~′ (12.25) 554 / Mecánica clásica avanzada Los números f 0 son los valores propios de la matriz f. De (12.12) y (12.20) se sigue que: XX + gβ,~ ~ ,~ α′ gα ~ ′ ,~ α =0 ~ ,~ α′ (I) − f 0 (I)δα ~ α fα α ~ (12.26) α ~′ Esta expansión se satisface sólo si f 0 (I) son las raı́ces de la ecuación secular: det fα~ ,~α′ − f 0 (~ α ∆I) δα~ ,~α′ = 0 (12.27) En conclusión, encontrar las variables acción-ángulo en las cuales una variable dinámica no dependa de las variables angulares equivale a diagonalizar la matriz clásica formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su vez los elementos de la matriz de la transformación unitaria g que conecta las dos representaciones: X (12.28) fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I) α ~′ De lo anterior resulta que si el hamiltoniano es diagonal, entonces toda constante de movimiento, cuando no hay degeneración, es igualmente diagonal. Por ser matemáticamente válida la correspondencia entre matrices infinitas y operadores lineales, concluimos que en mecánica clásica es posible hacer corresponder a cada variable dinámica un operador lineal. Ejemplo 12.1.1 Hallar las matrices clásicas para q, p y H de un oscilador armónico lineal. Las expresiones de q y p en variables acción-ángulo dadas en el ejemplo 10.3.1, permiten obtener fácilmente los coeficientes de Fourier: 1/2 I qα−β (I) = i (−δα,β+1 + δα,β−1 ) 2mω (12.29) 1/2 Imω (δα,β+1 + δα,β−1 ) pα−β (I) = 2 Usando la definición (12.6) se sigue que: 1/2 α ∆I qα,β = i (−δα,β+1 + δα,β−1 ) 2mω pα,β = α ∆Imω 2 1/2 (δα,β+1 + δα,β−1 ) Las matrices adjuntas correspondientes son: 1/2 1/2 (α + 1) ∆I (α − 1) ∆I ⋆ qβ,α = i δα,β−1 − i δα,β+1 2mω 2mω p⋆β,α 1/2 1/2 (α − 1) ∆Imω (α + 1) ∆Imω δα,β−1 + δα,β+1 = 2 2 (12.30) (12.31) Corespondencia con la mecánica cuántica de Heisenberg / 555 Vemos claramente que si α ≫ 1 las matrices de q y p son autoadjuntas. La matriz hamiltoniana es: Hα,β = α ∆I ωδα,β (12.32) Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los diferentes valores de la energı́a del oscilador armónico. Por ser H positivo, resulta que: Hα,β = 0 para α<0 (12.33) Además por ser ∆I pequeño, los valores propios de H son muy próximos entre sı́, formando un continuo en el lı́mite ∆I → 0. 12.2. Corchetes de Poisson y conmutadores de matrices clásicas En contradicción con lo corrientemente aceptado, la mecánica clásica admite la representación de las variables dinámicas mediante matrices no conmutativas aproximadamente hermı́ticas. Esta representación permite asociar conmutadores de matrices clásicas con los corchetes de Poisson. Los resultados cuánticos se obtienen formalmente colocando ∆I = h̄. Conmutadores clásicos. El conmutador de las matrices de dos variables dinámicas f y g es: X (fβ,~ (12.34) ~ α gα ~ α fα ~ ′ − gβ,~ ~′ ) ~ ,β ~ ,β α ~ En términos de las amplitudes de Fourier de f y g, (12.34) toma la forma: i Xh ~ ~ ∆I) f ~ ′ (~ fβ−~ (~ α ∆I) − g ( β α ∆I) (12.35) ′ ~ α (β ∆I) gα ~ ~ ~ −β β−~ α α ~ −β α ~ Notemos que la siguiente expresión vale cero: i Xh ~ ~ ~ ~ fβ−~ ( β ∆I) g ( β ∆I) − g ( β ∆I) f ( β ∆I) =0 ~ α ~′ ~ α ~′ α ~ −β β−~ α ~ −β (12.36) α ~ En efecto, cada αν toma valores entre −∞ y +∞. Si cambiamos en los términos ~ ′ , entonces cada δν negativos de (12.36) a α ~ por ~δ mediante la fórmula β~ − α ~ = ~δ − β ′ ′ tomará valores entre βν + βν − ∞ y βν + βν + ∞, o sea entre −∞ y +∞. Entonces por cada término en (12.36) con signo + hay uno con signo −. Matrices de corchetes de Poisson. El corchete de Poisson de dos variables dinámicas es: [f, g] = ∂f ∂g ∂f ∂g · − · ∂ϕ ~ ∂ I~ ∂ I~ ∂ ϕ ~ (12.37) 556 / Mecánica clásica avanzada La serie de Fourier del corchete de Poisson es: X X ∂gm ∂fm ~ ~ ~ ϕ ~ [f, g] = i ~n · f~n ei(~n+m)· − g ~ ~ ~n ∂ I ∂ I m ~ ~ n (12.38) Las componentes de Fourier de [f, g] pueden escribirse en términos de las de f y g ası́: [f, g]~l = i X ~ n ∂g~l−~n ∂f~l−~n ~n · f~n − g~n ∂ I~ ∂ I~ ~−β ~ ′ y a ~n por β~ − α Cambiando a ~l por β ~ , se sigue: X ∂gα~ −β~ ′ ∂fα~ −β~ ′ ~ [f, g]β− = i( β − α ~ ) · f − g ~ β ~ α ~ α ~′ β−~ β−~ ∂ I~ ∂ I~ α ~ (12.39) (12.40) En esta expresión el corchete de Poisson depende de I~ = β~ ∆I; por tanto las ~ componentes de Fourier de f y g serán también funciones de β∆I. Si se realiza un ~ ∆I, se sigue que: cambio infinitesimal en I~ dado por (~ α − β) gα~ −β~ ′ ~ ∆I = g ~ ′ (~ ~ · (~ α − β) ~ ′ (β ∆I) α ~ −β α ∆I) − gα ~ −β ∂ I~ (12.41) ~ ≪ |~ ~ debido a que |~ α − β| α|, |β|. Entonces el corchete de Poisson puede escribirse en la forma: [f, g]β− ~ β ~′ = i −i X h ~ ~ fβ−~ α ∆I) − gβ−~ α ∆I) ~ α (β ∆I)gα ~ ′ (~ ~ α (β ∆I)fα ~ ′ (~ ~ − β ~ − β ∆I (12.42) α ~ aquı́ hemos usado la identidad (12.36). ~ ∆I, siendo por tanto [f, g] ~ ~ ′ Notemos que en el lado derecho de (12.42) I~ = β β−β ~ ∆I. Entonces la definición (12.6) nos permite identificar el lado izquierdo función de β de (12.42) con [f, g]β, ~β ~ ′ . Comparando a (12.35) con (12.42) obtenemos el resultado: [f, g]β, ~β ~′ = −i ˜ (f g̃ − g̃f˜)β− ~ β ~′ ∆I (12.43) Vemos que la matriz del corchete de Poisson de dos variables dinámicas puede expresarse como el conmutador de las correspondientes matrices clásicas, multiplicado por −i/∆I: gg] = [f, −i ˜ (f g̃ − g̃ f˜) ∆I (12.44) En conclusión, en la mecánica clásica es posible asociar a las variables dinámicas un álgebra no conmutativa que coincide con el álgebra de los corchetes de Poisson. Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson, para un oscilador armónico. Corespondencia con la mecánica cuántica de Heisenberg / 557 De (12.30) se sigue: X i ∆I p qβ,α pα,β ′ = β (12.45) 2 α i p h p p p β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2 × − β ′ + 1 δβ,β ′ +2 + con una expresión análoga al permutar a p con q. El valor del conmutador es: X (qβ,α pα,β ′ − pβ,α qα,β ′ ) = α i ∆I p p p β β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′ (12.46) donde la segunda relación resulta de la suposición β ≫ 1. Según (12.43) y (12.46) la matriz de los corchetes de Poisson debe ser: (12.47) [q, p]β,β ′ = δβ,β ′ Si se aplica directamente (12.40) y se usa el siguiente resultado: 1/2 X X ∂pα−β ′ I i(β − α) qβα = i(β − α) i ∂I 2mω α α 1 mω 1/2 ×(−δβ,α+1 + δβ,α−1 ) (δα,β ′ +1 + δα,β ′ −1 ) (12.48) 2 2I y la expresión análoga con q y p intercambiados, se obtiene igualmente (12.47). Obviamente, la matriz de [q, p] = 1 tiene sólo unos en la diagonal siendo ceros los demás elementos. Ejemplo 12.2.2 Evaluar la matriz del corchete de Poisson de H con q para un oscilador armónico. y, La matriz hamiltoniana está dada por (12.32). En consecuencia: 1/2 X β ∆I ′ (−δβ,β ′ +1 + δβ,β ′ −1 ) Hβ,α qα,β = β ∆I ωi 2mω α X α qβ,α Hα,β ′ = i β ∆I 2mω 1/2 β ′ ∆I ω(−δβ,β ′ +1 + δβ,β ′ −1 ) El conmutador es entonces: 1/2 X βω ∆I (−δβ,β ′ +1 − δβ,β1′ ) (Hβ,α qα,β ′ − qβ,α Hα,β ′ ) = i ∆I 2m α Según (12.43) y (12.51), el corchete de Poisson es: 1/2 Iω [H, q]β−β ′ = − (δβ,β ′ +1 + δβ,β ′ −1 ) 2m que, como debe ser, coincide con la matriz de q̇. (12.49) (12.50) (12.51) (12.52) 558 / Mecánica clásica avanzada 12.3. Problemas mecánicos a la manera de Heisenberg En su trabajo de julio de 1925 Heisenberg señala que la dinámica de un problema en la vieja mecánica cuántica comprende dos aspectos: (i) La integración de las ecuaciones de movimiento, ÿ + f (y) = 0. (ii) La determinación H de las constantes de movimiento a través de la cuantización de la variable de acción, p dq = 2παh̄ = 2πI. La condición (ii) se puede expresar en la forma: I X mẋ dx = 2πm xn (I) x−n (I) n2 ω(I) = 2πI (12.53) n siendo xn los coeficientes de Fourier de x. Como x es real, x−n = x⋆n . Una forma más compacta de la condición (ii) es entonces: m X n n ∂ nω(I) |xn (I)|2 = 1 ∂I (12.54) llamada en la vieja mecánica cuántica regla de suma de Kuhn-Thomas. La generalización a varios grados de libertad es inmediata: X ∂ m (12.55) ~n · ~n · ~ω (I) |x~n (I)|2 = 1 ∂ I~ ~ n La matriz de la forma (12.6) asociada con x es: xα~ ,~α′ = xα~ −~α′ (~ α ∆I) (12.56) Entonces (12.55) se puede escribir como: i X ∂ h (~ α − α~′ ) · ω ~ (I) |xα~ ,~α′ (I)|2 = 1 (~ α−α ~ ′) · m ∂ I~ ′ (12.57) Usando una expresión análoga a (12.41) podemos escribir también: X 2m (~ α−α ~ ′ ).~ω (~ α ∆I) |xα~ ,~α′ |2 = ∆I (12.58) α ~ α ~′ Notemos que la regla de suma de Thomas-Kuhn no es otra cosa que el corchete de Poisson de x y p. De la relación general (12.43), y del hecho de ser x y p variables canónicamente conjugadas, se sigue que: X (xβ,~ (12.59) ~ α pα ~ ′ − pβ,~ ~ α xα ~ ′ ) = i ∆I δβ, ~β ~′ ~ ,β ~ ,β α ~ Teniendo en cuenta que: ~ ·ω pα~ β~ = mi(~ α − β) ~ α~ xα~ ,β~ ′ Las ecuaciones (12.59) y (12.60) nos dan, para β~ = β~ ′ , la relación (12.58). (12.60) Corespondencia con la mecánica cuántica de Heisenberg / 559 Entonces según Heisenberg, la ecuación de movimiento ÿ + f (y) = 0 y la condición sobre el conmutador de x y p dan lugar a un sistema de ecuaciones que determina unı́vocamente las componentes de la matriz de x y los valores de energı́a del sistema. Las fórmulas que hemos obtenido son idénticas a las de Heisenberg, reemplazando a ∆I por h̄. ¿En dónde están entonces las diferencias de fondo entre las mecánicas cuántica y clásica?: (i) En la identificación de las matrices fα~ ,β~ con transiciones entre los estados cuánticos ~ caracterizados por α ~ y β. (ii) En señalar que ∆I no puede ser arbitrariamente pequeño sino que toma el valor h̄, o sea que I~ está necesariamente cuantizada. (iii) En reemplazar a (~ α−α ~ ′) · ~ ω (~ α ∆I) ≈ (~ α−α ~ ′ ) · ~ω (~ α′ ∆I) por la frecuencia de Bohr ωα~ ,~α′ = (Eα~ − Eα~ ′ )/h̄ asociada a la transición entre los estados cuantizados caracterizados por α ~ yα ~ ′ . Esto equivaldrı́a a asociar al “estado clásico α ~ ” la energı́a Eα~ = ∆I α ~ ·ω ~ de modo que (Eα~ − Eα~ ′ )/∆I = (~ α−α ~ ′ ) · ~ω serı́a un armónico. Esta asociación es acorde con la regla de combinación de frecuencias de Bohr, pero no predice las energı́as correctas, pues, por ejemplo, para un oscilador armónico deberı́an ser Eα = ∆I (α + 1/2)ω; por esto Heisenberg propuso no asumir a priori una expresión para las ωα~ ,~α′ , sino más bien obtenerlas como un resultado. (iv) En señalar que debe existir un estado base del cual no puede salir el sistema emitiendo radiación; xα0 ,α0 −1 = 0 si α0 caracteriza el estado base. Con sólo estas cuatro condiciones el formalismo clásico desarrollado en este capı́tulo da lugar al formalismo de la mecánica cuántica según Heisenberg. Las reflexiones acerca del álgebra de operadores no conmutativos caben perfectamente dentro del esquema clásico. Ejemplo 12.3.1 Resolver el oscilador armónico lineal en la mecánica cuántica de Heisenberg.5 La ecuación de movimiento ẍ + ω02 x = 0 conduce a una solución para los elementos de la matriz de x de la forma: xα,β cos(ωα,β t) (12.61) donde los elementos de la matriz x̃ y las frecuencias ωα,β son cantidades a determinar. La condición adicional (12.58) nos da: X 2m (12.62) ωα,α′ |xα,α′ |2 = h̄ α′ La ecuación de movimiento nos da: 2 (ωα,β − ω02 ) xα,β = 0 (12.63) ωα,β están asociadas a las transiciones α → β: h̄ωα,β = Eα − Eβ 5 Véase, van der Waerden, Op. cit. (12.64) 560 / Mecánica clásica avanzada siendo Eα y Eβ las energı́as de los estados α y β. Esta ecuación nos dice que para cada α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que necesariamente: (Eα − Eβ ′ )2 = h̄2 ω02 (12.65) Esta es una ecuación cuadrática en Eβ ′ , con las soluciones: Eβ ′ = Eα ± h̄ω0 (12.66) lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ . Para éstos dos β ′ las frecuencias satisfacen la relación: (12.67) ωα,β ′ = −ωα,β ′′ Entonces (12.62) nos dice que: 2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h̄ (12.68) Los elementos de la matriz energı́a son: Hα,β = = (p2 )α,β mω02 (x2 )α,β + 2m 2 X pα,β ′ pβ,β ′ ω02 mxα,β ′ xβ ′ ,β + 2m 2 ′ (12.69) β De (12.60) se sigue que: X xα,β ′ xβ ′ ,β Hα,β = m ω02 − ωα,β ′ ωβ ′ ,β 2 ′ (12.70) En particular para α = β tenemos: Hα,α = mω02 |xα,β ′ |2 + |xα,β ′′ |2 (12.71) β Hay dos posibilidades, que β ′′ exista o que no exista. Si β ′′ no existe y ωβ ′ ,α = ω0 , de (12.68) se sigue que: 2mω0 |xα,β ′ |2 = h̄ (12.72) y de (12.71) se sigue que: Eα = Hα,α = mω02 |xα,β ′ |2 = h̄ω0 2 (12.73) Como Eα 6= Eβ si α 6= β, se sigue que hay a lo sumo un ı́ndice α = α0 para el cual se cumple (12.73). Si tal α0 existe, podemos formar la secuencia de números α0 , α1 , α2 , ...αk , αk+1 , ... tales que α′k = αk+1 y α′′k = αk−1 . Estos números describen los estados para los cuales Ek+1 > Ek . Claramente, α′0 = α1 y α′′0 no existe. De (12.30) podemos adelantar que αk+1 = αk + 1. Para k > 0, (12.71) y (12.68) nos dan: (12.74) Hαk ,αk = mω02 |xαk ,αk+1 |2 + |xαk ,αk−1 |2 Corespondencia con la mecánica cuántica de Heisenberg / 561 h̄ = 2mω0 |xαk ,αk+1 |2 − |xαk ,αk−1 |2 (12.75) La ecuación (12.75) es una fórmula de recurrencia que permite a partir de |xα0 ,α1 |2 obtener cualquier |xαk ,αk+1 |2 . Ası́ que, al usar |xα0 ,α1 |2 = h̄/(2mω0 ) y |xα0 ,α−1 |2 = 0: |xαk ,αk+1 |2 = h̄(k + 1) 2mω0 (12.76) También esto nos permite identificar la secuencia α0 , α1 , α2 , ... con los números enteros 0, 1, 2, ... Entonces la relación de recurrencia nos dice que: |xk,k+1 |2 = h̄(k + 1) ; 2mω0 |xk,k−1 |2 = h̄k 2mω0 Por tanto (12.74) nos da, en vez del resultado clásico (12.32): 1 Ek = h̄ω0 k + 2 (12.77) (12.78) Como puede verse, lo especı́fico del tratamiento cuántico de este problema estriba en: (i) Tomar a ∆I como h̄. (ii) Tomar en vez de (α − α′ )ω0 a ωα,α′ = (Eα − Eα′ )/h̄. (iii) Suponer la existencia de un estado base. 12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana Para un sistema múltiplemente periódico la matriz hamiltoniana clásica puede obtenerse de los coeficientes de Fourier de la función hamiltoniana H(q, p). La ecuación de Hamilton-Jacobi (sección 9.6), se caracteriza por definir la función de Hamilton caracterı́stica mediante la cual se realiza la transformación canónica que lleva a unas nuevas veriables, donde todas las coordenadas son cı́clicas, esto es: α ∆I) δα~ ,β~ H(q, p) = H(I) ⇒ H α~ ,β~ = H(~ (12.79) como en la ecuación (12.32). Entonces la transformación canónica buscada diagonaliza la matriz hamiltoniana, cuyos elementos son Hα~ −β~ (~ α ∆I) = Hα~ ,β~ . Las cantidades H(~ α ∆I), donde α ~ recorre todos los vectores l-dimensionales de componentes enteras, son los valores propios de la matriz infinita Hα~ ,β~ , que se obtiene resolviendo la ecuación secular (12.27). Los vectores propios de la matriz hamiltoniana son las cantidades gα~ ,~α′ , que según (12.11) realizan la transformación de las variables angulares ϕν a las ϕν . O sea que las gα~ ,~α′ definen la función de Hamilton caracterı́stica de la transformación canónica, para el tipo F3 , dada por: ϕ ~ =− ∂ Σ(I, ϕ) ; ∂ I~ Como gα~ ,~α′ (I) es: gα~ ,~α′ (I) = 1 (2π)l I ~I = − ∂ Σ(I, ϕ) ∂ ~ϕ ′ ~ ~ α ·ϕ l ~ dϕ e−i~α.ϕ+i~ (12.80) (12.81) 562 / Mecánica clásica avanzada de (12.80) se sigue que: gα~ ,~α′ (I) = 1 (2π)l I ∂ ′ ~ ei~α· ∂ I~ Σ(I,ϕ)+i~α ·ϕ dl ~ϕ Además, la fórmula inversa es: # " X ∂Σ ϕ −i~ α′ ·~ i~ α· = ln gα~ ,~α′ e ∂ I~ α ~′ (12.82) (12.83) Estas fórmulas muestran la conexión entre las transformaciones canónicas y las matrices unitarias que realizan los cambios de representación de las matrices clásicas, con clara correspondencia con la mecánica cuántica. Ejemplo 12.4.1 Estudiar la diagonalización de la matriz hamiltoniana de un oscilador armónico sometido a una fuerza constante. Fı́sicamente el problema es muy simple porque el único efecto de la fuerza constante es cambiar la posición de equilibrio y desplazar el valor de la energı́a sin alterar la frecuencia de las oscilaciones. Sin embargo es ilustrativo de la conexión entre la solución de la ecuación de Hamilton-Jacobi y la diagonalización de la matriz hamiltoniana. Si H0 es el hamiltoniano del oscilador no perturbado, el hamiltoniano de este problema será: H = H0 + λx y en las variables acción-ángulo de H0 toma la forma: 1/2 2I sen ϕ H = Iω + λ mω (12.84) (12.85) Queremos pasar a las variables acción-ángulo I − ϕ del hamiltoniano H mediante una transformación canónica. La ecuación de Hamilton-Jacobi del problema es, según las fórmulas (9.286): 1/2 2I ∂Σ Iω − λ −E (12.86) sen mω ∂I Entonces: ϕ=− mω 1/2 −1 ∂Σ λ (E − Iω) = sen−1 ∂I 2I Si llamamos A = λ21/2 /(mω)1/2 , y notamos que: 2 2 A ∂Σ A E(I) = Iω − = −ω − 2ω ∂ϕ 2ω entonces la ecuación de Hamilton-Jacobi para Σ es: 2 ωI 1/2 ∂Σ A ∂Σ = I −1/2 + ωI −1/2 + sen ∂I A ∂ϕ 2ω (12.87) (12.88) (12.89) Corespondencia con la mecánica cuántica de Heisenberg / 563 Esta ecuación resulta complicada, razón por la cual desistiremos de la función generatriz del tipo F3 . Notemos que la función generatriz del tipo F3 para la transformación inversa se obtiene cambiando en −F3 las variables I, ϕ por I, ϕ (ver sección 9.5). Entonces las fórmulas para la transformación inversa son: ϕ= ∂F3 (I, ϕ) ; ∂I I= ∂F3 ∂ϕ (12.90) que coinciden con las fórmulas de la transformación original mediante una función generatriz del tipo F2 . F2 es solución a la ecuación: 1/2 ∂F2 ∂F2 ω sen ϕ − E(I) = 0 (12.91) +A ∂ϕ ∂ϕ o sea: 1/2 2 ∂F2 Eω E A2 A 2 2 I= sen ϕ sen ϕ + 4 sen ϕ + (12.92) = − ∂ϕ 2ω 2 ω ω A2 Notemos que: sen ϕ 1 1 ∂ ∂Σ · = − ∂ϕ ∂E ω ω (1 + 2mEω 2 λ−2 − cos2 ϕ)1/2 (12.93) y en consecuencia: " −1/2 # 2mEω 2 ϕ 1 ∂Σ2 −1 cos ϕ 1 + = + sen ∂E ω ω λ2 H De la expresión para I, 2πI = I dϕ se deduce que: E = Iω − λ2 2mω 2 (12.94) (12.95) de donde ω −1 dE/dI = 1, y, según (12.82) y (12.94), la matriz asociada a esta transformación, que es la inversa de gα,β , es: I ′ −1 1 ei(α−α )ϕ−iα sen (cos ϕ/C) dϕ (12.96) Γα,α′ = 2π donde C = (1 + 2mEω 2 /λ2 )1/2 . Notemos que: e−iα sen −1 x = e−iαπ/2 [−iUα (x) + Tα (x)] (12.97) donde T y U son polinomios de Chevishev de primera y segunda clase respectivamente. En consecuencia: I cos ϕ ′ 1 Γα,α′ = ei(α −α) ϕ−i απ/2 Tα dϕ 2π C (12.98) I cos ϕ ′ 1 dϕ ei(α −α) ϕ−i(α+1)π/2 Uα + 2π C 564 / Mecánica clásica avanzada No es simple hallar una expresión general para la transformada de Fourier de Tα (cos ϕ/C) y de Uα (cos ϕ/C). Aun conociendo la forma analı́tica de Γα,β , resulta difı́cil obtener una expresión cerrada para las sumatorias infinitas en (12.12). Por esto lo más cómodo es realizar los cálculos en forma numérica. En este caso es necesario truncar las matrices para hacerlas finitas y proceder a realizar las integraciones mediante un algoritmo como el de Gauss. Una vez obtenida la matriz Γ el proceso de diagonalización es simple. Como puede verse, el método para obtener la matriz gα~ ,β~ a partir de la ecuación de Hamilton-Jacobi puede ser útil en problemas cuánticos realistas en que sea especialmente difı́cil diagonalizar directamente la matriz hamiltoniana. 12.5. Teorı́a de perturbaciones con matrices clásicas Veremos que las fórmulas de la teorı́a clásica de perturbaciones, de primero y segundo orden, pueden escribirse en forma análoga a las correspondientes fórmulas de la mecánica cuántica para las correcciones a la energı́a. Perturbaciones de primer orden. Para el caso no degenerado la corrección de primer orden a la energı́a está dada por la fórmula (11.27): H (1) (I) = hH1 (ϕ0 , I)i (12.99) Si la función H1 se expresa como una serie de Fourier, la corrección de primer orden está determinada por los elementos diagonales de la matriz correspondiente: H (1) (~ α ∆I) = H1 α~ ,~α (12.100) que corresponde en mecánica cuántica con h~ α|H1 |~ αi. Para el caso degenerado, antes de hallar la corrección de primer orden, es necesario encontrar las variables acción-ángulo “correctas” o “estabilizadas” en la aproximación cero. Para ello es necesario buscar entre los posibles conjuntos de variables acción-ángulo degeneradas Iσ0 − ϕ0σ de orden cero, aquel con el cual la perturbación no depende de las variables angulares. A su vez esto se consigue resolviendo la ecuación de HamiltonJacobi (11.110). En términos de matrices esto se logra diagonalizando la matriz formada con los coeficientes de Fourier de la perturbación respecto a las variables degeneradas. Simultáneamente se hallan los valores propios perturbados al primer orden y la transformación canónica que lleva a las variables “correctas” de orden cero, mediante la fórmula: h i (1) det H1 ~σ,σ~′ − H~σ δ~σ ,~σ′ = 0 (12.101) donde ~σ y ~σ ′ son vectores de l − s componentes enteras, y: XX (1) g~σ+,~σ′ H~σ′ ,~σ′′ g~σ′′ ,~τ = H~σ δ~σ ,~τ ~ σ′ (12.102) ~ σ′′ En mecánica cuántica, la matriz que diagonaliza la perturbación proporciona los coeficientes con los cuales se forman las funciones de onda exactas de la aproximación cero como combinaciones lineales de las funciones de onda degeneradas. Ver la sección Corespondencia con la mecánica cuántica de Heisenberg / 565 §39 del libro de mecánica cuántica de Landau-Lifshitz, Op. cit. Perturbaciones de segundo orden. Según la fórmula (11.40), la corrección de segundo orden a la energı́a está dada por: H (2) (~ α ∆I) = − |Aα~ ,β~ |2 1X ~ · ∂ (~ α − β) ~ · ~ω 2 ∂ I~ (~ α − β) ~ (12.103) β6=α ~ donde Aα~ ,β~ está dada por el coeficiente de Fourier de la expansión de H1 en las variables acción-ángulo no perturbadas. Tanto ω ~ como A ~ tienen como argumento a I~ = α ~ ∆I. α ~ ,β Como en (12.41), podemos escribir: |Aα~ ,β~ |2 ∆I ~ · ∂ (~ α − β) = ~ ·ω 2 ∂ I~ (~ α − β) ~ |Aα~ ,β~ |2 ~ · ~ω (~ α − β) α ~ ∆I − |Aα~ ,β~ |2 ~ · ~ω (~ α − β) (12.104) ~ ∆I/2 (~ α+β) ~−α El primer término de (12.104) cambia de signo al cambiar a α ~ − β~ por β ~ . Por tanto en la sumatoria (12.103) las contribuciones provenientes del primer término de (12.104) se cancelan. En el denominador del segundo término de (12.104), ~ω está evaluada ~ ∆I/2. Si reemplazamos al denominador de la siguiente manera: en (~ α + β) " # ~ ∆I (~ α + β) ~ ·~ ~ · ~ω (β ~ ∆I) (~ α − β) ω →α ~ · ~ω(~ α ∆I) − β (12.105) 2 ~ ∆I|2 en la expresión para H (2) , con lo cual cometemos un error del orden de |(~ α − β) llegamos a la fórmula: H (2) (~ α ∆I) = X ~ =α β6 ~ |Aα~ ,β~ |2 ~ ∆I) ∆I α ~ ·ω ~ (~ α ∆I) − ∆I β~ · ~ω(β (12.106) Si llamamos: α ~ ∆I · ~ ω (~ α ∆I) = Eα~ ′ (12.107) ~ ∆I|2 como: La ecuación (12.103) puede escribirse con un error del orden de |(~ α − β) H (2) (~ α ∆I) = X |Aα~ ,β~ |2 ′ ~ β Eα~ − Eβ~ (12.108) que coincide formalmente con la fórmula cuántica de la teorı́a de perturbaciones de segundo orden. 566 / Mecánica clásica avanzada 13 Correspondencia con la mecánica cuántica de Schrödinger Este capı́tulo trata de mostrar la conexión de los trabajos de Hamilton y Jacobi con la formulación de Schrödinger de la mecánica cuántica. Se hará énfasis en la relación existente entre la acción principal de Hamilton y la fase de la función de onda, y entre las soluciones de la ecuación de Liouville y la amplitud de la función de onda. Al pasar de la mecánica clásica a la formulación de Schrödinger son necesarios cambios conceptuales más drásticos respecto a la formulación de Heisenberg, pues se requiere postular la existencia de comportamientos ondulatorios. También presentaremos algunos desarrollos modernos de las ideas de Einstein, Bohr y Sommerfeld acerca de la cuantización de un sistema clásico, debidos a Brillouin, Maslov y Keller. Finalmente obtendremos las fórmulas de la aproximación de W.K.B. 13.1. Ideas de Hamilton acerca de las transformaciones canónicas Hamilton presentó en 1824 un trabajo a la Academia Irlandesa de Ciencias acerca de la conexión entre la dinámica y la óptica. Desde el punto de vista moderno, tal formalismo presenta una conexión entre la dinámica y el lı́mite clásico de la mecánica ondulatoria, y no es aplicable a la óptica por las dificultades resultantes de ser cero la masa del fotón. Según el principio de Fermat las ecuaciones paramétricas de la trayectoria de un rayo de luz, x(l), y(l), z(l), son tales que la siguiente integral es una extremal: Z n(~r(l)) dl (13.1) siendo n el ı́ndice de refracción del medio en el punto ~r. El principio de mı́nima acción aplicado a una partı́cula sometida a un potencial V , ecuación (9.49), expresa que: Z [E − V (~r)]1/2 dl (13.2) 567 568 / Mecánica clásica avanzada tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar variaciones “∆”. La trayectoria de una partı́cula y la de un rayo de luz coinciden haciendo: n(~r) = A [E − V (~r)]1/2 (13.3) En un medio inhomogéneo y anisotrópico n depende no sólo de la posición sino de la dirección de los rayos, esto es, de ~r y ~r˙ . Lo anterior permitirı́a asociar propiedades corpusculares a la luz. Hamilton se propuso elaborar esta conexión dentro de un modelo ondulatorio de la luz teniendo en cuenta que la relación (13.3) es válida independientemente del modelo usado. Es natural partir del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de un frente de ondas en el tiempo t genera una onda secundaria que alcanzará otro punto ~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de ~r a ~r ′ dependerá solamente de ~r y ~r ′ . El lugar geométrico de los puntos alcanzados por la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una función Σ(~r, ~r ′ ), donde ~r hace de parámetro, mediante la fórmula: Σ(~r, ~r ′ ) = t − t′ (13.4) Σ describe el camino óptico entre ~r y ~r ′ y fue llamada por Hamilton función caracterı́stica del medio. Según el principio de Huygens, la envolvente de las ondas secundarias en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la figura 13.1. α′′ α′ α r′ N r″ T Σ′ r Σ S″ S′ S Figura 13.1 Propagación en el espacio de la envolvente S Denotemos por α ~ = (α1 , α2 , α3 ) a los cosenos directores de la normal a S en el punto ~r y por α ~ ′ a los cosenos directores de la normal a S ′ en el punto ~r ′ . Decimos que ~r ′ corresponde con ~r si la onda secundaria que emerge de ~r toca a la envolvente S ′ en ~r ′ . La lı́nea descrita por los vectores α ~, α ~ ′, α ~ ′′ , ..., que llamamos N , es ortogonal a los Corespondencia con la mecánica cuántica de Schrödinger / 569 frentes de onda. Como S ′ es la envolvente de las superficies Σ correspondientes a los puntos de S, las superficies Σ también son ortogonales a la lı́nea N en los puntos ~r, ~r ′ , ~r ′′ , ... Si denotamos por d~r ′ a un vector tangente a la superficie S ′ en ~r ′ , se cumple que: ∂Σ(~r, ~r ′ ) · d~r ′ = 0 ∂~r ′ (13.5) Como α ~ ′ son los cosenos directores de N en el punto ~r ′ , también serán ortogonales a d~r . Se sigue entonces que: ∂Σ(~r, ~r ′ ) ′ ′ · d~r ′ = 0 (13.6) − λ α ~ ∂~r ′ ′ donde λ′ es cierta función de ~r ′ . La ecuación (13.6) implica que: 1 ∂Σ 1 ∂Σ 1 ∂Σ = ′ = ′ α′1 ∂x′ α2 ∂y ′ α3 ∂z ′ (13.7) Similarmente, en el punto ~r se debe cumplir: 1 ∂Σ 1 ∂Σ 1 ∂Σ = = α1 ∂x α2 ∂y α3 ∂z (13.8) Además: α′1 2 + α′2 2 + α′3 2 = 1 (13.9) Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ , y , z , α′1 , α′2 , α′3 ) en términos de (x, y, z, α1 , α2 , α3 ). Entonces, dada una función caracterı́stica del medio Σ, las seis ecuaciones (13.4) y (13.7) a (13.9) describen unı́vocamente la lı́nea de las normales N en el medio óptico anisotrópico. Es necesario aclarar que la lı́nea N no necesariamente coincide con la lı́nea T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio óptico isotrópico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los vectores α ~, α ~ ′, α ~ ′′ , ... La función Σ determina una transformación en el espacio que cambia cualquier superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ correspondiente a ~r ′ . Sophus Lie por esta razón llama a las transformaciones (~r, α ~ ) → (~r ′ , α ~ ′) 1 transformaciones de contacto. Entonces cada función Σ define una transformación de contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7) y (13.8) se sigue que: ′ ′ ∂Σ(~r, ~r ′ ) = λ~ α; ∂~r 1 En ∂Σ(~r, ~r ′ ) = λ′ α ~′ ∂~r ′ (13.10) dinámica hamiltoniana se usa el nombre de transformaciones canónicas para designar a estas transformaciones. 570 / Mecánica clásica avanzada Entonces bajo desplazamientos arbitrarios d~r y d~r ′ , Σ cambia de valor en: dΣ = λ~ α · d~r + λ′ α ~ ′ · d~r ′ (13.11) De acuerdo con (13.4), dΣ = dt′ − dt. Si tomamos el punto ~r fijo y consideramos dos frentes de onda próximos, en los puntos ~r ′ y ~r ′ + d~r ′ , entonces dt′ será la diferencia de tiempo entre esos frentes de onda, dada por: dt′ = dl′ ′ n c (13.12) donde c es la velocidad de la luz en el vacı́o, dl′ la distancia normal entre los dos frentes de onda finales y n′ es el ı́ndice de refracción del medio en el punto ~r ′ en la dirección α′ normal a S ′ . De (13.11) y (13.12) se sigue entonces: dl′ ′ n = λ′ α ~ ′ · d~r ′ c (13.13) Como para el desplazamiento de ~r ′ que consideramos se cumple que d~r ′ = α ~ ′ dl′ , ′ ′ ′ podemos escribir dl = α ~ .d~r . Obtenemos entonces el resultado: λ′ = n′ ; c λ=− n c (13.14) donde la segunda expresión se sigue de argumentos similares, tomando a ~r ′ fijo y variando el punto inicial ~r. En conclusión: dΣ = n n′ ′ α ~ · d~r ′ − α ~ · d~r c c (13.15) donde n′ y n son funciones respectivamente de (~r ′ , α ~ ′ ) y (~r, α ~ ), o equivalentemente de (~r ′ , ~r˙ ′ ) y (~r, ~r˙ ), porque debe existir una relación definida entre α ~ y ~r˙ , y α ~ ′ y ~r˙ ′ . También dΣ puede escribirse como: dΣ = ~ p ′ · d~r ′ − p~ · d~r (13.16) los vectores ~ p y p~ ′ tienen dimensiones de T L−1 y su magnitud es menor en los puntos donde la velocidad de la luz es mayor y viceversa. Si tomamos ahora los tiempos t y t′ infinitesimalmente próximos, también lo serán los puntos ~r y ~r ′ , lo mismo que α ~ yα ~ ′ , y n y n′ . Decimos en este caso que la transformación de contacto es infinitesimal: ~r ′ = ~r + ~r˙ ∆t ; ~ ′ = p~ + ~p˙ ∆t p (13.17) Como Σ(~r, ~r) = 0, también se cumple que, al orden más bajo en ∆t: Σ(~r, ~r ′ ) = ∂Σ(~r, ~r ′ ) ∂~r ′ ~ r ′ =~ r · ~r˙ ∆t (13.18) Definimos la función M (~r, ~r ′ ) como: M (~r, ~r˙ ) = ∂Σ(~r, ~r ′ ) ˙ · ~r ∂~r ′ ~ r ′ =~ r = ~p · ~r˙ (13.19) Corespondencia con la mecánica cuántica de Schrödinger / 571 Entonces se sigue que: ∂M (~r, ~r˙ ) ∂Σ(~r, ~r ′ ) = ∂~r ′ ∂~r˙ = ~p (13.20) ~ r ′ =~ r Según (13.18) y (13.19), cuando ~r y ~r ′ son infinitesimalmente cercanos: Σ(~r, ~r ′ ) = M (~r, ~r˙ ) ∆t (13.21) Por tanto, para una separación finita entre ~r y ~r ′ se cumple: Z ~r ′ Z t′ ′ ˙ ~p · d~r M (~r, ~r) dt = Σ(~r, ~r ) = (13.22) ~ r t La longitud del camino óptico entre ~r y ~r ′ también puede escribirse, usando (13.15) y (13.16), como: Z ~r ′ Z ′ n 1 ~r ′ Σ(~r, ~r ) = α ~ · d~r = n dl (13.23) c c ~r ~ r Entonces, el principio de Fermat, (13.1), equivale a la condición de que Σ sea una extremal. La condición ∆Σ = 0 determina la forma de la lı́nea de los rayos T de la figura 13.1. Comparando a (13.23) con (13.2) vemos que M es proporcional a la energı́a cinética del problema mecánico equivalente. La transformación de contacto (13.10), cuya función generatriz es Σ, puede expresarse como una transformación canónica libre de primera clase: p~ = − ∂Σ(~r, ~r ′ ) ; ∂~r ~′ = p ∂Σ(~r, ~r ′ ) ∂~r ′ (13.24) donde (~r ′ , p~ ′ ) son las “viejas” variables canónicas y (~r, p~) las “nuevas”. Comparando con los resultados de la sección 9.3, fórmula (9.44), encontramos que Σ coincide formalmente con la acción de Lagrange y M con ~p · ~q. Sin embargo hay una discrepancia dimensional a través de un factor constante B con dimensiones de energı́a. O sea que BΣ es la acción de Lagrange y B~ p es el momento mecánico. La acción de Lagrange BΣ obedece la ecuación de Hamilton-Jacobi independiente del tiempo, que para una partı́cula de masa m en un potencial V es: 2 ∂Σ V E 1 + 2 = 2 (13.25) 2m ∂~r B B Usando la conexión dada por (13.3), podemos escribir a (13.25) como: 2 ∂Σ 2m 1 = 2 2 n2 = 2 n2 ∂~r A B c (13.26) donde c es una constante con dimensiones de velocidad: c= AB (2m)1/2 (13.27) 572 / Mecánica clásica avanzada Formalmente (13.26) es la ecuación de la eiconal de la óptica,2 que permite encontrar a Σ si se conocen las propiedades ópticas del medio expresadas a través de n. Nótese que la relación (13.27) aparentemente no permite el concepto de fotón entendido como una partı́cula de masa cero. Sin embargo el formalismo resulta perfectamente adaptado a la descripción de propiedades ondulatorias de partı́culas de masa diferente de cero. Podemos concluir que a la acción de Lagrange de un sistema mecánico se le puede asociar la onda secundaria emergente de un punto en cierto movimiento de propagación de ondas. Este resultado sirvió a Schrödinger para hallar la conexión entre la mecánica y la óptica clásicas por una parte, y la mecánica ondulatoria (mecánica cuántica) por otra. Sin embargo, la ecuación de la eiconal (13.26) no coincide con la ecuación de ondas más que en el lı́mite asintótico de pequeñas longitudes de onda, en el cual la óptica ondulatoria coincide con la óptica geométrica. Frecuencia y vector de propagación. Para una onda plana monocromática la amplitud tiene la forma: ~ C = aei(k·~r−ωt+α) (13.28) y para una onda arbitraria: C = aeiϕ (13.29) donde ϕ es la eiconal que obedece la ecuación (13.26) sólo en el lı́mite de ondas cortas. Desarrollando a ϕ en potencias de ~r y t, para ~r y t pequeños se obtiene: ϕ=α+t ∂ϕ ∂ϕ + ~r · ∂t ∂~r (13.30) Como es de esperarse, el frente de ondas emergente de un punto es en las cercanı́as del mismo casi plano, con: ~k = ∂ϕ ; ∂~r ω=− ∂ϕ ∂t (13.31) Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos: S = −Et + BΣ ≈ −Et + B~r · ∂Σ = −Et + B~r · p~ ∂~r (13.32) Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es proporcional a ~k y E proporcional a ω: E = Dω ; p ~= D~ k B (13.33) La función M , según (13.19) puede escribirse como: n(~r, α ~) M (~r, ~r˙ ) = α ~ · ~r˙ c 2 Eiconal viene del griego, icono = imagen. La función eiconal permite localizar imágenes. (13.34) Corespondencia con la mecánica cuántica de Schrödinger / 573 y se denomina la indicatriz del medio óptico en el punto ~r. La velocidad del frente de ondas en el punto ~r en la dirección α ~ tiene magnitud v(~r, α ~ ) = c/n(~r, α ~ ). Por tanto: α ~ · ~r˙ M (~r, ~r˙ ) = ; v(~r, α ~) p~ = α ~ ~v (~r, α ~) = v(~r, α ~) v(~r, α ~ )2 (13.35) Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocromática, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la dirección α ~. ~ en un punto Los vectores ~r˙ y ~p. Exploremos la relación entre los vectores ~r y α dado ~r. Para ello usamos la noción matemática de homotecia, o sea la transformación de cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformación de homotecia con parámetro ǫ respecto a ~r˙ , en un punto ~r, obtenemos: M (~r, ǫ~r˙ ) = ǫ~ p · ~r˙ (13.36) al notar que p~ depende de la dirección de ~r pero no de su magnitud. Por otra parte, consideremos el desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ (véase figura 13.2). La onda secundaria que emerge del punto ~r, en el tiempo ǫ, será, según (13.18): Σ(~r, ~r ′ ) = p~ · ~r˙ ǫ (13.37) Comparando a (13.36) y (13.37) se sigue que Σ y M son iguales al orden de ǫ2 . Cuando el tiempo entre S(t) y S(t + ǫ) es infinitesimal, la onda secundaria emergente de ~r que toca a S(t + ǫ) y la indicatriz del medio óptico en ~r son homotéticas. Si ahora hacemos tender ǫ a cero, obtenemos que en cada punto ~r los vectores α ~ y ~r tienen una relación bien definida. La dirección del plano tangente a la indicatriz en ~r˙ se llama conjugada de la dirección de ~r˙ . O sea que ~r˙ y ~ p son dos vectores conjugados en cada punto ~r. En general ~r˙ no es perpendicular al plano tangente a la indicatriz en ~r˙ . Si el medio es isotrópico, en cada punto ~r la indicatriz será una superficie esférica; en el caso contrario n dependerá de ~r y ~r˙ , con lo cual Σ y p~ dependerán igualmente de ~r˙ , dando lugar a que M no sea esférica (véase figura 13.2). 13.2. Función de distribución de probabilidades Para una partı́cula, la contraparte cuántica de la proyección de un toroide invariante sobre el espacio tridimensional es |ψ|2 , siendo ψ una función propia de tres operadores que conmutan (para un problema de fuerzas centrales, por ejemplo, tales operadores pueden ser H, l2 y lz ). La densidad que describe el ensamble de trayectorias sobre el toroide invariante es ρ, que satisface la ecuación de Liouville (sección 4.8): ∂ρ + [ρ, H] = 0 ∂t (13.38) 574 / Mecánica clásica avanzada T Punto de tangencia r r p Plano tangente a la indicatriz en r Σ(r, r ′) M(r, r ′) S(t) S(t + ε) Figura 13.2 Desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ. Como H no depende de las variables angulares, esta ecuación toma la forma, ∂ρ ∂ρ ∂ρ ∂ρ + ω2 + ω3 =0 + ω1 ∂t ∂ϕ1 ∂ϕ2 ∂ϕ3 (13.39) Como las ων son las “velocidades” sobre el toroide, esta ecuación tiene la forma de una ecuación de continuidad para la densidad ρ: 3 ∂ρ X ∂ (ων ρ) = 0 + ∂t ν=1 ∂ϕν (13.40) Cuando el sistema es estacionario, t no aparece en ρ explı́citamente y por tanto: 3 X ∂ (ων ρ) = 0 ∂ϕ ν ν=1 (13.41) Según esta expresión, el flujo de probabilidad sobre el toroide no tiene divergencia. Por tanto, al aplicar el teorema de Gauss a un tubo de trayectorias: Z (~ ω ρ) · d~σ = 0 (13.42) Como consecuencia, conociendo a ρ en un punto se puede calcular a ρ en cualquier otro punto de la misma trayectoria: ρω = ρ0 ω dσ0 dσ (13.43) donde ω = |~ ω |, y dσ0 es el área de cruce normal al tubo de caracterı́sticas en el punto (~ p0 , ~r0 ). Realmente (13.43) vale en el lı́mite cuando dσ0 tiende a cero, en cuyo caso Corespondencia con la mecánica cuántica de Schrödinger / 575 dσ/dσ0 denota el jacobiano de la aplicación de los puntos de una sección de cruce en otra por medio de las trayectorias: p~0 , ~r0 ρ(~ p, ~r) = ρ(~ p0 , ~r0 ) J (13.44) p~, ~r Una posible solución de (13.41) es una función arbitraria de las variables de acción. Sin embargo no es la más interesante. Función de distribución en el espacio de configuración. Si por algún procedimiento se obtiene una ρ particular, entonces la densidad en el espacio de configuración x − y − z será: Z Q(~r) = ρ(~ p, ~r) d3 p~ (13.45) En el espacio de configuración hay igualmente un flujo de probabilidad, descrito por la ecuación de continuidad para Q: ∂ ∂Q + · (~r˙ Q) = 0 ∂t ∂~r (13.46) donde ~r˙ = ∂H/∂~ p. Cuando Q no depende explı́citamente del tiempo, obedece ecuaciones análogas a (13.41) y (13.42). La ecuación análoga a (13.43) es: Qv = Q0 v0 dA0 dA (13.47) siendo dA un elemento de área en el espacio ordinario, y v = |~r˙ |. Si se conoce a Q sobre una superficie dA0 que corta un tubo de trayectorias caracterı́sticas en el espacio de configuración, (13.47) permite hallar a Q en cualquier otra superficie que corte el mismo tubo de trayectorias. El formalismo de las variables acción-ángulo permite encontrar la densidad de probabilidad Q(~r), en una forma alterna a (13.47) que hace más transparente la conexión con Σ y con la proyección del ensamble de trayectorias en el espacio de fases sobre el espacio de configuración. ~ ϕ Como en ~r(I, ~ ) las I~ son constantes, se sigue que las posibles posiciones de la partı́cula en el espacio de configuración, ~r, están determinadas por las ϕ ~. Entonces el promedio de una función de ~r sobre el toroide invariante puede expresarse como un promedio sobre el espacio de configuración. En efecto: I 1 ~ ϕ f (~r(I, ~ )) d3 ϕ ~ (13.48) hf (~r)i = (2π)3 ~ ϕ La función ~r(I, ~ ), con I~ = constante, puede interpretarse como un cambio de coordenadas de ϕ ~ a ~r. Por tanto (13.48) puede escribirse como: Z ϕ ~ 1 d3~r (13.49) f (~ r ) J hf (~r)i = 3 (2π) ~r 576 / Mecánica clásica avanzada En términos de Q este mismo promedio es: Z hf (~r)i = Q(~r) f (~r) d3~r (13.50) de donde concluimos que Q es esencialmente el jacobiano de la transformación de ϕ ~ a ~r con I~ fijo: −1 ϕ ~ ~r 3 (2π) Q(~r) = J (13.51) =J ~r ϕ ~ Podemos igualmente hallar la función de distribución en el espacio de los momentos: ϕ ~ (13.52) (2π)3 Qp (~ p) = J p~ El lugar geométrico de los puntos para los cuales Q = ∞ se denomina “superficie cáustica”. Para esos puntos, o bien v = 0, o bien las trayectorias se cruzan haciendo que dA = 0. Si la sección de cruce se convierte un una lı́nea, diremos que m1 = 1 y si se convierte en un punto, que m1 = 2. El número de veces que un momento canónico cambie de signo en alguna cáustica lo notaremos m2 . El número m = m1 +m2 determina la fase de la función de onda semiclásica construida con Q y Σ. La fórmula (13.51) permite también interpretar las cáusticas como el lugar geométrico de las singularidades de la aplicación del espacio de fases sobre el espacio de configuración ϕ ~ → ~r. Tales singularidades se denominan lagrangianas. Ejemplo 13.2.1 Hallar la función Q para el problema de Kepler en coordenadas esféricas. En este caso Ir , Iθ e Iϕ son constantes. De las fórmulas que expresan a r, θ y ϕ en términos de las variables angulares ϕr , ϕθ y ϕϕ , dadas en la sección 10.4, se sigue que: (2π)3 Q(~r) = ∂ϕr ∂ϕθ ∂ϕϕ 1 r2 sen θ ∂r ∂θ ∂ϕ (13.53) De la ecuación (10.192) se sigue: ∂ϕr I 1 = 2 ∂r a pr (13.54) La separación de variables en la ecuación de Hamilton-Jacobi para el problema conduce a: ~ r, θ, ϕ) = Σr (Ir , Iθ , Iϕ , r) + Σθ (Iθ , Iϕ , θ) + Σϕ (Iϕ , ϕ) Σ(I, (13.55) de donde se sigue: ∂pθ ∂ϕθ ; = ∂θ ∂Iθ ∂ϕϕ ∂pϕ = ∂ϕ ∂Iϕ (13.56) Como pθ y pϕ están dados por: p2θ = l2 − lz2 ; sen2 θ pϕ = lz (13.57) Corespondencia con la mecánica cuántica de Schrödinger / 577 obtenemos: l ∂ϕθ ; = ∂θ pθ ∂ϕϕ =1 ∂ϕ (13.58) De donde obtenemos finalmente: Q(~r) = mk 1 (1 − ǫ2 )1/2 2 (2π)3 a r sen θ pr pθ (13.59) Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La región descrita por Q(~r) se obtiene también a partir de una órbita individual mediante estas tres operaciones: primero, dejando la órbita fija se toma el conjunto de todas las posiciones de la partı́cula sobre la misma; segundo, dejando fijo el plano de la órbita, se toma el conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco, obteniéndose ası́ una corona sobre el plano de la órbita; finalmente, se toma el conjunto de puntos del espacio obtenido al rotar la corona alrededor del eje z. La región ası́ obtenida resulta ser un elipsoide de revolución con ejes de longitudes rmáx y rmáx cos θmı́n , colocado con el eje menor sobre el eje z, y que además posee en el centro un agujero elipsoidal con ejes de longitudes rmı́n y rmı́n cos θmı́n . Q(~r) vale cero fuera del elipsoide y dentro del agujero, es infinita sobre las superficies de los elipsoides, y en los demás puntos está dada por (13.59). Nótese que los elipsoides interior y exterior son las superficies cáusticas. La región que hemos descrito es, para el caso del átomo de hidrógeno, el lı́mite clásico de la densidad de probabilidad cuántica |ψnlm |2 . Vemos que no presenta los nodos angulares 2 caracterı́sticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl (r). Además, la densidad de probabilidad cuántica no es cero para r mayor que rmáx ni para r menor que rmı́n , aunque decae exponencialmente en estas regiones, y tampoco presenta superficies cáusticas. Ejemplo 13.2.2 Estudiar la función de distribución en el caso lz = l = 0. Comparar con la correspondiente densidad cuántica para el átomo de hidrógeno. En este caso rmı́n = 0, las órbitas son rectilı́neas y la intersección del toroide invariante con el espacio de configuración es una esfera. Q(r) es cero para r > 2a, infinito en r = 0 y r = 2a, y en los demás puntos está dada por: Q(r) = 1 (2π)2 ar(2ar − r2 )1/2 (13.60) Esta expresión no se obtiene directamente de (13.59) porque para l = 0, pθ no está definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una constante que se halla por normalización. Q(r) es isotrópica y corresponde a los estados s de la mecánica cuántica. Q(r) diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un mı́nimo en r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con el valor medio cuántico. Si bien en este caso no se cumplen las condiciones de validez de la aproximación clásica,3 el problema ilustra la correspondencia entre las dos descripciones. 3 Véase la sección 49 del libro de Mecánica cuántica de Landau-Lifshitz, Op. cit. 578 / Mecánica clásica avanzada 2 2πϕ21s 1 2πQr 1 2 2 Figura 13.3 Función de distribución 2πQ(r) en el caso lz = l = 0 y densidad cuántica 2πψ1s para el átomo de hidrógeno En la figura 13.3, la curva discontinua corresponde a la distribución en mecánica cuántica para el estado 1s del átomo de hidrógeno, que es exponencial. Las unidades son atómicas. Como puede verse, la mayor discrepancia se presenta cerca al punto de retorno r = 0 y a la superficie cáustica r = 2, donde la partı́cula tiene energı́a cinética muy pequeña, estando por tanto allı́ más expuesta a los efectos de tipo cuántico. La distribución clásica tiene la forma de una esfera con densidad que varı́a radialmente, de radio 2a, en tanto que la distribución en mecánica cuántica decae exponencialmente y existe para r entre 0 y 2a, ası́ como entre 2a e ∞. La densidad en el espacio de momentos se halla fácilmente de la relación Qr r2 dr = Qp p2 dp. En unidades atómicas el resultado es: Qp (p) = 1 1 2π 2 p2 (1 + p2 )2 (13.61) El resultado cuántico es:4 ϕ21s (p) = 8 1 π 2 (1 + p2 )4 (13.62) Ejemplo 13.2.3 Demostrar que la función de distribución Q(r) definida por (13.51) satisface la ecuación de continuidad (13.46). En este caso Q no depende explı́citamente del tiempo. El jacobiano está dado por: ∂ϕλ ∂ϕσ ∂ϕρ ϕ ~ = ǫλσρ (13.63) J ~r ∂x ∂y ∂z 4 Véase la sección 36 del libro de Landau-Lifshitz, Op. cit. Corespondencia con la mecánica cuántica de Schrödinger / 579 donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresión: ~r˙ = X ∂~r ωµ ∂ϕµ µ (13.64) Entonces (convenio de suma): ∂ ∂ϕλ ∂ϕµ ∂ϕρ ∂ ∂xi (ẋi J) = ωµ ǫλσρ ∂xi ∂xi ∂ϕµ ∂x ∂y ∂z (13.65) ésta expresión es nula porque: ∂ ∂xi ∂ 2 xi = =0 ∂xi ∂ϕµ ∂ϕµ ∂xi (13.66) ∂xi ∂ 2 ϕρ ∂ ∂ϕρ ∂ = = δµρ = 0 ∂ϕµ ∂xi ∂xi ∂ϕµ ∂xj ∂xi (13.67) y, Ejemplo 13.2.4 Expresar la función de distribución Q(~r) en términos de la acción de Lagrange Σ. Recordando que: ϕν = ~ ~r) ∂Σ(I, ∂Iν (13.68) se sigue de (13.63) que: (2π)3 Q(~r) = ǫλσρ ∂2Σ ∂2Σ ∂2Σ ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ (13.69) ~ ~r), Se sigue entonces que a cada solución de la ecuación de Hamilton-Jacobi, Σ(I, le corresponde una función de distribución. No es necesario resolver por separado la ecuación de continuidad en el espacio de configuración. En otras palabras, los campos ~ ~r) y Q(I, ~ ~r) no son independientes. En mecánica cuántica esto implicarı́a que la Σ(I, función de onda compleja queda determinada simplemente por una función real. Relación con la teorı́a ergódica y con el teorema K.A.M. Si el sistema es no degenerado y asumimos que los efectos cuánticos son una perturbación pequeña, sabemos que los toroides invariantes han de resultar ligeramente distorsionados. Entonces el problema cuántico no difiere esencialmente del clásico. Como las frecuencias son inconmensurables la trayectoria clásica, cuando t → ∞, llena completamente el toroide y se cumple que el promedio temporal de una variable dinámica coincide con el promedio tomado sobre las coordenadas del toroide: Z I 1 T 1 lı́m f (q, p)dt = f (q, p) dl ϕ ~ (13.70) T →∞ T 0 (2π)l Si el sistema es degenerado, las frecuencias son conmensurables. Entonces las trayectorias son periódicas y cubren una región de dimensión menor a la del toroide. El 580 / Mecánica clásica avanzada teorema K.A.M. dice que en este caso, aun si la perturbación es muy pequeña, los toroides invariantes pueden cambiar drásticamente en su topologı́a; para la mayor parte de las condiciones iniciales las trayectorias son estocásticas o sea que no están colocadas sobre regiones de geometrı́a definida en el espacio fásico. Para el problema de fuerzas centrales en coordenadas esféricas, además de Ir , Iθ e Iϕ hay una constante de movimiento adicional ϕθ − ϕϕ (y en el problema de Kepler además ϕr − ϕθ es constante). Cuando se aplica una perturbación las constantes que dependen sólo de variables angulares pasan a ser veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada sino que ocupe toda la región definida por las variables de acción constantes. Entonces es de esperarse que a causa de los efectos cuánticos, en un sistema degenerado se cumpla también la igualdad (13.70). 13.3. La mecánica ondulatoria Es posible, en la óptica geométrica, describir la propagación de los rayos por medio del principio de Fermat, ∆Σ = 0, y la propagación de los frentes de ondas por medio de la ecuación de la eiconal. En óptica fı́sica la luz es una onda electromagnética, y la óptica geométrica es una primera aproximación que describe correctamente la propagación cuando la longitud de onda es pequeña en comparación con las dimensiones caracterı́sticas de la geometrı́a del problema. Schrödinger encontró que para un sistema mecánico hay un comportamiento similar. La trayectoria de las partı́culas está determinada por el principio de mı́nima acción y las soluciones de la ecuación de Hamilton-Jacobi describen el movimiento de unas superficies de acción constante. La mecánica clásica resulta ser la aproximación de ondas cortas de una teorı́a más general, llamada mecánica ondulatoria. Las ondas de materia están determinadas por dos campos en el espacio ordinario, la ~ ~r), que distribución de probabilidades Q(~r) y las superficies de acción constante Σ(I, 5 corresponden a la amplitud y la fase de la onda. Según el ejemplo 13.2.4, Σ determina a Q. Schrödinger encontró la ecuación diferencial que obedecen las ondas de materia. Propagación de las superficies de acción constante. Las funciones de Hamilton S y Σ están relacionadas por: ~ t) = Σ(~r, C) ~ − Et S(~r, C, (13.71) ~ es un conjunto de constantes de movimiento. Las superficies Σ = constante perdonde C manecen fijas en el espacio de configuración, en tanto que las superficies S = constante se mueven. Si en t = 0, S = Σ = σ, entonces en un tiempo posterior dt, la superficie S = σ ya no coincidirá con la superficie Σ = σ sino con la superficie Σ = σ + E dt. La velocidad del movimiento de un punto fijo sobre S la llamaremos u: u= dl dt (13.72) 5 Esta correspondencia tiene implicaciones en las teorı́as gauge de la fı́sica de partı́culas elementales. Véase L.A. Sánchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. También http://xxx.lanl.gov/abs/hep-th/0308160 Corespondencia con la mecánica cuántica de Schrödinger / 581 donde dl es el desplazamiento del punto durante el tiempo dt. La condición S(0) = S(dt) = σ nos determina el valor de u. En efecto: S(dt) − S(0) = ∂S ~ ∂S · dl + dt = 0 ∂~r ∂t (13.73) Como por su definición d~l está en la dirección normal a S, se sigue que: u= E ∂Σ ∂~r (13.74) Σ obedece la ecuación de Hamilton-Jacobi independiente del tiempo, de donde: ∂Σ = [2m(E − V )]1/2 = (2mT )1/2 ∂~r (13.75) Por tanto la velocidad de los puntos del frente S para una partı́cula es: u= E E = 1/2 p (2mT ) (13.76) La relación E = pu, donde p es el momento lineal de la partı́cula y u la velocidad del frente S, es análoga a E = pc en el caso de los fotones. u = E/mv es pequeña cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de lentitud normal análogo al de la óptica geométrica. u es llamada la velocidad de fase y v = p/m es la velocidad de la partı́cula (llamada en mecánica ondulatoria la velocidad de grupo). Cuando la velocidad de las partı́culas es pequeña, las superficies S se mueven rápidamente y cuando las partı́culas se mueven rápidamente, la velocidad de los frentes ~ t) puede considerarse como un campo o fluido, definido en toda es pequeña. S(~r, C, la región del espacio de configuración accesible a la partı́cula. Cuando el potencial no depende de la velocidad, las curvas caracterı́sticas en el espacio de configuración son ortogonales a las superficies S. Al moverse las partı́culas el campo S se propaga con velocidad u(~r) en cada punto. A su vez las partı́culas mismas caracterizan otro campo, ~ con un flujo de velocidad en cada punto dado por ~r˙ . el de las densidades Q(~r, C), Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador armónico lineal y analizar los campos Q y S. Las velocidades de los frentes S y de las partı́culas son respectivamente: u=± 1 2 ωA 1 ωA = 1/2 2 cos(ωt) x2 1− 2 A 1/2 x2 v = ±Aω 1 − 2 = ωA cos(ωt) A (13.77) (13.78) Vemos que v varı́a entre −Aω y +Aω, en tanto que u varı́a entre −∞ y −ωA/2 y entre ωA/2 e ∞. 582 / Mecánica clásica avanzada y µ ωA 1 ωA 2 t 0 T/4 T/2 3T/4 T Figura 13.4 Velocidades u y v para un oscilador armónico lineal Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad muy grande; además la densidad de los frentes S es mayor donde u es baja y es cero donde u es infinita. O sea, los frentes son densos donde la densidad de las partı́culas es pequeña y viceversa (véase figura 13.4). Para este problema, de (13.51) se sigue que Q vale: Q= 1 1 ω = 2 1/2 2πA 2π|v| x 1− 2 A O sea que Q tiene un comportamiento similar a |u|. La expresión para Σ es: 1/2 " # 2 1/2 1 mE x x Σ= A sen−1 + x 1 − 2 2 2 A A Notemos que Σ determina a Q. En efecto: " # 2 1/2 ∂ ∂Σ ∂ 2x 1/2 2πQ = 1 − mω (2mIω) = ∂I ∂x ∂I 2I (13.79) (13.80) (13.81) Cuando x = 0, Σ es cero y Q = 1/(2πA) y cuando x = A, Σ = πA(mE/2)1/2 en tanto que Q es infinita. Es interesante notar que Σ no es una función univaluada de x, pues para x = 0, Σ = 0 si t = 0 y Σ = 2πI si t = T . Igualmente ∂Σ/∂x = ±(2mE − m2ω 2 x2 )1/2 posee dos ramas, una para los tiempos anteriores a la llegada a los puntos de retorno y otra para Corespondencia con la mecánica cuántica de Schrödinger / 583 los tiempos posteriores. En consecuencia, si no se toma valor absoluto, Q es también en sentido estricto una función multivaluada. Finalmente, como: ∂Σ x = sen−1 ∂I A se sigue que: I Q dx = 1 (13.82) (13.83) como debe ser. Ondas materiales. Las partı́culas microscópicas tienen un comportamiento ondulatorio evidenciado por: (i) La densidad en un haz de partı́culas tiene oscilaciones o variaciones espaciales definidas, es decir, las trayectorias no se pueden distribuir arbitrariamente. (ii) La región accesible a un sistema ligado de partı́culas va más allá de los puntos de retorno clásicos, aunque la probabilidad de encontrar las partı́culas fuera de la región clásica decrece exponencialmente. (iii) Hay fenómenos de interferencia y difracción. Para hablar de frentes de acción constante no son necesarias las nociones de “ondas” o “longitud” de onda. Al evaluar la distribución Q se encuentra que no presenta ninguna oscilación sino variaciones suaves con la posición. Esto es consecuente con la concepción de la mecánica clásica como el comportamiento lı́mite de un movimiento ondulatorio cuando la longitud de onda es pequeña. Vimos cómo de la formulación de la mecánica clásica con matrices conmutativas emerge de manera natural la mecánica cuántica de Heisenberg al introducir algunas hipótesis motivadas en la espectroscopı́a atómica. Desafortunadamente no hay una manera suave de obtener la mecánica cuántica de Schrödinger a partir de la ecuación de Hamilton-Jacobi y la función de distribución clásica, pues estos elementos clásicos son ajenos a conceptos tales como “función de onda”, “ecuación de onda”, “principio de superposición”. Es necesario un drástico cambio conceptual para introducir en la mecánica las nociones ondulatorias. La ecuación de Schrödinger. Schrödinger admitió la descripción de sistemas microscópicos mediante una amplitud de ondas análoga a la que describe otros fenómenos ondulatorios: ψ(~r, t) = A(~r)eiϕ(~r,t) (13.84) Quien inició este tipo de teorı́as fue Louis de Broglie, cuando en 1923 estudió la posible conexión entre las propiedades ondulatorias y corpusculares de la materia. Partió de la idea siguiente. Si tratándose de partı́culas se está describiendo el mismo fenóneno mediante los principios de Fermat y de mı́nima acción, en el lı́mite de ondas cortas se cumple la siguiente implicación: Z 2 Z 2 dl = 0 (v = constante) y ∆ p(~r, E) dl = 0 ∆ r , v) 1 1 u(~ (13.85) 1 (E = constante) → p ∝ u 584 / Mecánica clásica avanzada que es el mismo resultado (13.76). Para la velocidad de fase de una partı́cula se cumple: c u(~r, ν) = = λ(~r, ν) ν n(~r, ν) (13.86) siendo n el ı́ndice de refracción, c una constante y ν la frecuencia de las ondas. Entonces de (13.76) o (13.85) se sigue que: p= E E h = = u λ(~r, ν)ν λ(~r, ν) (13.87) siendo h = E/ν una constante. Como en (13.32) y (13.33), puede decirse que la fase de la onda, ϕ, es proporcional a la acción S: ϕ(~r, t) = 2π Σ(~r, E) Et S(~r, t) = − h h̄ h̄ (13.88) Entonces: ψ(~r, t) = A(~r)eiΣ(~r,E)/h̄−iEt/h̄ (13.89) ha de ser la forma de la función de onda en el lı́mite de ondas cortas. Schrödinger asumió que en general ϕ satisface una ecuación de ondas ordinaria donde la velocidad de la onda es la velocidad de fase u, y además exigió que debe ser consistente con los resultados ya conocidos referentes al lı́mite asintótico de ondas cortas caracterizado por la ecuación (13.89). Esto es: ∇2 ψ − 1 ∂2ψ =0 u2 ∂t2 (13.90) Como para el lı́mite de ondas cortas u está dada por (13.76), para ese caso (13.90) toma la forma: 2m(E − V ) ∂ 2 ψ = ∇2 ψ E2 ∂t2 (13.91) La función de onda de un fenómeno estacionario es de la forma: Ψ(~r, t) = ψ(~r)e−iEt/h̄ (13.92) por lo cual ψ debe obedecer la ecuación: − h̄2 2 ∇ ψ(~r) + V (~r)ψ(~r) = Eψ(~r) 2m (13.93) que es la ecuación de Schrödinger independiente del tiempo. El comportamiento ondulatorio aparece sólo al hacer la identificación (13.88), o sea que está ligado directamente al hecho de no ser cero la constante de Planck (ϕ no es infinita ni λ es cero). Esto de alguna manera ha de estar relacionado con el hecho de no poderse medir las variables de acción I con precisión ∆I = 0, del cual surge la mecánica cuántica de Heisenberg. Si en (13.93) reemplazamos a ψ por: ψ(~r) = eiΣ(~r,E)/h̄ A(~r) (13.94) Corespondencia con la mecánica cuántica de Schrödinger / 585 obtenemos una ecuación diferencial para Σ que en el lı́mite h̄ → 0 es precisamente la ecuación de Hamilton-Jacobi. Además Schrödinger postuló que |ψ|2 es la densidad de probabilidad en el espacio de configuración. Para un estado estacionario se debe cumplir: Q(~r) = |ψ(~r)|2 (13.95) Resulta de (13.94) y (13.95) que para el lı́mite asintótico de ondas cortas: Q(~r) = A(~r)2 (13.96) Por tanto el lı́mite clásico de la función de onda puede expresarse en términos de las funciones clásicas Q(~r), (13.69), y Σ: ψ(~r, t) = [Q(~r)]1/2 eiΣ(~r,E)/h̄−iEt/h̄ o, en términos de Σ: 1/2 ∂2Σ ∂2Σ ∂2Σ ψ(r, t) = ǫλσρ eiΣ(~r,E)/h̄−iEt/h̄ ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ (13.97) (13.98) J.H. van Vleck (1928) mostró que: hq|ψi = C det ∂ 2S ∂q∂p 1/2 eiS/h̄ (13.99) obedece a la ecuación de Schrödinger si h̄ → 0. Nótese la similitud entre (13.98) y la ecuación de van Vleck.6 13.4. La función de onda semiclásica según Keller y Maslov Para un sistema acotado los valores de las variables de acción, y por tanto de la energı́a y otras constantes de movimiento, están cuantizados. En la sección 12.1, se señaló que las variables de acción satisfacen las condiciones Iν = αν h̄, donde las αν son enteras. Al imponer ciertas condiciones sobre las frecuencias vimos en el ejemplo 12.3.1 que para un oscilador armónico la acción está cuantizada según I = (k + 1/2)h̄, siendo k un entero. Veremos ahora cómo tales reglas de cuantización se pueden obtener a partir de la función de onda semiclásica. Bohr y Sommerfeld postularon las reglas de cuantización para un sistema separable en la forma Iν = αν h̄. Einstein en 1917 las generalizó para sistemas no separables pero integrables, para los cuales existe un conjunto de variables de acción definidas por los contornos cerrados independientes que haya sobre un toroide invariante, en la forma: I 1 Iν = p~ · d~q = αν h̄ (13.100) 2π γν 6 M.C. Gutzwiller, Chaos in classical and quantum mechanics, Springer, New York, 1990 deduce la fórmula de van Vleck a partir de una aproximación de fase estacionaria al propagador de Feynman. 586 / Mecánica clásica avanzada donde los γν son los diferentes contornos. Brillouin en 1926 esbozó una teorı́a de las funciones de onda semiclásicas que conduce a reglas de cuantización como la del oscilador armónico, I = (k + 1/2)h̄, basada en consideraciones sobre los puntos de retorno del movimiento clásico. Keller en 1958 y Maslov en 1972 elaboraron una teorı́a completa acerca de las funciones de onda semiclásicas y las reglas de cuantización que generaliza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos problemas especı́ficos en fı́sica atómica y molecular son adecuadamente estudiados mediante estas teorı́as semiclásicas, denominadas genéricamente “la aproximación W.K.B”. Acción de Lagrange con dos puntos de retorno. Consideremos una partı́cula en movimiento unidimensional acotado con dos puntos de retorno. La trayectoria de fases es cerrada y el toroide invariante es una circunferencia. La figura 13.5 muestra una trayectoria tı́pica. La solución a la ecuación de HamiltonJacobi para este problema es: Z Σ(x) = ± [2m(E − V )]1/2 dx (13.101) p p2 x x1 x2 p1 Figura 13.5 Trayectoria de fases cerrada En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que son x1 y x2 . Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada valor de x están sobre diferentes “hojas”, análogas a las hojas de Riemann de la teorı́a de las funciones de variable compleja, definidas por la lı́nea de ramificación x1 x2 . Para p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita. Similarmente, en la representación de momentos p1 p2 definen una lı́nea de ramificación que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acción reducida es Σ(p), conectada con Σ(x) mediante la fórmula (9.217): Σ(p) = Σ(x) − xp (13.102) Corespondencia con la mecánica cuántica de Schrödinger / 587 Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por los puntos (x, dΣ/dx). Pero Σ puede usarse sólo para la trayectoria sobre una hoja, ya que la ecuación de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra hoja es necesario continuar la función. En efecto, Σ(p) está bien definida en los puntos x1 y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensión analı́tica de Σ(x) de una hoja a la otra usando la ecuación (13.102). La continuación a lo largo de la trayectoria puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p. Podemos definir las funciones multivaluadas Σ y Σ en términos de funciones univaluadas ası́: Σ1 (x) en x1 p2 x2 Σ(x) = Σ2 (x) en x1 p1 x2 (13.103) Σ1 (p) en p1 x1 p2 Σ(p) = Σ2 (p) en p1 x2 p2 La variable de acción es un número cuya magnitud es igual al cambio experimentado por Σ al completar un circuito, dividido por 2π (sección 10.3): I= 1 [Σ2 (x2 ) − Σ1 (x2 )] 2π (13.104) Efecto de la multiformidad de Σ sobre la función de onda semiclásica. Podemos concluir de (13.69) que Q no es univaluada por no serlo Σ. Entonces se deduce de (13.97) que la función de onda semiclásica resulta ser multivaluada a no ser que se imponga una condición adicional. Escribamos a ψ en la forma: Σ Et 1 ψ = exp i − − i ln Q (13.105) h̄ h̄ 2 Al hacer un circuito completo sobre la trayectoria de fases la función de onda debe tomar el mismo valor. Esto se consigue solamente haciendo que el cambio del argumento del exponencial en (13.105) al completar un circuito sea un múltiplo entero de 2πi, o sea: i ∆Σ − ∆ ln Q = 2πn h̄ 2 (13.106) donde n es un número entero. Esto da lugar a la siguiente expresión para la cuantización de I = ∆Σ/2π: i I = h̄ n + ∆ ln Q (13.107) 4π Para el caso descrito por (13.101), sobre las dos ramas Q difiere sólo en el signo [véase por ejemplo la expresión (13.81)]. 588 / Mecánica clásica avanzada Las funciones univaluadas Σ1 y Σ2 , definidas en (13.103), permiten encontrar las funciones univaluadas correspondientes Q1 y Q2 . En efecto: m 1/2 1 2πQ1,2 = ±ω (13.108) 2 [E − V (x)]1/2 implica que: ln Q2 (x2 ) − ln Q1 (x2 ) = ln Q2 (x1 ) − ln Q1 (x1 ) = −πi (13.109) El cambio completo en ln Q, partiendo de un punto sobre la rama superior próximo a x2 y regresando al mismo punto luego de pasar por dos discontinuidades es: ∆ ln Q = −2πi (13.110) En consecuencia, (13.109) es: 1 I = h̄ n + 2 (13.111) En conclusión, las condiciones de cuantización correctas se obtienen al definir la función de onda semiclásica en términos de la función Q no tomada como intrı́nsecamente positiva. La función ı́ndice de Maslov. La función “signo” aplicada a la derivada dp/dx es útil para contabilizar el número de singularidades de las funciones Σ(x) y Σ(p) al pasar de una hoja a la otra. Se define como: dp +1 si >0 dx dp = SGN (13.112) dx dp −1 si <0 dx para todos los valores de dp/dx 6= 0. Maslov define la función “ı́ndice” para asociar un número entero a todos los puntos colocados sobre la misma hoja, ası́: σ(x) = Número entero sobre cada hoja x1 p2 x2 − x1 p1 x2 σ(p) = Número entero sobre cada hoja p1 x1 p2 − p1 x2 p2 (13.113) σ(p) y σ(x) están conectados en cada punto que no sea de retorno en p o en x por la relación: dp (13.114) σ(p) = σ(x) + SGN dx Si se toma en un punto x0 a Σ(x0 ) = 0, entonces se define el valor inicial de σ(x) por la condición σ(x0 ) = 0. Sea x0 = x2 + ǫ, entonces σ(x) = 0 para toda la hoja x1 p2 x2 . Para un punto entre p2 y x1 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = +1 en toda la hoja p1 x1 p2 . Ahora tomemos un punto entre x1 y p1 ; entonces Corespondencia con la mecánica cuántica de Schrödinger / 589 SGN(dp/dx) = +1, y por (13.114), σ(x) = 2 en la hoja x1 p1 x2 . Para un punto entre p1 y x2 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = 3 para toda la hoja p1 x1 p2 . Finalmente, sea el punto de partida x0 , donde SGN(dp/dx) = +1; entonces por (13.114) se cumple que σ(x) = 4. Concluimos que σ(x) es una función multivaluada entera que se incrementa en 4 al completar un circuito. Denotemos por la letra m el cambio en σ(x) al completar un circuito dividido por dos: m= ∆σ 2 (13.115) Para el caso que estamos considerando, m = 2 que coincide con el número de singularidades en Σ al completar un circuito. Ver el comentario que sigue a la ecuación (13.52). Maslov generaliza el resultado (13.110) en la forma: ∆ ln Q = −imπ (13.116) para un sistema con un número cualquiera de puntos de retorno en x y en p. La función ı́ndice permite incluir en la fase de la función de onda semiclásica los efectos provenientes de la no uniformidad de Q, en la forma: ψ(~r) = |Q(~r)|1/2 eiΣ(~r,E)/h̄−iπσ(~r)/4 (13.117) con esto se está diciendo que la fase es fija sobre cada hoja. Las condiciones de cuantización resultan de exigir que ψ sea univaluada. Ası́, para el caso ilustrado en la figura 13.5, ψ1 (x2 ) = ψ2 (x2 ) (13.118) Esto exige que, al completar un circuito: ∆Σ π ∆σ − = 2πn h̄ 4 Por tanto: m I = n+ h̄ 4 (13.119) (13.120) Para el movimiento de un electrón en el átomo de hidrógeno, las coordenadas esféricas r, θ y las parabólicas ξ, η son del tipo considerado en la figura 13.5, siendo entonces m = 2. Esto justifica las fórmulas de cuantización semiclásica dadas en el ejemplo 10.5.2. La coordenada ϕ se comporta de manera diferente por estar asociada a una rotación, o sea que la trayectoria de fases no tiene puntos de retorno ni en ϕ ni en pϕ (la proyección de la trayectoria de fases sobre el plano pϕ − ϕ es una lı́nea recta). En consecuencia ∆σ = 0 para el grado de libertad ϕ. Fórmulas de conexión de W.K.B. Para una dimensión la función de onda de W.K.B., según se sigue de (13.117) y (13.108) es: 1/2 mω eiΣ(~r,E)/h̄−iEt/h̄−iπσ(~r)/4 (13.121) ψ(~r, t) = π|p| 590 / Mecánica clásica avanzada A pesar de ser construida a partir de las cantidades clásicas Q, Σ y σ, esta función es válida para valores de x entre x = −∞ y x = +∞ diferentes a los puntos de retorno. Fuera de los puntos de retorno Σ es imaginaria, lo cual nos permite afirmar que en general: |ψ(r, t)|2 = mω −2ImΣ(~r,E)/h̄ e π|p| (13.122) y la probabilidad resulta exponencialmente amortiguada en las regiones donde ImΣ > 0 y tiende a cero cuando h̄ → 0, en correspondencia con el hecho de ser tales regiones clásicamente prohibidas. La cola exponencial que exhibe ψ corresponde al efecto “túnel” de la mecánica cuántica. Las fórmulas de conexión permiten pasar a través de los puntos de retorno, para obtener una función definida entre x = −∞ y x = +∞ (excluyendo a x = x1 y x = x2 y los alrededores de los mismos donde los efectos cuánticos no permiten la aproximación semiclásica). En la región clásicamente inaccesible p y Σ son imaginarios puros, con signos +i o −i dependiendo de la hoja. Cuando el signo es −i resulta que |ψ|2 no se amortigua sino que crece exponencialmente en la región clásicamente prohibida, lo cual no es aceptable. Por tanto a la región clásicamente prohibida sólo puede pasarse desde la hoja con p > 0. Llamemos 3 a la región −∞ < x < x1 y 4 a la región x2 < x < +∞. Para llegar a la región 4 la partı́cula necesariamente provino de la región 1 (p > 0), o sea que no realizó cambio de hoja; entonces, estando en la misma hoja, σ4 = σ1 = 0. Para llegar a la región 3, la partı́cula necesariamente provino de la región 2 (p < 0), o sea que debió cambiar de hoja a fin de que ImΣ > 0. Como en cada cambio de hoja σ cambia en 2, se sigue que σ2 = 2 y σ3 = 0. En resumen, σ1 = 0, σ2 = 2, σ3 = 0, σ4 = 0. Por tanto: mω 2π|p| 1/2 Z exp i mω ψ2 (x) = 2π|p| 1/2 exp −i mω 2π|p| 1/2 Z exp − mω ψ4 (x) = 2π|p| 1/2 Z exp − ψ1 (x) = ψ3 (x) = x0 [2m(E − V )]1/2 dx h̄ x2 Z x0 x2 x1 x x x2 [2m(E − V )]1/2 dx π −i h̄ 2 [2m(V − E)]1/2 dx h̄ [2m(V − E)]1/2 dx h̄ (13.123) (13.124) (13.125) (13.126) √ Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta +∞ se cambia la normalización. Cuando la función de onda en un intervalo dado es multiforme, debe tomarse la suma aritmética de las funciones de onda asociadas a las diferentes hojas. En el presente caso, la región x1 < x < x2 tiene dos hojas y la función correcta es ψ1 + ψ2 . Si Corespondencia con la mecánica cuántica de Schrödinger / 591 multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no cambian. Entonces: 1/2 Z x mω [2m(E −V )]1/2 dx π ; x1 < x < x2 cos + π|p| h̄ 4 x2 1/2 Z x1 mω [2m(V −E)]1/2 dx iπ (13.127) ψ(x) = ; −∞ < x < x1 exp − + 2π|p| h̄ 4 x 1/2 Z x [2m(V −E)]1/2 dx iπ mω ; x2 < x < ∞ exp − + 2π|p| h̄ 4 x2 este es el resultado usual de la aproximación W.K.B. 592 / Mecánica clásica avanzada Bibliografı́a Textos generales de mecánica clásica 1. Arnold V. I. Méthodes mathématiques de la mécanique classique. Editions Mir, Moscou, 1976. 2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960. 3. Gantmacher F. Lectures in analytical mechanics. Mir publishers, Moscow, 1970. 4. Goldstein H. Mecánica clásica. Aguilar, Madrid, 1963. 5. Goldstein H. Classical mechanics. 2nd ed. Addison Wesley, Reading, 1980. 6. Hauser W. Introducción a los principios de la mecánica. Uthea, México, 1969. 7. Landau L. y Lifshitz E. M. Mecánica. Reverté, Barcelona, 1965. 8. Marion J. Classical dynamics of particles and systems. Academic Press, New York, 1970. 9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968. 10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Berlin, 1995. 11. Ter Haar D. Elements of hamiltonian mechanics. North-Holland, Amsterdam, 1965. 12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bodies. 4th ed. Cambridge University. Press, Cambridge, 1960. 593 594 / Mecánica clásica avanzada Colecciones de problemas 13. Kotkin G. L. y Serbo V. G. Problemas de mecánica clásica. Editorial Mir, Moscú, 1980. 14. Spiegel M. R. Teorı́a y problemas de mecánica teórica. McGraw-Hill, México, 1976. Textos especializados de mecánica clásica 15. Abraham R. y Marsden J. E. Foundations of mechanics. Benjamin, New York, 1967. 16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967. 17. Lichtenberg A. J. y Lieberman M. A. Regular and stochastic motion. Springer-Verlag, New York, 1983. 18. Percival I. and Richards D. Introduction to dynamics. Cambridge University Press, Cambridge, 1982. 19. Thirring W. Classical dynamical systems. Springer-Verlag, New York, 1978. 20. Yourgrau W. y Mandelstam S. Variational principles in dynamics and quantum theory. 3d ed. Saunders, Philadelphia, 1968. Textos de matemáticas 21. Abramowitz M. y Stegun I. A. Handbook of mathematical functions. Dover, New York, 1965. 22. Ahlfors L. V. Análisis de variable compleja. Aguilar, Madrid, 1966. 23. Arnold V. I. Equazioni differenziali ordinarie. Edizioni Mir, Mosca, 1979. 24. Arnold V. I. Geometrical methods in the theory of ordinary differential equations. Springer-Verlag, New York, 1983. 25. Elsgoltz L. Ecuaciones diferenciales y cálculo variacional. Editorial Mir, Moscú, Bibliografı́a / 595 1969. 26. Korn G. A. y Korn T. M. Mathematical handbook for scientists and engineers. McGraw-Hill, New York, 1961. 27. Spiegel M. R. Manual de fórmulas y tablas matemáticas. McGraw-Hill, México, 1970. 28. Whittaker E. T. y Watson G. N. A course of modern analysis. 4th ed. Cambridge University Press, Cambridge, 1927. Textos de otras áreas 29. Galindo A. y Pascual P. Mecánica cuántica. Alhambra, Madrid, 1978. 30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York, 1990. 31. Landau L. D. y Lifshitz E. Théorie du champ. Editions Mir, Moscou, 1966. 32. Landau L. D. y Lifshitz E. Mécanique cuantique: théorie non relativiste. Editions Mir, Moscou, 1967. 33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York, 1968. Monografı́as especializadas 34. Augustin S. D. y Rabitz H. “Action-angle variables in quantum mechanics”. Journal of chemical physics, vol. 71, No 12, p 4956, 1979. 35. Chirikov B. V. “A universal instability of many-dimensional oscillator systems”. Physics reports, vol. 52, No 5, p 263, 1979. 36. Keller J. B. “Corrected Bohr-Sommerfeld quantum conditions for nonseparable systems”. Annals of physics, vol. 4, p 180, 1958. 37. Percival I. C. “Semiclassical theory of bound states”. Advances in chemical physics. vol. 36, p 61, 1977. 596 / Mecánica clásica avanzada 597 Índice alfabético Fermi, de, 543 Moser, de, 429 Poincaré, de, 427 separatriz, 526, 542 Aproximación clásica, 475, 583, 590 WKB, de, 589, 591 Areolar, velocidad, 130 Arnold, V., 422, 529, 538 integral de, 528 teorema de, 522, 531 Astronomı́a, 149 Augustı́n, S.D., 551 Autónomo, hamiltoniano, 525 Autoadjunta, matriz, 551 Abramowitz, 282, 294, 298 Absidales, distancias, 132, 140 Acción(es) adiabáticos, invariantes, 415 discontinuidad en la,, 430, 588 Hamilton, de,, 328 Lagrange, de, 328 perturbaciones adiabáticas , 505 principal, 330 reducida, 330 variables de, 429 Adiabáticas, perturbaciones,, 504 Adiabáticos, invariantes,, 415, 430 Ahlfors, L. V., 241 Álgebra de Lie grupo de rotaciones, del, 244, 395, 461 y corchetes de Poisson, 397 Angulares, variables degeneradas, 488 lentas, 500, 505, 513 oscilador armónico, en el, 438 problema de Kepler, en el, 445, 462 rápidas, 500, 504, 513 y de acción, 429 Ángulo(s) órbita Kepleriana, en una, 457 como coordenadas generalizadas, 222 condiciones sobre los, 226 dispersión, de, 159, 162 Euler, de, 222 rotación, de, 227, 245 Antisimétrica matriz, 249 Aplicación “twist”, 429, 523, 524 estándar, 544 Barrera centrı́fuga, 131, 135 Bernoulli, regla de oro, 19, 35 Bifurcación de las superficies, 538 Bohr, átomo de, 144, 155 Born, M., 153, 470, 473, 479 Boyle, ley de, 81 Brillouin aproximación de, 589, 591 reglas de cuantización, 586 Brújula de Foucault, 314 Cálculo de variaciones, 59 Cambio de la forma funcional, 379 Campo electromagnético, 65 Canónicas, transformaciones, 104, 107, 319, 343, 400 dependientes del tiempo, 105 ejemplos de, 110, 347, 358 grupo de, 355 infinitesimales, 374 libres, 109, 346 598 Índice alfabético / 599 oscilador armónico, del, 104 Caóticos, movimientos regulares, 522 Caratheodory, lema de, 362 Cascarón esférico, 21 Cáusticas, superficies, 444, 576 Cayley-Klein, parámetros de, 236 para el trompo, 301 Centrı́fuga, aceleración, 94 Centrı́fugo, potencial, 131 Centro fuerzas, de, 125 masas, de, 125, 161 Chirikov, B. V., 529, 543, 547 criterio de, 543 Clase integral elı́ptica de primera, 284 transformación canónica libre de primera, 109, 348 Completidad, relación de, 215 Condiciones ligadura, de, 9 ortogonalidad, de, 174, 180, 208 Cónicas, secciones, 140 Conjunto coordenadas generalizadas, de, 13 variables de acción-ángulo, de, 434 Conmutador, 397, 555 Conservación, teoremas de, 68, 380 Constante(s) e integrabilidad de las ecuaciones de movimiento, 421 generadores de transformaciones canónicas como, 381 integración, de, 70 movimiento, de, 70, 421, 437 Planck, de, 123, 414, 584 propiedades de simetrı́a, y, 381 Construcción de Pionsot, 277 Contacto, transformación de, 569 Coordenadas cı́clicas, 76 esféricas, 129, 445 generalizadas, 12 independientes, 46 parabólicas, 443, 462 Corben, H., 201, 273 Corchetes Lagrange, de, 402, 409 Poisson, de, 378, 380, 555 Coriolis, fuerza de, 94, 252 Cosenos directores, 210, 568 Covarianza de las ecuaciones de Hamilton, 103 de las ecuaciones de Lagrange, 42 Cuerda masas discretas, con, 195 oscilaciones de la, 202 uniforme, 202 Cuerpo rı́gido, 205 asimétrico, 287 dinámica del, 253 libre, 277 momento angular del, 256 simétrico con un punto fijo, 295 sistema de coordenadas del, 206 Curvas de fase, 100, 121, 323, 423 D’Alambert, principio de, 35 Degeneración accidental, 504, 515 figura de Lissajous, en una, 443 frecuencias, en las, 181 intrı́nseca, 516 para el problema de Kepler, 492 isoenergética, 530 movimiento bajo fuerzas centrales, en el, 445 oscilador isotrópico, en el, 442 Delaunay, elementos de, 457 Densidad función de, 573, 576, 585 probabilidad, de, 573, 576, 585 Derivada parcial, 41, 94 total respecto al tiempo, 67, 73, 95 Desplazamiento virtual, 16, 18 Determinante jacobiano, 350, 404, 523 matriz de rotación, de la, 216, 220 secular, 171, 186 Diádicos Pauli, de, 232 600 / Mecánica clásica avanzada traza cero, de, 232 Diada, 212 Diagonalización frecuencias propias y modos con el método de, 191 matrices de masa y de constantes de resorte, de las, 191 matriz de rotación, de la, 225 matriz de una perturbación, de la, 497 tensor de inercia, del, 260 Dinámica hamiltoniana, 88 ecuación general de la, 35, 55 lagrangiana, 42 variable, 69, 378 Dipolar radiación, 451, 459 reglas de selección para radiación, 475 Dispersión bajo fuerzas centrales, 156 Ecuación(es) Hamilton-Jacobi, de, 107, 112, 364, 368, 371, 435, 445 canónicas, 88 continuidad, de, 573 dinámica en coordenadas generalizadas, de la, 40 estática en coordenadas generalizadas, de la, 28 estado de un gas real, de, 82 Euler en un sistema de referencia rotante, de, 271 Euler, de, 270, 281, 287 Euler-Lagrange, de, 97 general de la dinámica, 35 general de la estática, 19 Kepler, de, 148, 449 ligadura, de, 9 movimiento, de, 6, 38, 42, 88 Newton, de, 5 onda, de, 204, 584 secular, 171, 186, 262, 496 transformación canónica, de una, 363 valores propios, de, 179 Whitaker, de, 325 Efecto Stark cuadrático, 500 lineal, 498 Einstein, reglas de cuantización, 585 Eje(s) instantáneo de rotación, 279 principales, 261 rotación, de, 244 simetrı́a, de, 79 Elementos de matriz, 223 Elipsoide de inercia, 264, 277 Energı́a cinética, 42, 72, 255 conservación de la, 70, 89 función de Jacobi, 71, 74 potencial, 42, 296 total, 73 Ensamble, 18 Equilibrio estático, 19 estable, 30 Espacio configuración, de, 14 fases, de, 98, 104 momentos, de, 98 no euclidiano, 29, 179 Estática coordenadas generalizadas, con, 29 ecuación general de la, 19 Estabilidad de los puntos fijos, 541 Estado