Mario Cosenza Mecánica Clásica Versión A-2016 Mario Cosenza Universidad de Los Andes Mérida, Venezuela Mecánica Clásica Versión A-2016 c MMXVI a Claudia Mi propósito es exponer una ciencia muy nueva que trata un tema muy antiguo. Quizás nada hay en la naturaleza más antiguo que el movimiento, respecto al cual los libros escritos por filósofos no son ni pocos ni pequeños; no obstante, he descubierto, experimentando, algunas propiedades que merecen ser conocidas. Galileo Galilei, Diálogos Sobre Dos Nuevas Ciencias. Fórmulas vectoriales Identidades A · (B × C) = (A × B) · C = C · (A × B) = (C × A) · B = B · (C × A) (1) A × (B × C) = B(A · C) − C(A · B) (2) (A × B) · (C × D) = (A · C)(B · D) − (A · D)(B · C) (3) Derivadas de sumas ∇(f + g) = ∇f + ∇g (4) ∇ · (A + B) = ∇ · A + ∇ · B (5) ∇ × (A + B) = ∇ × A + ∇ × B (6) Derivadas de productos ∇(f g) = f ∇g + g∇f (7) ∇(A · B) = A × (∇ × B) + B × (∇ × A) + (A · ∇)B + (B · ∇)A (8) ∇ · (f A) = f (∇ · A) + A · ∇f (9) ∇ · (A × B) = B · (∇ × A) − A · (∇ × B) (10) ∇ × (f A) = f (∇ × A) − A × (∇f ) (11) ∇ × (A × B) = A(∇ · B) − B(∇ · A) + (B · ∇)A − (A · ∇)B (12) Derivadas segundas ∇ × (∇ × A) = ∇(∇ · A) − ∇2 A (13) ∇ · (∇ × A) = 0 (14) ∇ × (∇f ) = 0 (15) Teoremas integrales Z b (∇f ) · dl = f (b) − f (a) (16) a Z I (∇ · A) dV = A · n̂ dS Teorema de Gauss (divergencia) V S Z I (∇ × A) · n̂ dS = A · dl Teorema de Stokes S C Z I (f ∇2 g − g∇2 f ) dV = (f ∇g − g∇f ) · n̂ dS Teorema de Green V S (17) (18) (19) Índice general 1. Ecuaciones de movimiento 1.1. Leyes de Newton y mecánica de una partı́cula . . . . . 1.2. Mecánica de un sistema de partı́culas . . . . . . . . . . 1.3. Coordenadas generalizadas . . . . . . . . . . . . . . . 1.4. Principios variacionales y ecuaciones de Euler . . . . . 1.5. Principio de mı́nima acción y ecuaciones de Lagrange . 1.6. Propiedades de las ecuaciones de Lagrange . . . . . . . 1.7. Ecuaciones de Lagrange para varios sistemas . . . . . 1.8. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 20 26 32 43 45 49 64 2. Leyes de conservación y simetrı́as 2.1. Momento conjugado . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . 2.3. Homogeneidad del espacio y conservación del momento lineal . 2.4. Isotropı́a del espacio y conservación del momento angular . . . 2.5. Homogeneidad del tiempo y conservación de la energı́a . . . . . 2.6. Teorema de Euler para la energı́a cinética . . . . . . . . . . . . 2.7. Fuerzas generalizadas: partı́cula en un campo electromagnético 2.8. Sistemas integrables y sistemas caóticos . . . . . . . . . . . . . 2.9. Movimiento unidimensional . . . . . . . . . . . . . . . . . . . . 2.10. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 71 72 76 78 80 81 83 87 90 97 . . . . . . . . . 101 101 108 113 115 125 133 139 142 150 3. Fuerzas centrales 3.1. Problema de dos cuerpos . . . . . . . . . . . . . . . . . 3.2. Potencial efectivo . . . . . . . . . . . . . . . . . . . . . 3.3. Ecuación diferencial de la órbita . . . . . . . . . . . . 3.4. Fuerza gravitacional y problema de Kepler . . . . . . . 3.5. Leyes de Kepler y dependencia temporal . . . . . . . . 3.6. Estabilidad de órbitas circulares y ángulo de precesión 3.7. El vector de Laplace-Runge-Lenz . . . . . . . . . . . . 3.8. Dispersión en campo de fuerza central . . . . . . . . . 3.9. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4. Oscilaciones pequeñas 4.1. Oscilaciones en una dimensión . . . . . . . . . . . . . . 4.2. Oscilaciones de sistemas con varios grados de libertad 4.3. Modos normales . . . . . . . . . . . . . . . . . . . . . 4.4. Oscilaciones forzadas y amortiguadas . . . . . . . . . . 4.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 155 159 165 175 178 5. Movimiento de cuerpos rı́gidos 5.1. Velocidad angular de un cuerpo rı́gido . . . . . 5.2. Ángulos de Euler . . . . . . . . . . . . . . . . . 5.3. Energı́a cinética y tensor de inercia . . . . . . . 5.4. Momento angular de un cuerpo rı́gido . . . . . 5.5. Ecuaciones de movimiento para cuerpos rı́gidos 5.6. Ecuaciones de Euler para cuerpos rı́gidos . . . . 5.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 183 185 189 200 203 212 224 6. Dinámica Hamiltoniana 6.1. Ecuaciones de Hamilton . . . . . . . . . . . . . 6.2. Sistemas dinámicos y espacio de fase . . . . . . 6.3. Teorema de Liouville . . . . . . . . . . . . . . . 6.4. Paréntesis de Poisson . . . . . . . . . . . . . . . 6.5. Transformaciones canónicas . . . . . . . . . . . 6.6. Transformaciones canónicas infinitesimales . . . 6.7. Propiedades de las transformaciones canónicas 6.8. Aplicaciones de transformaciones canónicas . . 6.9. Ecuación de Hamilton-Jacobi . . . . . . . . . . 6.10. Variables de acción-ángulo . . . . . . . . . . . . 6.11. Integrabilidad . . . . . . . . . . . . . . . . . . . 6.12. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 227 234 238 242 247 254 256 262 264 276 292 296 A. Lagrangiano de una partı́cula relativista 305 B. Transformaciones de Legendre 319 C. Teorema del virial 321 D. Bibliografı́a 323 Capı́tulo 1 Ecuaciones de movimiento 1.1. Leyes de Newton y mecánica de una partı́cula La Mecánica consiste en el estudio del movimiento; esto es, la evolución de la posición de una partı́cula o de la configuración de un sistema de partı́culas en el tiempo. La Mecánica Clásica se refiere a movimientos que ocurren en escalas macróscopicas; es decir, no incluye fenómenos cuánticos (nivel atómico). La Mecánica Clásica provee descripciones válidas de fenómenos en una extensa escala espacial que va desde el orden de 100 nm (R. Decca et al., Phys. Rev. Lett. 94, 240401 (2005)) hasta distancias cosmológicas. Actualmente, la Mecánica Clásica se enmarca dentro de un campo de estudio más general denominado Sistemas Dinámicos. Éstos son sistemas descritos por variables generales cuyos estados evolucionan en el tiempo de acuerdo a reglas deterministas, e incluyen sistemas fı́sicos, quı́micos, biológicos, sociales, económicos, etc. El origen del método cientı́fico está directamente vinculado a la primeras formulaciones cuantitativas de la Mecánica Clásica realizadas por Galileo con base en sus experimentos. La Mecánica Clásica constituye el eje esencial alrededor del cual se ha construido toda la Fı́sica. Figura 1.1: Galileo Galilei (1564-1642). 9 10 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Durante el siglo XX, la Mecánica Clásica se encontró con varias limitaciones para explicar nuevos fenómenos. Las subsecuentes soluciones de estas dificultades condujeron a tres grandes revoluciones intelectuales en la Fı́sica: i. Limitación para explicar fenómenos a altas velocidades o a altas energı́as, lo que condujo a la Teorı́a de Relatividad (Especial y General). ii. Limitación para explicar fenómenos a escala atómica o microscópica, lo cual dio origen a la Mecánica Cuántica. iii. Limitación en la capacidad de predicción en sistemas dinámicos deterministas no lineales, que condujo al desarrollo del Caos y eventualmente al estudio actual de Sistemas Complejos. Para describir el movimiento, se requiere la definición de algunos conceptos básicos. Un sistema de referencia es una convención necesaria para asignar una posición o ubicación espacial a una partı́cula u objeto con respecto a un origen o punto escogido O. Se asume que una partı́cula tiene asociada una cantidad de masa, denotada por m. La posición de una partı́cula en un sistema de referencia puede describirse mediante un conjunto de tres coordenadas que definen un vector. Por ejemplo, en un sistema de coordenadas cartesianas, el vector de posición r = (x, y, z) da la ubicación de una partı́cula en el espacio con respecto a un origen O. Las componentes del vector de posición en coordenadas cartesianas también se denotan como x1 ≡ x, x2 ≡ y, x3 ≡ z. Figura 1.2: Posición de una partı́cula en un sistema de coordenadas cartesianas. La posición de una partı́cula puede depender del tiempo, r(t) = (x(t), y(t), z(t)). El cambio del vector de posición en el tiempo constituye el movimiento de la partı́cula. En Mecánica Clásica, el tiempo t se considera un parámetro real que permite establecer el orden en el cual ocurren los eventos; en particular, es necesario para especificar las posiciones sucesivas que una partı́cula en movimiento ocupa en el espacio. Asumimos que el parámetro t posee la propiedad de incremento monotónico a medida que r(t) varı́a a través de sucesivas posiciones: dados dos valores t1 y t2 tales que t2 > t1 , entonces la partı́cula ocupa la posición r(t2 ) después de la posición r(t1 ). El vector de desplazamiento infinitesimal se define como dr = r(t + dt) − r(t). (1.1) 1.1. LEYES DE NEWTON Y MECÁNICA DE UNA PARTÍCULA 11 La velocidad de una partı́cula se define como dr . dt En coordenadas cartesianas, las componentes de la velocidad son v≡ (1.2) dx dy dz , vy = , vz = . (1.3) dt dt dt Las componentes de la velocidad también se denotan como v1 = vx , v2 = vy , v3 = vz . La aceleración se define como vx = dv d2 r (1.4) = 2. dt dt Se acostumbra usar la siguiente notación para las derivadas con respecto al tiempo, a= dx d2 x , ẍ ≡ 2 . (1.5) dt dt El momento lineal o cantidad de movimiento de partı́cula con masa m que se mueve con velocidad a es la cantidad vectorial ẋ ≡ p = mv. (1.6) Una partı́cula puede experimentar interacciones con otras partı́culas. Las interacciones entre partı́culas están asociadas a sus propiedades intrı́nsecas y se manifiestan como fuerzas entre ellas. Por ejemplo, la interacción electromagnética está asociada a la carga eléctrica, mientras que la interacción gravitacional depende de la masa. Las fuerzas son cantidades vectoriales. La suma de las fuerzas debido a interacciones con otras partı́culas o con agentes externos se denomina fuerza total (neta) sobre la partı́cula; se denota por F. La fuerza total sobre una partı́cula puede afectar su estado de movimiento. Las Leyes de Newton describen el movimiento de una partı́cula sujeta a una fuerza total: I. Primera Ley de Newton: Una partı́cula permanece en reposo o en movimiento rectilı́neo uniforme si la fuerza total sobre ella es nula. II. Segunda Ley de Newton: Existen sistemas de referencia en los cuales el movimiento de una partı́cula con masa m y velocidad v está descrito por la ecuación F= d(mv) dp = . dt dt (1.7) III. Tercera Ley de Newton: Si Fji es la fuerza que ejerce una partı́cula j sobre una partı́cula i, y Fij es la fuerza que ejerce la partı́cula i sobre la partı́cula j, entonces Fji = −Fij . (1.8) 12 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Figura 1.3: Isaac Newton (1642-1727). La Segunda Ley de Newton establece una relación causa (fuerza) ↔ efecto (cambio de momento). La Primera Ley de Newton también se llama Ley de inercia, y es consecuencia de la Segunda Ley: si F = 0, entonces v = constante. La Tercera Ley también es conocida como Ley de acción y reacción. Las Leyes de Newton son leyes de la Naturaleza sustentadas en observaciones experimentales. La Segunda Ley de Newton es una ecuación vectorial, es decir, equivale a tres ecuaciones, una para cada componente cartesiana: Fi = dpi , dt i = 1, 2, 3. (1.9) Si m es constante, d2 r . (1.10) dt2 Matemáticamente, la Segunda Ley de Newton, Ec (1.10), corresponde a una ecuación diferencial de segundo orden para cada componente de r(t). La solución r(t) está determinada por dos condiciones iniciales, r(to ), v(to ). Este es el principio del determinismo en Mecánica Clásica, y que ha sido fundamental en el desarrollo del método cientı́fico. A finales del siglo XX, se encontró que el determinismo no necesariamente implica estabilidad de la predicción: existen sistemas dinámicos no lineales en los cuales perturbaciones infinitesimales de las condiciones iniciales de sus variables pueden conducir a evoluciones muy diferentes de esas variables. Este es el origen del moderno campo de estudio del Caos. Los sistemas de referencia donde se cumple la Segunda Ley de Newton se denominan sistemas de referencia inerciales. En ausencia de fuerzas, una partı́cula en reposo en un sistema inercial en un instante dado, sigue en reposo en todo instante. Los sistemas de referencia no inerciales son sistemas de referencia donde aparecen términos adicionales en la Segunda Ley de Newton, no asociados a las fuerzas explı́citas en el sistema. Esos términos adicionales se denominan fuerzas ficticias y son debidos a la aceleración del sistema de referencia. F = ma = m 1.1. LEYES DE NEWTON Y MECÁNICA DE UNA PARTÍCULA 13 Ejemplos: 1. Un sistema no inercial: péndulo en un sistema acelerado (x0 , y 0 , z 0 ). Figura 1.4: Péndulo en un sistema acelerado. El sistema (x0 , y 0 , z 0 ) posee una aceleración a en la dirección x, visto desde un sistema fijo (x, y, z). En el sistema acelerado, la componente en la dirección x0 de la fuerza que actúa sobre la masa del péndulo es fx0 = T sin θ, pero esta masa está en reposo en ese sistema; esto implica que ẍ0 = 0. Luego, una fuerza adicional ficticia igual a −T sin θ debe anular a fx0 , de modo que no haya fuerza neta en la dirección x0 . En el sistema (x, y, z), la Segunda Ley de Newton da simplemente T sin θ = ma. La fuerza de Coriolis es otro ejemplo de una fuerza ficticia en un sistema de referencia en rotación (Cap. 5). 2. Oscilador armónico simple. Figura 1.5: Oscilador armónico simple. La fuerza del resorte sobre la masa m es proporcional y opuesta al desplazamiento x desde la posición de equilibrio, tomada como x = 0, i.e., F = −kxx̂, donde k es la constante del resorte. Entonces, F = ma ⇒ −kx = mẍ ẍ + ω 2 x = 0, (1.11) donde ω 2 ≡ k/m. La Ec (1.11) es la ecuación del oscilador armónico. Su solución general es x(t) = A cos ωt + B sin ωt. (1.12) 14 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO También se puede escribir x(t) = C sin(ωt + φ), (1.13) con A = C sin φ, B = C cos φ. Los coeficientes A y B están determinados por las condiciones iniciales x(0) y ẋ(0) = v(0), x(0) ẋ(t) = A, = (1.14) v(0) −ωA sin ωt + Bω cos ωt ⇒ B = . ω (1.15) Luego, x(t) = x(0) cos ωt + v(0) sin ωt. ω (1.16) 3. Partı́cula en un medio viscoso. Figura 1.6: Partı́cula en medio viscoso. Experimentalmente se sabe que la fuerza ejercida por un medio viscoso sobre una partı́cula que se mueve en ese medio es proporcional a la velocidad de la partı́cula, F = −αv, donde α es un coeficiente de fricción caracterı́stico del medio. Supongamos que la partı́cula se mueve en la dirección x a partir de una posición inicial x(0) con velocidad inicial v(0). La Segunda Ley de Newton para la componente x de la fuerza da: dv −αv = m . (1.17) dt Integrando obtenemos, v(t) x(t) dx = c1 e−(α/m)t = , dt Z = v(0) e−(α/m)t dt = − c1 = v(0), v(0)m −(α/m)t e + c2 . α (1.18) (1.19) La constante c2 se determina usando la posición inicial x(0), c2 = x(0) + v(0)m . α (1.20) Luego, x(t) = x(0) + v(0)m 1 − e−(α/m)t . α (1.21) 1.1. LEYES DE NEWTON Y MECÁNICA DE UNA PARTÍCULA 15 4. Sistema de masa variable: movimiento de un cohete. Consideremos un cohete que se mueve verticalmente en el campo gravitacional de la Tierra. La masa del cohete en un tiempo t es m. La velocidad del cohete en t es v, y la velocidad del propelente expulsado es u. Sea dmp la masa del propelente expulsado en un instante t + dt. Entonces el cambio de masa del cohete en t + dt es dm = −dmp , puesto que la masa del cohete disminuye en el tiempo. Figura 1.7: Cohete en movimiento vertical. Aplicamos la Segunda Ley de Newton para la componente vertical y de la fuerza, −mg = dp p(t + dt) − p(t) = . dt dt (1.22) Tenemos p(t) = mv, p(t + dt) (1.23) = (m − dmp )(v + dv) + dmp u (1.24) = mv + m dv − dmp v − dmp dv + dmp u. (1.25) Luego, p(t + dt) − p(t) = m dv − dmp (v + dv − u) = m dv − dmp vrel , (1.26) donde hemos empleado la velocidad del propelente relativa al cohete, dada por vrel = (v + dv) − u. (1.27) Sustituyendo en la Ec. (1.22), obtenemos −mg = m dv dmp − vrel . dt dt (1.28) 16 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO La tasa de expulsion del propelente se define como R = escribir la denominada ecuación del cohete como m dmp . Luego, podemos dt dv = vrel R − mg. dt (1.29) De la Ec. (1.28), se puede obtener la variación de la velocidad del cohete en función del cambio de su masa, dm dv + vrel = −g dt. (1.30) m Integrando entre un valor inicial de masa m0 en t0 = 0 y un valor final mf en t0 = t, tenemos Z t Z f Z f dm −g dt0 dv = −vrel m 0 0 0 m0 ⇒ vf = v0 + vrel ln − gt. (1.31) mf Existen otros conceptos útiles en Mecánica, que definimos a continuación. Consideremos una partı́cula ubicada en la posición r y cuya velocidad es v. Se define el momento angular de la partı́cula como la cantidad vectorial l ≡ r × p = mr × v. (1.32) El torque ejercido por una fuerza F sobre una partı́cula ubicada en r se define como τ ≡ r × F. (1.33) La Ec. (1.33) se puede expresar como τ dp dt d(r × p) dr = − ×p dt dt dl :0 p + = v× dt dl . ⇒ τ = dt = r×F=r× (1.34) La Ec. (1.34) implica la conservación del momento angular : si el torque sobre una partı́cula es τ = 0, entonces l = constante. Esto significa que cada componente del vector l es una constante. En particular, una fuerza de la forma F = f (r)r̂, se denomina una fuerza central. La fuerza gravitacional es un ejemplo de una fuerza central. Para tales fuerzas, τ = 0. Luego, el momento angular de una partı́cula se conserva en presencia de fuerzas centrales. 1.1. LEYES DE NEWTON Y MECÁNICA DE UNA PARTÍCULA 17 La energı́a cinética de una partı́cula con masa m y velocidad v se define como la cantidad escalar 1 T ≡ mv 2 . (1.35) 2 Se define el trabajo realizado por una F externa sobre una partı́cula para llevarla desde una posición r1 hasta una posición r2 , como la integral de lı́nea Z 2 W12 ≡ F · ds, (1.36) 1 donde ds es el vector tangente a la trayectoria que une la posición r1 con la posición r2 . Figura 1.8: Trayectorı́a de un partı́cula entre r1 y r2 , sujeta a una fuerza F. Note que ds = dr = vdt. Luego, si m es constante, podemos escribir, Z 2 dv W12 = m · (v dt). dt 1 Usamos la relación d(v 2 ) = d(v · v) = 2v · dv, para expresar Z 2 Z 2 1 1 m W12 = v · dv = m d(v 2 ) 2 2 1 1 1 1 mv 2 − mv 2 , = 2 2 2 1 = T2 − T1 . (1.37) (1.38) Luego, el trabajo realizado por una F externa para llevar una partı́cula desde la posición r1 hasta la posición r2 depende solamente de la diferencia entre la energı́a cinética que posee la partı́cula en r2 y la energı́a cinética que posee en r1 . Note que, si se utiliza la misma fuerza F y la misma trayectoria, denotada por B, para ir del punto r1 al punto r2 y para volver de r2 a r1 , entonces Z 2 Z 1 F · ds = − F · ds ⇒ W12 (B) = −W21 (B), (1.39) 1 2 | {z } | {z } camino B camino B puesto que ds(1 → 2) = −ds(2 → 1) para la misma trayectoria. 18 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Si W12 realizado por una F externa es independiente de la trayectoria entre r1 y r2 , entonces F se llama fuerza conservativa. Es decir; si F es conservativa y A y B son dos caminos diferentes para ir de 1 a 2, entonces 2 Z |1 Z 2 F · ds | 1 {z } F · ds = {z } camino A (1.40) camino B Figura 1.9: Izquierda: dos trayectorias distintas A y B para ir del punto 1 al punto 2. Derecha: contorno cerrado C que encierra un área S. Luego, si F es conservativa, las Ecs. (1.40) y (1.39) implican que Z |1 2 Z F · ds {z } + camino A 1 F · ds = 0. | 2 {z } (1.41) camino B Puesto que los caminos A y B son arbitrarios, tenemos que para una F conservativa, I F · ds = 0, (1.42) C donde C es un contorno cerrado arbitrario. Usando el Teorema de Stokes, la integral de contorno Ec. (1.42) se puede escribir como I Z F · ds = (∇ × F) · da = 0, (1.43) C S donde S es el área encerrada por el contorno cerrado C. Puesto que C es arbitrario y por lo tanto S 6= 0, la Ec. (1.43) implica para una fuerza conservativa, ∇ × F = 0. (1.44) Por otro lado, para toda función escalar φ(r) se cumple la identidad vectorial ∇×∇φ = 0. Esto implica que la fuerza conservativa F debe ser proporcional al gradiente de alguna función escalar. Se define la función V (r) tal que F = −∇V (r). (1.45) 1.1. LEYES DE NEWTON Y MECÁNICA DE UNA PARTÍCULA Luego, para una fuerza conservativa Z W12 = − 19 2 ∇V · ds 1 Z = − 1 = 2 3 X ∂V dxi ∂xi i=1 ! Z =− 2 dV 1 V1 − V2 . (1.46) Vimos que el trabajo W12 realizado por toda fuerza es igual al cambio de energı́a cinética, T2 − T1 , que es una función escalar de la velocidad. La Ec. (1.46) muestra que, en sistemas conservativos, el trabajo W12 además está relacionado con cambios de otra función escalar V que depende de las coordenadas, evaluada en los puntos 1 y 2. La funcion escalar V (r) se denomina energı́a potencial y expresa la energı́a almacenada en un sistema, relacionada con la posición o configuración de los elementos constituyentes del sistema. Por ejemplo, un resorte estirado o comprimido una distancia x tiene una energı́a potencial almacenada V (x) = 12 kx2 , donde k es la constante del resorte. Un sistema de dos partı́culas con masas m1 y m2 , separadas una distancia r y sujetas a una interacción gravitacional, posee una energı́a potencial asociada V (r) = −Gm1 m2 /r, donde G es la constante universal gravitacional (Cap. 3). La Ec. (1.46) válida para fuerzas conservativas, junto con la Ec. (1.38) que se cumple para cualquier fuerza, conduce a la relación V1 − V2 = T2 − T1 , ⇒ T1 + V1 = T2 + V2 . (1.47) La energı́a mecánica total de una partı́cula se define como la cantidad escalar: E ≡ T + V. (1.48) E1 = E2 . (1.49) La Ec. (1.47) implica que Puesto que los puntos 1 y 2 son arbitrarios, la energia mecánica total es constante en cualquier punto para sistemas conservativos, E = T + V = constante. (1.50) El signo menos en el gradiente de la energı́a potencial, Ec. (1.45), tiene significado fı́sico; las propiedades de las fuerzas correspondientes a esta definición son consistentes con los comportamientos observados de todas las fuerzas conservativas en Fı́sica. Este signo menos implica que la cantidad constante asociada con una fuerza conservativa, denotada como energı́a mecánica total, se pueda definir como la suma de la energı́a cinética y de la energı́a potencial. Si la energı́a potencial depende tanto de las coordenadas como del tiempo, V (r, t) = V (x, y, z, t), la energı́a mecánica total puede no conservarse. Consideremos la derivada d dT dV dE = (T + V ) = + . dt dt dt dt (1.51) 20 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Calculamos dT dt = mv · dV (r, t) dt = 3 X ∂V ∂V ∂V ẋi + = ∇V · v + . ∂xi ∂t ∂t i=1 dv = F · v, dt (1.52) (1.53) Luego, dE dt = F · v + ∇V · v + ∂V ∂t = −∇V · v + ∇V · v + = ∂V ∂t ∂V . ∂t (1.54) donde hemos empleado F = −∇V , para un sistema conservativo. La Ec. (1.54) es la condición para la conservación de la energı́a mecánica: la energı́a mecánica total es constante si la energı́a potencial no depende explicitamente del tiempo, dE ∂V =0⇒ = 0 ⇒ E = constante. ∂t dt (1.55) La energı́a potencial V también puede ser definida para sistemas no conservativos; en esos casos V depende explı́citamente tanto de la posición como del tiempo. La fuerza correspondiente puede expresarse como el gradiente de esta V . Sin embargo, el trabajo hecho para mover una partı́cula entre los puntos 1 y 2 ya no es V1 − V2 , puesto que V cambia con el tiempo cuando la partı́cula se mueve. La energı́a total también puede ser definida como E = T + V ; pero la cantidad E no se conserva durante el movimiento. 1.2. Mecánica de un sistema de partı́culas Consideremos un conjunto de N partı́culas en un sistema de referencia cartesiano. Sean mi y ri la masa y la posición de la partı́cula i, respectivamente, con i = 1, . . . , N . Definimos el vector de posición relativa rij ≡ rj −ri , que va en la dirección de la partı́cula i a la partı́cula j. El vector de posición del centro de masa de un sistema de partı́culas se define como P P mi ri mi ri = i , (1.56) R ≡ Pi MT i mi P donde MT = i mi es la masa total del sistema. La velocidad del centro de masa es dR 1 X dri vcm = = mi . (1.57) dt MT i dt 1.2. MECÁNICA DE UN SISTEMA DE PARTÍCULAS 21 Figura 1.10: Sistema de N partı́culas en un sistema de referencia cartesiano. El momento lineal total del sistema de N partı́culas es PT = X i pi = X i mi dri dR = MT = MT vcm . dt dt (1.58) Luego, el momento total PT es equivalente al momento de una partı́cula que posea la masa total del sistema, moviéndose con la velocidad del centro de masa del sistema. Supongamos que existen fuerzas sobre las partı́culas, tanto internas como externas al sistema. Denotamos por Fji la fuerza que la partı́cula j ejerce sobre la partı́cula i, y por Fext (i) la fuerza total debida a influencias externas sobre la partı́cula i. Recordemos que las fuerzas de interacción entre dos partı́culas i y j obedecen la Tercera Ley de Newton, Fji = −Fij . (1.59) Figura 1.11: Tercera Ley de Newton, en sus dos formas. Para fuerzas centrales, la Tercera Ley es más restrictiva. Si Fij es central, Fij = fij (|rij |) rij , |rij | (1.60) 22 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO entonces las fuerzas sobre las partı́culas van en la dirección (paralela o antiparalela) del vector rij . Esta condición sobre fuerzas centrales se conoce como forma fuerte de la ley de acción y reacción. Cabe recordar que no todas las fuerzas cumplen esta condición; por ejemplo, las fuerzas magnéticas entre dos cargas en movimiento no siempre son centrales. La ecuación de movimiento para la partı́cula i puede expresarse como X d dpi = (mi vi ), (1.61) Fji + Fext (i) = dt dt j6=i PN donde i6=j Fji es la suma de las fuerzas internas sobre la partı́cula i, debido a las interacciones con las otras partı́culas. Para obtener la fuerza total sobre el sistema, sumamos sobre todas las partı́culas en la Ec. (1.61), XX X *0 X d ṗi = (mi vi ). (1.62) F + Fext (i) = ji dt i j i i El primer término es cero porque contiene sumas de pares de fuerzas Fji + Fij que se anulan debido a la Tercera Ley de Newton. Luego, si mi es constante ∀i, la Ec. (1.62) queda X X d2 r i Fext (i) = mi 2 . (1.63) dt i i Usando la definición del centro de masa, la Ec. (1.56), se puede expresar como X X d2 ri d2 R Fext (i) = m i 2 = MT 2 . dt dt i i (1.64) Luego, Fext (total) ≡ X Fext (i) = i dPT , dt (1.65) La Ec. (1.65) constituye una ecuación de movimiento para el centro de masa. La Ec. (1.65) implica que si la fuerza externa total sobre un sistema de partı́culas es cero, entonces el momento lineal total PT del sistema se conserva. El momento angular de la partı́cula i es li = ri × pi . (1.66) Entonces, el momento angular total del sistema de partı́culas es X X X lT = li = (ri × pi ) = (ri × mi vi ). i i (1.67) i Si definimos la posición r0i de la partı́cula i con respecto al centro de masa del sistema como r0i = ri − R, (1.68) la velocidad de la partı́cula i con respecto al centro de masa será vi0 = vi − vcm . (1.69) 1.2. MECÁNICA DE UN SISTEMA DE PARTÍCULAS 23 Figura 1.12: Posición relativa de una partı́cula con respecto al centro de masa. Entonces, en términos del centro de masa podemos escribir lT X (r0i + R) × mi (vi0 + vcm ) = i ! *0 X 0 mr × vcm × + i i i i ! ! *0 X X 0 mi vcm . +R × mi vi + R × X = (r0i mi vi0 ) i (1.70) i Para mostrar los términos que se anulan en la Ec. (1.70), calculamos MT R = X = X mi ri = X i mi (r0i + R) i mi r0i + MT R i X ⇒ mi r0i = 0. (1.71) i Del mismo modo, X mi vi0 = X i i dr0 d mi i = dt dt ! X mi r0i = 0. (1.72) i Entonces, la Ec. (1.70) para el momento angular total queda lT = X (r0i × p0i ) + R × (MT vcm ) . (1.73) i El momento angular total lT de un sistema de partı́culas contiene dos contribuciones: (i) el momento angular del centro de masa, R × (MP T vcm ); (ii) el momento angular relativo al centro de masa, i (r0i × p0i ). 24 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Calculemos la derivada temporal de lT , dlT dt = = N X X :0 X d mv (ri × pi ) = (v ri × ṗi i× i) + dt i i=1 i X X ri × Fext (i) + Fji i = X i j6=i XX :0 F ri × Fext (i) + (r i× ji ). ij6=i (1.74) El segundo término en la Ec. (1.74) contiene sumas de pares de la forma ri × Fji + rj × Fij = (rj − ri ) × Fij = rij × Fij , (1.75) puesto que Fji = −Fij , de acuerdo a la Tercera Ley de Newton. Si además suponemos que se cumple la Tercera Ley de Newton en forma fuerte, Fij = k|Fji |rij . Luego, rij ×Fij = 0 y el segundo término de la Ec. (1.74) se anula. Entonces, X dlT = ri × Fext (i) dt i X = τ i (externo) = τ T (externo). (1.76) i La Ec. (1.76) expresa la conservación del momento angular total de un sistema de partı́culas: si el torque externo total τ (externo total) = 0, entonces lT = constante. La energı́a cinética total de un sistema de partı́culas es 1X Ttotal = mi vi2 . (1.77) 2 i En coordenadas del centro de masa, vi = vi0 + vcm , y podemos escribir 1X Ttotal = mi (vi0 + vcm ) · (vi0 + vcm ) 2 i X 1X 1 1X 2 = mi vcm + mi vi02 + 2vcm · mi vi0 . 2 i 2 i 2 i Pero P mi vi0 = d P ( mi r0i ) = 0; luego dt 1 1X 2 Ttotal = MT vcm + mi vi02 . 2 2 (1.78) (1.79) Es decir, la energı́a cinética total de un sistema de partı́culas contiene dos contribuciones: 2 ;P (i) la energı́a cinética del centro de masa, 21 MT vcm (ii) la energı́a cinética relativa al centro de masa, 12 mi vi02 . 1.2. MECÁNICA DE UN SISTEMA DE PARTÍCULAS 25 Para obtener la conservación de energı́a mecánica total de un sistema de partı́culas, partimos de la ecuación de movimiento para una partı́cula, Ec. (1.61), Fext (i) + X Fji = j6=i d (mi vi ). dt (1.80) Asumimos que las particulas interaccionan mediante fuerzas centrales que dependen de la distancia entre las partı́culas; es decir, rij , (1.81) Fji ∝ fij (|rij |) |rij | rij = (rj − ri ). (1.82) Entonces, se puede definir una energı́a potencial de interacción Vij (|rij |) tal que Fji = −∇i Vji (|rij |), (1.83) donde denotamos ∇i = ∂/∂ri . Puesto que Fji = −Fij , las funciones fij = fji son simétricas con respecto al intercambio de i y j; luego debemos tener Vij (|rij |) = Vji (|rij |), (1.84) y, por lo tanto, ambas Fji y Fij son derivables a partir de una energı́a potencial de interacción mutua entre la partı́cula i y la partı́cula j, Fji = −∇i Vij (|rij |), Fji = −∇j Vij (|rij |). (1.85) Luego, suponiendo que las masas mi son constantes, la Ec. (1.80) se puede expresar como Fext (i) − X ∇i Vij (|rij |) = mi j6=i dvi . dt (1.86) Tomando el producto escalar de la Ec. (1.86) con vi , obtenemos vi · Fext (i) − vi · X ∇i Vij (|rij |) = j6=i 1 dvi2 mi . 2 dt (1.87) Sumando sobre todas las partı́culas, obtenemos ! X XX d X1 2 mi vi = vi · Fext (i) − vi · ∇i Vij (|rij |) dt 2 i i i j6=i = X = X = X i i i 1 XX vi · Fext (i) − [vi · ∇i Vij (|rij |) + vj · ∇j Vji (|rij |)] 2 i j6=i 1 XX vi · Fext (i) − [∇i Vij (|rij |) · vi + ∇j Vij (|rij |) · vj ] 2 i j6=i 1 XX d vi · Fext (i) − Vij (|rij |), 2 i dt j6=i (1.88) 26 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO donde hemos usado Vij (|rij |) = Vji (|rij |). Entonces, podemos escribir ! X X X X d 1 1 mi vi2 + Vij (|rij |) = vi · Fext (i). dt 2 2 i i i (1.89) j6=i Si asumimos que las fuerzas externas son conservativas, Fext (i) = −∇Vext (i), tenemos, ! X X d X Vext (i) . (1.90) vi · Fext (i) = − vi · ∇Vext (i) = − dt i i i La Ec. (1.89) se puede expresar entonces como ! X X X X 1 d 1 mi vi2 + Vij (|rij |) + Vext (i) = 0. dt 2 2 i i i (1.91) j6=i Podemos identificar la energı́a cinética total del sistema, Ttotal = X1 i 2 mi vi2 , (1.92) y la energı́a potencial total del sistema como, Vtotal = X Vext (i) + i donde Vint ≡ 1 XX Vij (|rij |), 2 i (1.93) j6=i 1 XX Vij (|rij |) 2 i (1.94) j6=i es la energı́a potencial total de la interacción entre las partı́culas. La Ec. (1.91) implica entonces que la energı́a total del sistema se conserva, Etotal = Ttotal + Vtotal = constante. 1.3. (1.95) Coordenadas generalizadas Consideremos un sistema de N partı́culas, i = 1, 2, . . . , N , cuyos vectores de posición son {r1 , r2 , . . . , rN }. Cada vector de posición posee tres coordenadas, ri = (xi , yi , zi ). El sistema de N partı́culas con posiciones {r1 , r2 , . . . , rN } está descrito por 3N coordenadas. En general existen restricciones o ligaduras para algunas coordenadas; por ejemplo, el movimiento ocurre sobre un plano (z = cte), o sobre un cı́rculo (x2 + y 2 = cte), sobre una esfera (x2 + y 2 + x2 = cte), etc. En general, las restricciones se pueden expresar como relaciones algebraicas o funcionales entre las coordenadas. 1.3. COORDENADAS GENERALIZADAS 27 Si un sistema posee k restricciones, éstas se puede expresar como k relaciones o funciones que ligan las coordenadas: f1 (r1 , r2 , . . . , t) = 0, f2 (r1 , r2 , . . . , t) = 0, .. . (1.96) fk (r1 , r2 , . . . , t) = 0. Las restricciones o ligaduras que se expresan en forma de relaciones algebraicas de la forma Ecs. (1.96) se llaman restricciones holonómicas. Las existencia de restricciones implica que no todas las 3N coordenadas son independientes. El número de coordenadas independientes cuando existen k restricciones holonómicas es s = 3N − k. La cantidad s determina el número de grados de libertad del sistema, o el número mı́nimo de coordenadas independientes necesarias para describir el movimiento del sistema. Los grados de libertad definen un conjunto de coordenadas generalizadas, denotadas por {q1 , q2 , . . . , qs }. La evolución temporal de estas coordenadas permite definir también un conjunto de velocidades generalizadas {q̇1 , q̇2 , . . . , q̇s }. En Mecánica Clásica, el tiempo t no es considerado como una coordenada, sino como un parámetro. Las coordenadas generalizadas no son necesariamente coordenadas cartesianas, sino que pueden consistir en otro tipo de coordenadas, tales como cantidades angulares, o inclusive pueden ser otras variables fı́sicas. Las coordenadas generalizadas {q1 , q2 , . . . , qs } están relacionadas con las coordenadas cartesianas {r1 , r2 , . . . , rN } por un conjunto de transformaciones: r1 = r1 (q1 , q2 , . . . , t), r2 = r2 (q1 , q2 , . . . , t), .. . (1.97) rN = rN (q1 , q2 , . . . , t). En general, el conjunto de ligaduras fα (r1 , r2 , . . . , rN , t) = 0, α = 1, 2, . . . , k, y las transformaciones ri (q1 , q2 , . . . , qs , t) = ri , i = 1, 2, . . . , N , permiten expresar las coordenadas generalizadas en términos de las coordenadas cartesianas, qj = qj (r1 , r2 , . . . , rN , t), j = 1, 2, . . . , s. Es decir, en principio, las transformaciones ri ↔ qj son invertibles. También pueden existir restricciones no descritas por ecuaciones algebraicas, las cuales se denominan restricciones no holonómicas. Éstas se expresan como desigualdades o en forma de ecuaciones diferenciales para las coordenadas. Por ejemplo, la restricción de que un conjunto de partı́culas con posiciones ri se mantenga dentro de una esfera de radio R es no holonómica, y se expresa como |ri | < R. Como veremos en este Capı́tulo, la formulación Lagrangiana de la Mecánica Clásica permite expresar las ecuaciones de movimiento del sistema directamente en términos de sus s coordenadas generalizadas, en lugar las 3N ecuaciones de movimiento para las componentes cartesianas que tendrı́a el sistema en la descripción Newtoniana. 28 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Ejemplos. 1. Péndulo simple. Consiste en una partı́cula (N = 1) con masa m colgada de un extremo de una varilla rı́gida de longitud l y masa despreciable, cuyo otro extremo está fijo, tal que la varilla cual puede girar en un plano vertical. Figura 1.13: Péndulo simple con longitud l y masa m. Ubicamos el origen O del sistema de coordenadas en el extremo fijo del péndulo. Hay k = 2 restricciones: z=0 ⇒ 2 2 x +y =l 2 ⇒ f1 (x, y, z) = z = 0. 2 (1.98) 2 2 f2 (x, y, z) = x + y − l = 0. (1.99) Luego, s = 3(1)−2 = 1. Hay una coordenada generalizada. El diagrama del sistema sugiere escoger q = θ como coordenada generalizada. Las transformaciones r(q) son x = l sin θ (1.100) y = −l cos θ, (1.101) y la transformación q(r) es −1 θ = tan x − y . (1.102) 2. Péndulo doble. Consiste en un péndulo plano que cuelga de otro péndulo plano. Hay N = 2 partı́culas y seis coordenadas cartesianas correspondientes a las componentes de r1 y r2 . Ubicamos el origen del sistema de coordenadas en el extremo fijo del péndulo superior. Hay k = 4 restricciones: f1 f2 f3 f4 = z1 = 0 = z2 = 0 = x21 + y22 − l12 = 0 = (x2 − x1 )2 + (y2 − y1 )2 − l22 = 0. (1.103) 1.3. COORDENADAS GENERALIZADAS 29 Figura 1.14: Péndulo doble. Luego, hay s = 3(2) − 4 = 2 coordenadas generalizadas. La figura sugiere las coordenadas generalizadas q1 = θ1 y q2 = θ2 . Las transformaciones ri (qj ) son x1 = l1 sin θ1 , y1 = −l1 cos θ1 , x2 = l1 sin θ1 + l2 sin θ2 y2 = −l1 cos θ1 − l2 cos θ2 . (1.104) Las transformaciones inversas qj (ri ) son θ1 θ2 x1 = tan − y1 x1 − x2 −1 = tan . y2 − y1 −1 (1.105) (1.106) 3. Partı́cula dentro de un cono invertido con ángulo de vértice α, cuyo eje es vertical. Figura 1.15: Partı́cula moviéndose dentro de un cono con su eje vertical. Hay N = 1 partı́cula y 3 coordenadas cartesianas para su posición. Hay una restricción, la relación r = z tan α que define al cono, la cual puede expresarse como f1 (x, y, z) = (x2 + y 2 )1/2 − z tan α = 0. (1.107) Entonces, hay s = 3(1) − 1 = 2 coordenadas generalizadas, que se pueden tomar como q1 = r, q2 = ϕ. 30 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Las transformaciones r(qj ) son x = r cos ϕ y = r sin ϕ z = r cot α, (1.108) y las transformaciones inversas qj (r) son ϕ = tan−1 y r = z tan α. x (1.109) 4. Partı́cula deslizando sobre un aro en rotación uniforme sobre su diamétro. Figura 1.16: Partı́cula deslizando sobre aro de radio a, el cual rota sobre su diámetro vertical con velocidad angular ω. La velocidad angular de rotación del aro sobre eje z es ω, asumida constante. Luego, ϕ = ωt. Hay k = 2 restricciones: f1 (x, y, z) = x2 + y 2 + z 2 − a2 = 0, (1.110) y = tan ϕ ⇒ f2 (x, y, z, t) = y − x tan ωt = 0. (1.111) x La función f2 es un ejemplo de ligadura que depende tanto de las coordenadas como del tiempo. Luego, s = 3(1) − 2 = 1. La coordenada generalizada apropiada es q = θ. Las transformaciones de coordenadas r(q) son z = a cos θ x = a sin θ cos ωt y = a sin θ sin ωt. (1.112) 5. Polea simple (máquina de Atwood). Hay N = 2 partı́culas. Las restricciones se pueden expresar como f1 f2 f3 f4 f5 = = = = = y1 + y2 − c1 = 0 x1 − c2 = 0 x2 − c3 = 0 z1 = 0 z2 = 0, (1.113) 1.3. COORDENADAS GENERALIZADAS 31 donde c1 , c2 , c3 son constantes. Luego, k = 5 y s = 3(2) − 5 = 1. Se puede escoger q = y1 , o q = y2 como la coordenada generalizada. Figura 1.17: Polea simple. 6. Restricción no holonómica: aro rodando sin deslizar sobre un plano. Figura 1.18: Izquierda: aro de radio R rodando sin deslizar sobre el plano (x, y). Derecha: condición de rodar sin deslizar; P es el punto de apoyo instantáneo. Existe la restricción z = cte. Sea θ el ángulo que forma el vector velocidad v con respecto a la dirección x̂. La condición de rodar sin deslizar se expresa como ds = vdt = Rdϕ ⇒ v = Rϕ̇. (1.114) Las componentes de la velocidad v son ẋ = v cos θ = Rϕ̇ cos θ ẏ = v sin θ = Rϕ̇ sin θ. (1.115) Esta relaciones diferenciales se pueden expresar como restricciones no holonómicas, dx − R cos θ dϕ = 0, dy − R sin θ dϕ = 0. (1.116) Las coordenadas generalizadas son: (x, y) para ubicar el punto de apoyo instantáneo P , θ para dar la dirección de la velocidad de P y la orientación del aro, y ϕ para ubicar un punto cualquiera sobre el aro. Luego s = 4. 32 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 1.4. Principios variacionales y ecuaciones de Euler En los problemas de extremos en el cálculo diferencial buscamos el valor de una variable para el cual una función es máxima o mı́nima. En cambio, los problemas de extremos en el cálculo variacional consisten en encontrar la función que hace que una integral definida sea extrema. dy . Definimos una Supongamos una función y = y(x) que posee derivada y 0 (x) = dx 0 funcional como una función de varias variables de la forma f (y, y , x). En general, los argumentos de una funcional son funciones y sus derivadas. Una funcional es una función de funciones dadas. Por ejemplo, consideremos la funcional f (y, y 0 , x) = y(x) + y 0 (x). Para la función y(x) = 3x + 2, tenemos f (y, y 0 , x) = 3x + 5; mientras que para y(x) = x2 , f (y, y 0 , x) = x2 + 2x. El valor resultante de una funcional dada depende de la función y. Una funcional asigna un número a una función, mientras que una función asigna un número a otro número. El problema de extremos en el cálculo variacional se expresa mediante el requerimiento de que una integral definida de una funcional dada tome un valor máximo o mı́nimo. Figura 1.19: Función y(x) que pasa por dos puntos sobre el plano (x, y). Consideremos dos puntos fijos (x1 , y1 ) y (x2 , y2 ) en el plano (x, y), unidos por una función o trayectoria y = y(x), con derivada y 0 (x), x ∈ [x1 , x2 ], tal que y(x1 ) = y1 y y(x2 ) = y2 . Principio variacional: Dada una funcional f (y, y 0 , x), ¿cuál es la función y(x) que hace que la integral definida Z x2 I= f (y, y 0 , x)dx , (1.117) x1 tenga un valor extremo (máximo ó mı́nimo) entre x1 y x2 ?. Puesto que I es una integral definida, la cantidad I corresponde a un número cuyo valor depende de la función y(x) empleada en el argumento de la funcional dada f (y, y 0 , x). Si I es extremo de f para una y(x) (y por tanto y 0 (x)), entonces cualquier otra trayectoria cercana a y(x) definida entre x1 y x2 debe incrementar (o disminuir) en valor de la integral I, es decir, debe variar I. Se emplea la notación δI para indicar la variación de I. Luego, δI = 0 significa que I es extremo. 1.4. PRINCIPIOS VARIACIONALES Y ECUACIONES DE EULER 33 El principio variacional sobre I requiere que δI = 0 para una f dada, lo cual implica una condición sobre y(x). Para encontrar esta condición, supongamos que y(x) es la función que pasa por x1 y x2 , y que hace δI = 0. Ahora, consideremos una trayectoria cercana a y(x) definida como y(x, α) = y(x) + α η(x), (1.118) donde α es un parámetro que mide la desviación con respecto a la función y(x) y η(x) es una función arbitraria, pero diferenciable (es decir, existe η 0 (x)), tal que se anule en los puntos x1 y x2 : η(x1 ) = η(x2 ) = 0. Entonces y(x, α) también pasa por (x1 , y1 ), (x2 , y2 ): y(x1 , α) = y(x1 ) = y1 ; y(x2 , α) = y(x2 ) = y2 . (1.119) Figura 1.20: Trayectoria y(x, α) = y(x) + α η(x). Note que y(x, 0) = y(x). Calculemos I para la trayectoria perturbada y(x, α), Z x2 I(α) = f (y(x, α), y 0 (x, α), x)dx; (1.120) x1 es decir, I es una función del parámetro α. La condición δI = 0 cuando α = 0, implica que dI(α) = 0, (1.121) dα α=0 lo cual a su vez implica una condición sobre f y sobre y(x). Calculemos la derivada Z x2 dI df (y(x, α), y 0 (x, α), x) = dx (1.122) dα dα x1 Z x2 ∂f ∂y ∂f ∂y 0 = (x, α) + 0 (x, α) dx. ∂y ∂α ∂y ∂α x1 Pero, ∂y (x, α) = η(x); ∂α ∂y 0 ∂ (x, α) = ∂α ∂α dy dx = d dx puesto que α y x son independientes. Luego, Z x2 dI ∂f ∂f dη = η(x) + 0 dx. dα ∂y ∂y dx x1 ∂y ∂α = dη dx (1.123) (1.124) 34 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO R R El segundo término se integra por partes, usando uv 0 dx = uv − u0 vdx, x2 Z x2 Z x2 ∂f dη d ∂f ∂f η(x) − η(x)dx, dx = 0 ∂y 0 ∂y 0 x1 ∂y dx x1 dx x1 pero x2 ∂f = ∂f η(x2 ) − ∂f η(x1 ) = 0, η(x) ∂y 0 ∂y 0 ∂y 0 x1 puesto que η(x2 ) = η(x1 ) = 0. Luego: Z x2 dI ∂f d ∂f = − η(x)dx = 0. dα ∂y dx ∂y 0 x1 Evaluando en α = 0, Z x2 Z x2 dI d ∂f ∂f − η(x)dx = = M (x)η(x) = 0 , dα α=0 ∂y dx ∂y 0 α=0 x1 x1 donde M (x) = d ∂f − ∂y dx ∂f ∂y 0 (1.125) (1.126) (1.127) (1.128) . (1.129) α=0 Cuando α = 0, el integrando es una función de x solamente: M (x)η(x). Luego, la condI dición dα = 0 ⇒ M (x)η(x) = 0. Pero como η(x) es una función arbitraria no nula, α=0 entonces debemos tener M (x) = 0. Se acostumbra escribir esta condición en la forma d ∂f ∂f − = 0. (1.130) dx ∂y 0 ∂y La Ec. (1.130) es la ecuación de Euler, y expresa la condición que debe satisfacer la función y(x) que hace δI = 0 para una integral definida I de una funcional f (y, y 0 , x) dada. La Ec. (1.130) es una ecuación diferencial de segundo orden para y(x), cuya solución permite encontrar y(x) para las condiciones dadas. Figura 1.21: Leonhard Euler (1707-1783). 1.4. PRINCIPIOS VARIACIONALES Y ECUACIONES DE EULER 35 Ejemplos. 1. Calcular la trayectoria y(x) que corresponde a la distancia más corta entre dos puntos dados en un plano. Figura 1.22: Trayectoria más corta entre dos puntos del plano (x, y). El elemento de distancia sobre el plano es p ds = dx2 + dy 2 . La distancia entre entre dos puntos (x1 , y1 ) y (x2 , y2 ) del plano es s 2 Z 2 Z x2 Z x2 dy I= ds = 1+ dx = f (y, y 0 ) dx, dx 1 x1 x1 p donde f (y, y 0 ) = 1 + (y 0 )2 . (1.131) (1.132) Buscamos la trayectoria y(x) que da el valor mı́nimo de la integral I; es decir, que hace δI = 0. La ecuación de Euler es la condición que satisface esa y(x), d ∂f ∂f − = 0. (1.133) 0 dx ∂y ∂y Tenemos ∂f = 0, ∂y ∂f y0 =p . 0 ∂y 1 + (y 0 )2 (1.134) = c = constante, (1.135) Luego, la ecuación de Euler conduce a y0 p 1 + (y 0 )2 y0 ⇒ y c ≡a 1 − c2 = ax + b, = √ (1.136) (1.137) donde a y b son constantes que se pueden determinar a partir de los puntos dados. 36 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 2. Superficie mı́nima de revolución. Encontrar el perfil y(x) entre x1 , x2 que produce el área mı́nima de revolución alrededor del eje y. Figura 1.23: Superficie mı́nima de revolución de y(x) alrededor de eje y. El elemento de área de revolución alrededor de eje y es p dA = 2πx ds = 2πx dx2 + dy 2 . (1.138) El área de revolución generada por y(x) es Z Z x2 p Z A = dA = 2π x 1 + (y 0 )2 dx = 2π (1.139) x1 x2 f (y, y 0 , x) dx. x1 Identificamos en el integrando la funcional f (y, y 0 , x) = x la ecuación de Euler, d ∂f ∂f − = 0. dx ∂y 0 ∂y p 1 + (y 0 )2 que satisface (1.140) Calculamos las derivadas, ∂f xy 0 =p . 0 ∂y 1 + y 02 ∂f = 0, ∂y (1.141) Sustituyendo en la ecuación de Euler, obtenemos xy 0 p 1 + y 02 y0 ⇒y = a = constante a dy =√ 2 dx x − a2 Z dx = a √ x2 − a2 p = a ln(x + x2 − a2 ) + k. = (1.142) (1.143) (1.144) 1.4. PRINCIPIOS VARIACIONALES Y ECUACIONES DE EULER 37 Los valores de las constantes a y k se determinan con (x1 , y1 ) y (x2 , y2 ). Si escribimos k = b − a ln a, la Ec. (1.144) también se puede expresar como ! √ x y−b x + x2 − a2 = cosh−1 (1.145) = ln a a a y−b ⇒ x = a cosh , (1.146) a que es la ecuación de una catenaria. 3. Braquistocrona (del griego, “tiempo más corto”). Encontrar la trayectoria y(x) de una partı́cula en el campo gravitacional terrestre que da el menor tiempo posible para ir de un punto (x1 , y1 ) a otro punto (x2 , y2 ) sin fricción, partiendo del reposo (v0 = 0). Figura 1.24: Problema de la braquistocrona. Fijamos el punto (x1 , y1 ) = (0, 0). Para este problema, escogemos la dirección del eje y hacia abajo, con el fin de obtener la función y(x). Si v es la magnitud de la velocidad en un punto de la trayectoria, entonces el elemento de tiempo para recorrer una distancia infinitesimal ds a lo largo de la trayectoria es ds dt = . (1.147) v El tiempo total para ir del punto 1 al punto 2 es Z 2 Z 2p 2 ds dx + dy 2 t1→2 = = . (1.148) v 1 v 1 En el sistema de referencia escogido, la fuerza gravitacional sobre la partı́cula es F = mg ŷ, y por lo tanto la energı́a potencial es V = −mgy, tal que V (y = 0) = 0. Puesto que v0 = 0, la conservación de la energı́a E = T + V da 0= 1 mv 2 − mgy 2 ⇒ v= p 2gy. (1.149) 38 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Luego, el tiempo total para ir del punto 1 al punto 2 es Z 2p 2 dx + dy 2 √ t1→2 = , 2gy 1 (1.150) la cual se puede expresar como y2 Z t1→2 = y1 s 1 + (x0 )2 dy . 2gy (1.151) La integral t1→2 es del tipo Z y2 I= f (x, x0 , y)dy , (1.152) y1 donde hemos intercambiado los roles de las variables x y y. Identificamos la funcional s 1 + (x0 )2 0 f (x, x , y) = . (1.153) 2gy La ecuación de Euler correspondiente es d ∂f ∂f = 0. − dy ∂x0 ∂x Puesto que ∂f ∂x (1.154) = 0, la ecuación de Euler queda ∂f x0 p =√ = c = constante. 0 ∂x 2gy 1 + (x0 )2 (1.155) Note que la ecuación de Euler para la funcional f (x, x0 , y) resulta más sencilla que la ecuación correspondiente a una funcional f (y, y 0 , x) en este caso. Luego, s dx 2gc2 y x0 = = (1.156) dy 1 − 2gc2 y Z r Z s y y ⇒x = dy = dy, (1.157) 1 2R −y − y 2gc2 donde hemos llamado 2R ≡ 1/2gc2 . Haciendo el cambio de variable y = R(1 − cos θ), dy = R sin θdθ, (1.158) tenemos Z s x = = R (1 − cos θ) sin θ dθ = R (1 + cos θ) R(θ − sin θ) + k. Z (1 − cos θ) dθ (1.159) 1.4. PRINCIPIOS VARIACIONALES Y ECUACIONES DE EULER 39 Luego, la trayectoria queda parametrizada en términos de la variable θ, = R(1 − cos θ), (1.160) x = R(θ − sin θ), (1.161) y la cual corresponde a una cicloide que pasa por (x1 , y1 ) = (0, 0), con k = 0. La constante R se determina con el punto (x2 , y2 ) y da al valor del radio de la circunferencia que genera la cicloide. La trayectoria de tiempo mı́nimo es un arco de cicloide que pasa por los puntos dados. Algunos puntos permiten trazar la cicloide, π π θ= ⇒ y = R, x = R; 2 2 θ = π ⇒ x = πR, y = 2R; θ = 2π ⇒ x = 2πR, y = 0. Figura 1.25: Trayectoria de la cicloide en el problema de la braquistocrona. El problema de la braquistocrona es famoso en la historia de la Fı́sica. Fue planteado originalmente por Galileo, quien pensó que la trayectorı́a de menor tiempo entre dos puntos era un arco de circunferencia. El problema fue estudiado años después por Johann Bernoulli, cuyo trabajo contribuyó a la fundación del cálculo variacional. Figura 1.26: Johann Bernoulli (1667 -1748). 4. El Principio de Fermat establece que la luz se propaga entre dos puntos dados en un medio siguiendo la trayectoria que corresponde al tiempo mı́nimo. A partir de este principio, pueden obtenerse las leyes de la Óptica Geométrica. 40 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Figura 1.27: Pierre de Fermat (1601-1665). Como ejemplo, consideremos la ley de refracción de la luz entre dos medios cuyos ı́ndices de refracción son n1 y n2 , con n1 < n2 , como muestra la figura. La velocidad de la luz en un medio con ı́ndice de refracción n es v = c/n, donde c es la velocidad de la luz en el vacı́o. Figura 1.28: Ley de refracción de la luz. El tiempo para viajar entre los puntos 1 y 2 es t1→2 = = 2 Z 2 p 2 ds dx + dy 2 = n c 1 v 1 Z 1 x2 p n 1 + (y 0 )2 dx c x1 Z (1.162) El ı́ndice de refracción depende de y, n = n1 , para y > 0, y n = n2 , para y < 0, tal que dn sólo en y = 0. En la Ec. (1.162) podemos identificar la funcional dy 6= 0 p 0 f (y, y , x) = n 1 + (y 0 )2 , la cual satisface la ecuación de Euler, d ∂f ∂f − = 0. (1.163) 0 dx ∂y ∂y Calculamos las derivadas, ∂f ny 0 p = , ∂y 0 1 + y 02 ∂f = 0. ∂y (1.164) 1.4. PRINCIPIOS VARIACIONALES Y ECUACIONES DE EULER Entonces, ny 0 p 1 + y 02 = cte. 41 (1.165) dy Note que y 0 = dx = − tan θ, donde θ es el ángulo de la trayectoria con el eje y. Sustituyendo en la Ec. (1.165), obtenemos −√ n tan θ = −n sin θ = cte. 1 + tan 2 θ (1.166) La Ec. (1.166) implica la ley de refracción, n1 sen θ1 = n2 sen θ2 . Principios variacionales para funcionales de varias variables. Consideremos una funcional que depende de s funciones y de sus derivadas, f (yi (x), yi0 (x), . . . , x) , i = 1, 2, . . . , s (1.167) tal que la integral definida Z x2 I= f (yi (x), yi0 (x), x) dx (1.168) x1 adquiera un valor extremo, i.e., δI = 0, para las funciones yi (x), i = 1, 2, . . . , s, que pasan por x1 y x2 . Consideremos ahora la funcional de trayectorias perturbadas f (yi (x, α), yi0 (x, α), . . . , x) , i = 1, 2, . . . , s, (1.169) donde yi (x, α) = yi (x) + αηi (x), y las ηi (x) son funciones arbitrarias que satisfacen ηi (x1 ) = ηi (x2 ) = 0. Figura 1.29: Trayectorias y1 (x) y y2 (x) en el espacio (x, y1 , y2 ). (1.170) 42 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Consideremos la integral definida con las funciones yi (x, α) como argumentos, Z x2 I(α) = f [yi (x, α), yi0 (x, α), x]dx. (1.171) x1 La condición de que I(0) sea extremo, o que δI = 0, implica que dI = 0. dα α=0 (1.172) Calculamos dI = dα Z x2 x1 s X ∂f ∂yi ∂f ∂yi0 + 0 dx, ∂yi ∂α ∂yi ∂α i=1 (1.173) donde ∂yi0 (x, α) = ηi0 (x). ∂α ∂yi (x, α) = ηi (x); ∂α (1.174) El segundo término en la suma de la Ec. (1.173) se integra por partes: Z x2 x1 0 Z x x2 2 * ∂f 0 ∂f d ∂f − η (x)dx = η (x) ηi (x)dx , i 0 ∂yi0 i ∂y ∂yi0 x1 dx x1 i (1.175) donde usamos la condición de que las funciones ηi (x) se anulan en x1 y en x2 . Luego, Z dI dα x2 = s X ∂f = i=1 x1 ∂f d − ∂yi dx ∂yi x1 i=1 s Z x2 X d dx − ∂f ∂yi0 ∂f ∂yi0 ηi (x)dx ηi (x)dx. (1.176) Puesto que las funciones ηi (x) son arbitrarias, la condición dI = 0, dα α=0 (1.177) implica las s condiciones d dx ∂f ∂yi0 − ∂f = 0, ∂yi i = 1, 2, . . . , s que corresponden a s ecuaciones de Euler, una para cada función yi (x). (1.178) 1.5. PRINCIPIO DE MÍNIMA ACCIÓN Y ECUACIONES DE LAGRANGE 1.5. 43 Principio de mı́nima acción y ecuaciones de Lagrange Consideremos un sistema descrito por s coordenadas generalizadas {q1 , q2 , . . . , qs } y sus correspondientes s velocidades generalizadas {q̇1 , q̇2 , . . . , q̇s }. Definimos una funcional escalar de {qj }, {q̇j } y t, dada por L(qj , q̇j , t) ≡ T − V, j = 1, 2, . . . , s, (1.179) donde T y V son la energı́a cinética y la energı́a potencial del sistema, respectivamente, expresadas en términos de las coordenadas y velocidades generalizadas. La funcional L(qj , q̇j , t) se denomina Lagrangiano del sistema. En principio, todo sistema mecánico se puede caracterizar por un Lagrangiano L. Supongamos que el estado del sistema, en los instantes de tiempo t = t1 y t = t2 , está descrito por los correspondientes conjuntos de coordenadas y velocidades generalizadas, t1 : {qj (t1 )}, {q̇j (t1 )} ; t2 : {qj (t2 )}, {q̇j (t2 )}. (1.180) Principio de mı́nima acción: La evolución del sistema entre el estado en t1 y el estado en t2 es tal que el valor de la integral definida Z t2 S= L(qj , q̇j , t) dt , (1.181) t1 denominada la acción del sistema, sea mı́nima; es decir, δS = 0 (S es un extremo). El Principio de mı́nima acción es un principio variacional; implica que las ecuaciones de movimiento de un sistema, en términos de sus coordenadas generalizadas, pueden formularse a partir del requerimiento de que una cierta condición sobre la acción S del sistema sea satisfecha. El Principio de mı́nima acción fue formulado en distintas formas por Maupertuis y por Hamilton; también se llama Principio de Hamilton. Figura 1.30: Pierre-Louis Moreau de Maupertuis (1698-1759). 44 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Para encontrar las ecuaciones de movimiento a partir del Principio de mı́nima acción, supongamos que qj (t), j = 1, . . . , s, son las trayectorias para las cuales S adquiere un valor extremo. Consideremos la variación de qj como qj (t) + δqj (t), y la variación de q̇j como q̇j (t) + δ q̇j (t). Supongamos extremos fijos en t1 y t2 . Luego, δqj (t1 ) = δqj (t2 ) = 0. La variación de qj o de q̇j produce un incremento (o decremento) en el valor de S. La variación en S cuando qj (t) es reemplazado por qj (t) + δqj (t), y q̇j por q̇j (t) + δ q̇j (t), es Z δS t2 Z t2 L(qj + δqj , q̇j + δ q̇j , t)dt − = = L(qj , q̇j , t)dt t1 t1 Z t2 δL(qj , q̇j , t)dt t1 Z t2 = t1 s X ∂L ∂L δqj + δ q̇j dt. ∂qj ∂ q̇j j=1 (1.182) Similarmente a la integral I en un principio variacional, podemos expresar el segundo término de la Ec. (1.182) como Z t2 t1 t2 Z t2 d ∂L ∂L ∂L d (δqj ) dt = δqj − δqj . ∂ q̇j dt ∂ q̇j ∂ q̇j t1 dt t1 (1.183) Puesto que los extremos son fijos, tenemos t2 ∂L δqj = 0. ∂ q̇j t1 (1.184) El principio de mı́nima acción requiere que Z t2 δS = t1 s X ∂L j=1 ∂qj − d dt ∂L ∂ q̇j δqj dt = 0. (1.185) La condición δS = 0 implica que se deben cumplir s ecuaciones para las qj (t): d dt ∂L ∂ q̇j − ∂L = 0, ∂qj j = 1, . . . , s. (1.186) Las Ecs. (1.186) se denominan ecuaciones de Lagrange. Constituyen un conjunto de s ecuaciones diferenciales acopladas de segundo orden para las s coordenadas generalizadas qj (t), las cuales describen la evolución del sistema en el tiempo. Se pueden establecer las siguientes analogı́as entre el Principio de mı́nima acción y un principio variacional: Z t2 Z x2 S= L(qj , q̇j , t)dt ↔ I = f (yi , yi0 , x)dx (1.187) t1 x1 1.6. PROPIEDADES DE LAS ECUACIONES DE LAGRANGE 45 L(qj , q̇j , t) ↔ f (yi , yi0 , x) t ↔ x qj ↔ yi q̇j ↔ yi0 δqj (t) ↔ ηi (x) δ q̇j (t) ↔ ηi0 (x). Figura 1.31: Joseph Louis de Lagrange (1736-1827). 1.6. Propiedades de las ecuaciones de Lagrange Las ecuaciones de Lagrange son equivalentes a la Segunda Ley de Newton si las coordenadas generalizadas corresponden a las coordenadas cartesianas de las partı́culas del sistema. Para ver esto, consideremos N partı́culas denotadas por α = 1, 2, . . . , N . Sea xj (α) la componente cartesiana j (j = 1, 2, 3) de la posición r(α) de la partı́cula α. Asumamos las coordenadas cartesianas como coordenadas generalizadas; i. e., qj = xj (α). La energı́a cinética del sistema es T = 3 N X X 1 α=1 i=1 2 mα ẋ2i (α). (1.188) La energı́a potencial es V = N X Vα (r(1), r(2), . . . , r(N )). (1.189) α=1 El Lagrangiano está dado por L=T −V = N X 3 X 1 α=1 i=1 2 mα ẋ2i (α) − N X Vα (r(1), r(2), . . . , r(N )). (1.190) α=1 La ecuación de Lagrange para la coordenada xj (α) es d ∂L ∂L − = 0. dt ∂ ẋj (α) ∂xj (α) (1.191) 46 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Calculamos ∂L ∂ ẋj (α) ∂L ∂xj (α) ∂T = m(α)ẋj (α) = pj (α), ∂ ẋj (α) ∂Vα = − = Fj (α). ∂xj (α) = Sustitución en la ecuación de Lagrange para xj (α) da dpj (α) = Fj (α), dt (1.192) lo que corresponde a la Segunda ley de Newton para la componente j de las coordenadas cartesianas de la partı́cula α. Las ecuaciones de Lagrange no constituyen una nueva teorı́a del movimiento; los resultados de la formulación Lagrangiana o de la formulación Newtoniana del movimiento de un sistema dado son los mismos; tan sólo la descripción y el método usado para obtener esos resultados son diferentes. Son descripciones distintas de un mismo efecto fı́sico. Las leyes de Newton enfatizan causas externas vectoriales (fuerzas) actuando sobre un cuerpo, mientras que la formulación Lagrangiana se enfoca en cantidades escalares (energı́as cinética y potencial) asociadas con el cuerpo. La formulación Newtoniana describe el movimiento de un sistema partı́cula por partı́cula. La formulación Lagrangiana describe el movimiento como una propiedad de todo el sistema. En contraste con el punto de vista Newtoniano de causa-efecto para explicar el movimiento, el Principio de mı́nima acción permite interpretar éste como el resultado de un propósito de la Naturaleza. En la formulación Newtoniana, las ligaduras entre las coordenadas requieren ser descritas como fuerzas actuando sobre las partı́culas, mientras que en la formulación Lagrangiana las ligaduras pueden incluirse dentro de las coordenadas generalizadas. Las ecuaciones de Lagrange son más generales que la segunda Ley de Newton; son aplicables a cualquier conjunto de coordenadas generalizadas de un sistema. Además de sistemas mecánicos clásicos, las ecuaciones de Lagrange se pueden aplicar para todo sistema donde se puede definir un Lagrangiano, incluyendo medios contı́nuos, campos, Mecánica Cuántica. El Principio de Mı́nima acción sugiere una conexión profunda entre la Fı́sica y la Geometrı́a, una propiedad que ha sido empleada en el desarrollo de varias teorı́as fı́sicas. Como veremos, una ventaja de la formulación Lagrangiana es que permite descubrir simetrı́as fundamentales presentes en sistemas fı́sicos. Las ecuaciones que describen la evolución de muchos sistemas, además de sistemas mecánicos, pueden derivarse a partir de algún principio variacional. Por ejemplo, el Principio de Fermat establece que la propagación de la luz entre dos puntos dados en un medio sigue la trayectoria que corresponde al tiempo mı́nimo. Como vimos en la Sec. 1.4, a partir de ese principio pueden obtenerse las leyes de la Óptica Geométrica. Las ecuaciones de Lagrange poseen las siguientes propiedades: 1. Las ecuaciones de movimiento de un sistema son invariantes si a su Lagrangiano se le agrega una derivada total temporal de una función f (qj , t). 1.6. PROPIEDADES DE LAS ECUACIONES DE LAGRANGE 47 Sea L(qj , q̇j , t) el Lagrangiano del sistema para el cual δS = 0. Entonces, el nuevo Lagrangiano será df (qj , t) L0 (qj , q̇j , t) = L(qj , q̇j , t) + . (1.193) dt La nueva acción es Z t2 L0 (qj , q̇j , t)dt S0 = t1 t2 Z L(qj , q̇j , t)dt + f (qj (t2 ), t2 ) − f (qj (t1 ), t1 ). = (1.194) t1 Luego, δS 0 = δS + δf (qj (t2 ), t2 ) − δf (qj (t1 ), t1 ). (1.195) Pero f (qj (t2 ), t2 ) y f (qj (t1 ), t1 ) son cantidades fijas cuya variación es cero. Luego δS 0 = δS, y la condición δS = 0 ⇒ δS 0 = 0. Por lo tanto, las ecuaciones de movimiento que se derivan de L y de L0 son equivalentes. 2. La forma de las ecuaciones de Lagrange es invariante con respecto al conjunto de coordenadas generalizadas utilizadas en un sistema. La derivación de las ecuaciones de Lagrange no depende del conjunto de coordenadas generalizadas especı́ficas; por lo tanto, la forma de las ecuaciones de Lagrange no depende de un conjunto particular de coordenadas {qi }. Se puede escoger otro conjunto de s coordenadas generalizadas independientes {Qi }, y las ecuaciones de Lagrange también se cumplen en esas coordenadas. Sea {qi }, i = 1, . . . , s, un conjunto de coordenadas generalizadas para un sistema con s grados de libertad y cuyo Lagrangiano es L(qi , q̇i , t). Las ecuaciones de Lagrange para estas coordenadas son ∂L d ∂L − = 0. (1.196) dt ∂ q̇j ∂qj Supongamos una transformación de las coordenadas {qi } a otro conjunto de coordenadas generalizadas {Qi }, i = 1, . . . , s, de la forma qi = qi (Q1 , Q2 , . . . , Qs , t), (1.197) la cual se conoce como una transformación puntual. Por ejemplo, la transformación puntual qi = qi (Qj , t) entre coordenadas cartesianas {qi } = {x, y} y coordenadas polares {Qi } = {r, ϕ} en un plano es x = r cos ϕ, y = r sin ϕ. La invarianza de la forma de las ecuaciones de Lagrange significa que el Lagrangiano expresado como función de las nuevas coordenadas y velocidades generalizadas, L(Qi , Q̇i , t), también satisface las ecuaciones de Lagrange ∂L ∂L d − = 0. (1.198) dt ∂ Q̇i ∂Qi 48 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Para demostrar esta invarianza, a partir de la Ec. (1.197) calculamos s q̇i = X ∂qi dqi ∂qi = Q̇k + . dt ∂Qk ∂t (1.199) k=1 Luego, q̇i = q̇i (Q1 , . . . , Qs , Q̇1 , . . . , Q̇s , t). Entonces, el Lagrangiano se puede expresar como función de las nuevas coordenadas y velocidades generalizadas como L(q1 , . . . , qs , t) = L[qi (Q1 , . . . , Qs , t), q̇i (Q1 , . . . , Qs , Q̇1 , . . . , Q̇s , t), t]. (1.200) Tenemos, s X ∂L = ∂Qi j=1 ∂L ∂ q̇j ∂L ∂qj + ∂qj ∂Qi ∂ q̇j ∂Qi , 0 s s X 7 ∂L ∂L ∂ q̇j X ∂L ∂ q̇j ∂L ∂qj = + = . ∂qj ∂ ∂ q̇j ∂ Q̇i ∂ q̇j ∂ Q̇i ∂ Q̇i j=1 j=1 Q̇i (1.201) (1.202) Notemos que ∂ q̇j ∂ Q̇i = s X ∂qj ∂ Q̇k ∂Qk ∂ Q̇i k=1 = s X ∂qj ∂qj δik = . ∂Qk ∂Qi (1.203) k=1 Luego, d dt ∂L ∂ Q̇i s s d X ∂L ∂qj X ∂L ∂qj ∂L ∂ q̇j ∂L = − + − ∂Qi dt j=1 ∂ q̇j ∂Qi ∂qj ∂Qi ∂ q̇j ∂Qi j=1 s X ∂qj d ∂L ∂L ∂L d ∂qj ∂ q̇j = − + − (. 1.204) ∂Qi dt ∂ q̇j ∂qj ∂ q̇j dt ∂Qi ∂Qi j=1 El primer término en la Ec. (1.204) es cero, de acuerdo a la Ec. (1.196). Por otro lado, ∂ dqj d ∂qj ∂ q̇j = = , (1.205) ∂Qi ∂Qi dt dt ∂Qi por lo cual, el segundo término en la Ec. (1.204) también se anula. Luego, d ∂L ∂L − = 0. (1.206) dt ∂ Q̇i ∂Qi Por lo tanto, la forma de las ecuaciones de Lagrange se conserva bajo transformaciones puntuales de las coordenadas generalizadas. 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 1.7. 49 Ecuaciones de Lagrange para varios sistemas 1. Péndulo simple. Figura 1.32: Coordenada generalizada θ para el péndulo simple. Vimos que la coordenada generalizada es el ángulo θ. Entonces, x = l sin θ, ẋ = lθ̇ cos θ y = −l cos θ, ẏ = lθ̇ sin θ. Expresamos T y V en función de θ y θ̇, T = 1 1 1 mv 2 = m(ẋ2 + ẏ 2 ) = ml2 θ̇2 , 2 2 2 V = mgy = −mgl cos θ. (1.207) (1.208) Entonces, el Lagrangiano es L=T −V = 1 2 2 ml θ̇ + mgl cos θ. 2 (1.209) La ecuación de Lagrange para θ es d ∂L ∂L = 0. − dt ∂ θ̇ ∂θ (1.210) Calculamos los términos ∂L = −mgl sin θ, ∂θ ∂L = ml2 θ̇, ∂ θ̇ d dt ∂L ∂ θ̇ = ml2 θ̈. (1.211) Luego, la ecuación de Lagrange queda como ml2 θ̈ + mgl sin θ g ⇒ θ̈ + sin θ l = 0 = 0, que es la conocida ecuación del péndulo simple. (1.212) 50 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 2. Partı́cula libre. La condición de estar libre significa que no hay fuerza neta sobre la partı́cula, F = −∇V = 0. Luego, V = constante para una partı́cula libre. a) El Lagrangiano en coordenadas cartesianas es L=T = 1 m(ẋ2 + ẏ 2 + ż 2 ). 2 Las ecuaciones de Lagrange ∂L d ∂L − = 0, dt ∂ ẋi ∂xi i = 1, 2, 3, (1.213) (1.214) conducen a ∂L = mẋi = constante, (1.215) ∂ ẋi que expresan la conservación de la componente i del momento lineal de la partı́cula. b) Lagrangiano en coordenadas esféricas. Figura 1.33: Coordenadas esféricas para una partı́cula. Las coordenadas se expresan como x = r sin θ cos ϕ y = r sin θ sin ϕ z = r cos θ. (1.216) ẋ = ṙ sin θ cos ϕ + rθ̇ cos θ cos ϕ − rϕ̇ sin θ sin ϕ ẏ = ṙ sin θ sin ϕ + rθ̇ cos θ sin ϕ + rϕ̇ sin θ cos ϕ ż = ṙ cos θ − rθ̇ sin θ. (1.217) Las velocidades son El Lagrangiano de una partı́cula libre en coordenadas esféricas es L= 1 m(ṙ2 + r2 θ̇2 + r2 ϕ̇2 sin2 θ). 2 (1.218) 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 51 3. Partı́cula en el campo gravitacional terrestre. Figura 1.34: Partı́cula en el campo gravitacional terrestre. El movimiento en el campo gravitacional uniforme de la Tierra ocurre en un plano vertical; i.e., s = 2. Tomamos las coordenadas cartesianas (x, y) como coordenadas generalizadas. Supongamos que la partı́cula posee posición inicial (xo , yo ) y velocidad inicial (vox , voy ). Entonces, 1 m(ẋ2 + ẏ 2 ), V = mgy 2 1 L = T − V = m(ẋ2 + ẏ 2 ) − mgy. 2 La ecuación de Lagrange para x es d ∂L ∂L − = 0, dt ∂ ẋ ∂x T = (1.219) (1.220) (1.221) la cual resulta en ẍ = 0 ⇒ x = b1 t + b2 , (1.222) con b1 y b2 constantes. Usando las condiciones iniciales en t = 0, obtenemos x(t) = xo + vox t. La ecuación de Lagrange para y es d ∂L ∂L − = 0, dt ∂ ẏ ∂y (1.223) (1.224) lo que conduce a 1 y = − gt2 + c1 t + c2 . 2 Usando las condiciones iniciales, podemos expresar ÿ = −g ⇒ 1 y(t) = yo + voy t − gt2 . 2 La trayectoria descrita por la partı́cula es una parábola, g voy (x − xo ) − 2 (x − xo )2 . y(x) = yo + vox 2vox (1.225) (1.226) (1.227) La trayectoria parabólica corresponde a la minima acción; mientras que la cicloide corresponde al tiempo minimo entre dos puntos en el campo gravitacional terrestre. 52 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 4. Oscilador armónico. Figura 1.35: Oscilador armónico simple. Usando la coordenada generalizada x, tenemos 1 2 kx , 2 1 1 L = T − V = mẋ2 − kx2 . 2 2 La ecuación de Lagrange para x es d ∂L ∂L − = 0. dt ∂ ẋ ∂x T = Calculamos 1 mẋ2 , 2 V = ∂L ∂L = mẋ ; = −kx. ∂ ẋ ∂x (1.228) (1.229) (1.230) (1.231) Luego, obtenemos mẍ + kx = 0, ẍ + ω 2 x = 0, (1.232) donde ω 2 ≡ k/m. 5. Partı́cula moviéndose sobre un cono invertido en el campo gravitacional terrestre. Figura 1.36: Partı́cula sobre un cono invertido con ángulo de vértice α. Coordenadas generalizadas son q1 = ϕ y q2 = r. Entonces, x = r cos ϕ y = r sin ϕ z = r cot α. (1.233) 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 53 Las velocidades correspondientes son ẋ = ẏ = ż = ṙ cos ϕ − rϕ̇ sin ϕ ṙ sin ϕ + rϕ̇ cos ϕ ṙ cot α. (1.234) Energı́a cinética, T = = 1 1 m(ẋ2 + ẏ 2 + ż 2 ) = m[ṙ2 (1 + cot2 α) + r2 ϕ̇2 ] 2 2 1 m(ṙ2 csc2 α + rϕ̇2 ). 2 (1.235) Energı́a potencial, V = mgz = mgr cot α. (1.236) Por lo tanto, el Lagrangiano L = T − V es 1 m(ṙ2 csc2 α + r2 ϕ̇2 ) − mgr cot α. 2 La ecuación de Lagrange para ϕ es d ∂L ∂L − = 0, dt ∂ ϕ̇ ∂ϕ L= donde ∂L = 0, ∂ϕ (1.237) (1.238) (1.239) Luego, ∂L = mr2 ϕ̇ = cte ≡ lz . (1.240) ∂ ϕ̇ La cantidad constante es la componente lz del momento angular en términos de las coordenadas generalizadas, lo que se puede verificar calculando la componente cartesiana lz = m(xẏ − y ẋ), y usando las Ecs. (1.233) y (1.234). La componente lz se conserva porque la componente τz del vector de torque total producido por las fuerzas actuantes sobre la partı́cula (su peso y la fuerza normal ejercida por la superficie del cono) es cero. La ecuación de Lagrange para r es d ∂L ∂L − = 0, dt ∂ ṙ ∂r donde ∂L = mrϕ̇2 − mg cot α, ∂r (1.241) ∂L = mṙ csc2 α. ∂ ṙ (1.242) Luego, r̈ csc2 α − rϕ̇2 + g cot α 2 2 ⇒ r̈ − rϕ̇ sin α + g sin α cos α = 0, = 0. (1.243) 54 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 6. Péndulo doble. Consiste en un péndulo de longitud l1 y masa m1 , del cual cuelga un segundo péndulo de longitud l2 y masa m2 . Figura 1.37: Péndulo doble. Coordenadas generalizadas son q1 = θ1 , q2 = θ2 . Luego, x1 = l1 sin θ y1 = −l1 cos θ x2 = l1 sin θ + l2 sin θ2 y2 = −l1 cos θ − l2 cos θ2 ⇒ ẋ1 = l1 θ̇1 cos θ1 ⇒ ẏ1 = l1 θ̇1 sin θ1 ⇒ ẋ2 = l1 θ̇1 cos θ1 + l2 θ̇2 cos θ2 ⇒ ẏ2 = l1 θ̇1 sin θ1 + l2 θ̇2 sin θ2 (1.244) (1.245) La energı́a cinética de partı́cula 1 es T1 = 1 1 1 m1 v12 = m1 (ẋ21 + ẏ12 ) = m1 l12 θ̇12 . 2 2 2 (1.246) La energı́a cinética de partı́cula 2 es T2 = 1 m2 v22 2 = = = 1 m2 (ẋ22 + ẏ22 ) 2 1 m2 [l12 θ̇12 + l22 θ̇22 + 2l1 l2 θ̇1 θ̇2 (cos θ1 cos θ2 + sin θ1 sin θ2 )] 2 1 (1.247) m2 [l12 θ̇12 + l22 θ̇22 + 2l1 l2 θ̇1 θ̇2 cos(θ1 − θ2 )]. 2 Las energı́as potenciales de las partı́culas se pueden expresar como V1 = m1 gy1 = −m1 gl1 cos θ1 (1.248) V2 = m2 gy2 = −m2 g(l1 cos θ1 + l2 cos θ2 ). (1.249) La energı́a cinética del sistema es T = T1 +T2 y la energı́a potencial es V = V1 +V2 . El Lagrangiano del sistema es L = T − V , lo que conduce a L = 1 1 (m1 + m2 )l12 θ̇12 + m2 l22 θ̇22 + m2 l1 l2 θ̇1 θ̇2 cos(θ1 − θ2 ) 2 2 + (m1 + m2 )gl1 cos θ1 + m2 gl2 cos θ2 . (1.250) 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 55 Ecuación de Lagrange para θ1 , d dt ∂L ∂ θ̇1 − ∂L = 0, ∂θ1 (1.251) donde ∂L = −m2 l1 l2 θ̇1 θ̇2 sin(θ1 − θ2 ) − (m1 + m2 )gl1 sin θ1 ∂θ1 ∂L = (m1 + m2 )l12 θ̇1 + m2 l1 l2 θ̇2 cos(θ1 − θ2 ) ∂ θ̇1 d ∂L = (m1 + m2 )l12 θ̈1 + m2 l1 l2 [θ̈2 cos(θ1 − θ2 ) − θ̇2 (θ̇1 − θ̇2 ) sin(θ1 − θ2 ]. dt ∂ θ̇1 Por lo tanto, la ecuación de Lagrange para θ1 queda (m1 +m2 )l12 θ̈1 +m2 l1 l2 θ̈2 cos(θ1 −θ2 )+m2 l1 l2 θ̇22 sin(θ1 −θ2 )+(m1 +m2 )gl1 sin θ1 = 0. (1.252) Ecuación de Lagrange para θ2 es d dt ∂L ∂ θ̇2 − ∂L = 0, ∂θ2 (1.253) donde ∂L = ∂θ2 ∂L = ∂ θ̇2 d ∂L = dt ∂ θ̇2 m2 l1 l2 θ̇1 θ̇2 sin(θ1 − θ2 ) − m2 gl2 sin θ2 , m2 l22 θ̇2 + m2 l1 l2 θ̇1 cos(θ1 − θ2 ), m2 l22 θ̈2 + m2 l1 l2 [θ̈1 cos(θ1 − θ2 ) − θ̇1 (θ̇1 − θ̇2 ) sin(θ1 − θ2 ]. Luego, la ecuación de Lagrange para θ2 queda m2 l22 θ̈2 + m2 l1 l2 θ̈1 cos(θ1 − θ2 ) − m2 l1 l2 θ̇12 sin(θ1 − θ2 ) + m2 gl2 sin θ2 = 0. (1.254) Despejando θ̈1 y θ̈2 de las Ecs. (1.252) y (1.254), las ecuaciones de Lagrange se pueden expresar como θ̈1 = g(sin θ2 cos ∆θ − M sin θ1 ) − (l2 θ̇22 + l1 θ̇12 cos ∆θ) sin ∆θ , l1 (µ − cos2 ∆θ) θ̈2 = gM (sin θ1 cos ∆θ − sin θ2 ) − (M l1 θ̇12 + l2 θ̇22 cos ∆θ) sin ∆θ , (1.256) l2 (µ − cos2 ∆θ) (1.255) donde ∆θ ≡ θ1 − θ2 , y M ≡ 1 + m1 /m2 . Las ecuaciones de movimiento para las coordenadas θ1 y θ2 del péndulo doble son acopladas y no lineales. Esto hace que el movimiento del péndulo doble pueda ser muy irregular o caótico, como veremos en el Cap. 2. 56 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 7. Péndulo con soporte deslizante horizontalmente sin fricción. Figura 1.38: Péndulo con soporte deslizante. Coordenadas generalizadas son q1 = x1 y q2 = θ, x2 = x1 + l sin θ, ẋ2 = ẋ1 + lθ̇ cos θ, y2 = −l cos θ, ẏ2 = lθ̇ sin θ. Energı́a cinética, T = 1 1 m1 ẋ21 + m2 (ẋ21 + l2 θ̇2 + 2ẋ1 θ̇l cos θ). 2 2 (1.257) Energı́a potencial, V = m2 gy2 = −m2 gl cos θ. (1.258) Lagrangiano, L=T −V = 1 1 (m1 + m2 )ẋ21 + m2 (l2 θ̇2 + 2ẋ1 θ̇l cos θ) + m2 gl cos θ. 2 2 (1.259) Ecuación de Lagrange para x1 , d dt donde ∂L = 0, ∂x1 ∂L ∂ ẋ1 ∂L = 0, ∂x1 (1.260) ∂L = (m1 + m2 )ẋ1 + m2 θ̇l cos θ. ∂ ẋ1 (1.261) − Luego, la ecuación para x1 queda (m1 + m2 )ẋ1 + m2 lθ̇ cos θ = cte ≡ Px , (1.262) esta ecuación expresa la conservación de la componente Px del momento lineal total en dirección del eje x, puesto que no hay fuerzas externas netas en esa dirección. Ecuación de Lagrange para θ, d dt ∂L ∂ θ̇ − ∂L = 0, ∂θ (1.263) 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 57 donde ∂L = −m2 lẋ1 θ̇ sin θ − m2 gl sin θ; ∂θ ∂L = m2 ẋ1 l cos θ + m2 l2 θ̇. ∂ θ̇ (1.264) Por lo tanto, la ecuación de Lagrange para θ es lθ̈ + ẍ1 cos θ − ẋ1 θ̇ sin θ + ẋ1 θ̇ sin θ + g sin θ = 0, ⇒ lθ̈ + ẍ1 cos θ + g sin θ = 0. (1.265) 8. Aro rodando sin deslizar por un plano inclinado. Figura 1.39: Aro rodando sin deslizar por un plano inclinado. Un punto cualquiera en el aro puede ubicarse con dos coordenadas, x y θ, las cuales están ligadas por una restricción no holonómica, que es la condición de rodar sin deslizar: ẋ = Rθ̇. Luego, hay un grado de libertad; se puede escoger como coordenada generalizada a x ó θ. La energı́a cinética del aro es la suma de la energı́a cinética del centro de masa más la energı́a cinética relativa al centro de masa, 0 T = Tcm + Trelativa al CM (1.266) donde Tcm es la energı́a cinética de translación del centro de masa, Tcm = 1 mẋ2 , 2 (1.267) 0 y Trel. al CM es la energı́a cinética de rotación, 0 Trel. al CM = 1 2 1 1 I θ̇ = (mR2 )θ̇2 = mR2 θ̇2 . 2 2 2 (1.268) La energı́a potencial es V = mgh = mg(l − x) sin α. (1.269) Entonces, el Lagrangiano es L=T −V = 1 1 mẋ2 + mR2 θ̇2 − mg(l − x) sin α. 2 2 (1.270) 58 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Sustituyendo θ̇ = ẋ/R en L, obtenemos L = mẋ2 + mgx sin α − mgl sin α. (1.271) El término constante mgl sin α se puede suprimir en L, pues no afecta las ecuaciones de movimiento. La ecuación de Lagrange para x es d ∂L ∂L − =0 (1.272) dt ∂ ẋ ∂x donde ∂L = mg sin α, ∂x ∂L = 2mẋ. ∂ ẋ (1.273) Luego, g sin α = 0. (1.274) 2 El aro baja por el plano rodando sin deslizar, con la mitad de la aceleración que tendrı́a si simplemente deslizara sin fricción. ẍ − 9. Péndulo de longitud l y masa m cuyo soporte gira en un circulo de radio a en un plano vertical, con velocidad angular constante ω. Figura 1.40: Péndulo con soporte en movimiento circular uniforme. Expresamos φ = ωt. Luego, x = a cos ωt + l sin θ, ẋ = −ωa sin ωt + lθ̇ cos θ (1.275) y = a sin ωt − l cos θ, ẏ = ωa cos ωt + lθ̇ sin θ. (1.276) Energı́a cinética, T = 1 1 m(ẋ2 + ẏ 2 ) = m[a2 ω 2 + l2 θ̇2 + 2aωlθ̇(sin θ cos ωt − cos θ sin ωt)]. (1.277) 2 2 Energı́a potencial, V = mgy = mg(a sin ωt − l cos θ). (1.278) 1 m[l2 θ̇2 + 2aωlθ̇ sin(θ − ωt)] + mgl cos θ, 2 (1.279) El Lagrangiano es L=T −V = 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 59 df donde hemos omitido términos constantes (a2 ω 2 ) y la derivada total = mga sin ωt, dt mga con f = − cos ωt. ω La ecuación de Lagrange para θ es ∂L d ∂L − = 0. (1.280) dt ∂ θ̇ ∂θ donde ∂L = ∂θ ∂L = θ̇ ∂ d ∂L = dt ∂ θ̇ maωlθ̇ cos(θ − ωt) − mgl sin θ, ml2 θ̇ + maωl sin(θ − ωt), ml2 θ̈ + maωl(θ̇ − ω) cos(θ − ωt). Sustituyendo en la ecuación de Lagrange para θ, obtenemos l2 θ̈ + aωlθ̇ cos(θ − ωt) − aω 2 l cos(θ − ωt) − aωlθ̇ cos(θ − ωt) + gl sin θ = 0, (1.281) lo cual queda como θ̈ − g aω 2 cos(θ − ωt) + sin θ = 0. l l (1.282) Note que si ω = 0, la Ec. (1.282) corresponde a la ecuación de movimiento de un péndulo simple. La Ec. (1.282) describe el movimento de un péndulo simple sujeto a una fuerza periódica. La energı́a total E = T + V no se conserva en este sistema, puesto que ∂V ∂t 6= 0; se requiere un suministro externo de energı́a para mantener girando el soporte del péndulo con velocidad angular ω constante. 10. Péndulo de resorte. Figura 1.41: Péndulo de resorte. 60 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO El movimiento de la partı́cula ocurre en el plano vertical (x, y). Definimos k como la constante del resorte, l es la longitud del resorte en reposo (en ausencia de la masa m), y r es la longitud del resorte con la masa m. Las coordenadas generalizadas son q1 = r y q2 = θ. Entonces, x= y= ẋ = ẏ = r sin θ −r cos θ, rθ̇ cos θ + ṙ sin θ rθ̇ sin θ − ṙ cos θ. (1.283) 1 1 m(ẋ2 + ẏ 2 ) = m(ṙ2 + r2 θ̇2 ). 2 2 (1.284) 1 k(r − l)2 − mgr cos θ. 2 (1.285) La energı́a cinética es T = La energı́a potencial es V = Entonces, el Lagrangiano es L=T −V = 1 1 m(ṙ2 + r2 θ̇2 ) − k(r − l)2 + mgr cos θ. 2 2 La ecuación de Lagrange para θ es d ∂L ∂L = 0, − dt ∂ θ̇ ∂θ (1.286) (1.287) la cual se puede escribir como rθ̈ + 2ṙθ̇ + g sin θ = 0. La ecuación de Lagrange para r es d ∂L ∂L − = 0, dt ∂ ṙ ∂r (1.288) (1.289) que da como resultado, r̈ − rθ̇2 + k (r − l) − g cos θ = 0. m (1.290) Las ecuaciones de movimiento para las coordenadas θ y r del péndulo de resorte están acopladas y son no lineales. Este sistema exhibe comportamiento caótico para ciertos valores de sus parámetros (Cap. 2). 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 61 11. El soporte de un péndulo plano de masa m y longitud l rota sin fricción con velocidad angular uniforme ω alrededor del eje vertical z. a) Encontrar la ecuación de movimiento del péndulo. b) Encontrar el ángulo de equilibrio del péndulo. Figura 1.42: Péndulo con soporte giratorio. a) La coordenada generalizada es q = θ. Para encontrar la ecuación de movimiento, expresamos x = l sin θ cos ωt, y = l sin θ sin ωt, (1.291) z = −l cos θ, y las velocidades ẋ = lθ̇ cos θ cos ωt − lω sin θ sin ωt ẏ = lθ̇ cos θ sin ωt + lω sin θ cos ωt ż = lθ̇ sin θ. (1.292) La energı́a cinética es T = 1 1 m ẋ2 + ẏ 2 + ż 2 = ml2 θ̇2 + ω 2 sin2 θ . 2 2 (1.293) La energı́a potencial correspondiente es V = mgz = −mgl cos θ. (1.294) El Lagrangiano es L=T −V = 1 2 2 ml θ̇ + ω 2 sin2 θ + mgl cos θ . 2 La ecuación de Lagrange para θ es d ∂L ∂L − = 0, dt ∂ θ̇ ∂θ la cual resulta en θ̈ − ω 2 sin θ cos θ + g sin θ = 0 . l (1.295) (1.296) (1.297) 62 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO b) En un punto de equilibrio, la fuerza neta sobre la partı́cula se anula y la aceleración se hace cero. El ángulo de equilibrio θo del péndulo está dado por la condición θ̈ = 0 en la ecuación de movimiento, g (1.298) θ̈ = 0 ⇒ ω 2 sin θo cos θo = sin θo l Hay dos posibles soluciones, sin θo = 0 ⇒ θo = 0, g g . ω cos θ0 = ⇒ θo = cos−1 l ω2 l 2 (1.299) (1.300) 12. Regulador volante. Figura 1.43: Regulador volante. El punto O en extremo superior está fijo. La longitud a de las varillas es constante. La masa m2 se mueve sin fricción sobre el eje vertical y que pasa por el punto O, mientras que las masas dos masas m1 giran con velocidad angular constante ω alrededor del eje y. Las coordenadas para m2 son x2 = 0, y2 = −2a cos θ, z2 = 0. (1.301) Las coordenadas para una de las masas m1 son y1 = −a cos θ, x1 = a sin θ sin ωt, z1 = a sin θ cos ωt. (1.302) Coordenadas para la otra masa m1 , y10 = y1 , x01 = −x1 , z10 = −z1 . (1.303) 1.7. ECUACIONES DE LAGRANGE PARA VARIOS SISTEMAS 63 Hay un solo grado de libertad. Se puede tomar la coordenada generalizada q = θ. Tenemos, T = V = 1 1 2m1 (ẋ21 + ẏ12 + ż12 ) + m2 ẏ22 = m1 (a2 θ̇2 + ω 2 a2 sin2 θ) + 2m2 a2 θ̇2 sin2 θ. 2 2 2m1 gy1 + m2 gy2 = −2m1 ga cos θ − 2m2 ga cos θ. L = T − V = m1 (a2 θ̇2 + ω 2 a2 sin2 θ) + 2m2 a2 θ̇2 sin2 θ + 2(m1 + m2 )ga cos θ. La ecuación de Lagrange para θ es d ∂L ∂L − = 0, dt ∂ θ̇ ∂θ (1.304) donde ∂L = θ̇ ∂ d ∂l = dt ∂ θ̇ ∂L = ∂θ 2m1 a2 θ̇ + 4m2 a2 θ̇ sin2 θ, 2m1 a2 θ̈ + 4m2 a2 (θ̈ sin2 θ + 2θ̇2 sin θ cos θ), 2m1 ω 2 a2 sin θ cos θ + 4m2 a2 θ̇2 sin θ cos θ − 2(m1 + m2 )ga sin θ, Sustituyendo en la ecuación de Lagrange, obtenemos 2θ̈a2 (m1 + 2m2 sin2 θ) + 4m2 a2 θ̇2 sin θ cos θ −2m1 ω 2 a2 sin θ cos θ + 2(m1 + m2 )ga sin θ = 0, (1.305) Note que si ω = 0 y m2 = 0, la ecuación se reduce a θ̈ + g sin θ = 0, a que es la ecuación de un péndulo simple. (1.306) 64 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 1.8. Problemas 1. El principio de Fermat establece que la propagación de la luz entre dos puntos dados en un medio sigue la trayectoria de mı́nimo tiempo. Determine la trayectoria de un rayo de luz dentro de un disco cristalino de radio a, grosor despreciable, y cuyo ı́ndice de refracción n varı́a radialmente como a) n(r) = a/r. b) n(r) = a/r2 . c) Encuentre n(r) tal que un rayo de luz dentro de este disco describa una trayectoria circular. 2. Calcule la trayectoria que da la distancia más corta entre dos puntos sobre la superficie de un cono invertido, con ángulo de vértice α. Use coordenadas cilı́ndricas. 3. Determine la curva y(x), tal que y(0) = 0, y(π/2) = 1, para la cual alcanza su valor R π/2 0 2 extremo la integral I = 0 (y ) − y 2 dx. 4. Calcule el valor mı́nimo de la integral Z 1 0 2 I= (y ) + 12xy dx, 0 donde la función y(x) satisface y(0) = 0 y y(1) = 1. 5. En los páramos andinos se encuentra el pueblo A y, a una distancia de 2π Km al este de A, está el pueblo B. El terreno entre estos dos pueblos es montañoso y no hay carreteras asfaltadas. Sin embargo, la experiencia ha indicado que la velocidad de un ciclista en bicicleta montañera en esa zona se puede expresar aproximadamente como v = 10(Km/h) ey/3 , donde y es la distancia en Km medida perpendicularmente a la lı́nea recta que une A y B. ¿Cuál es el mı́nimo tiempo que tardarı́a un ciclista entre los pueblos A y B?. 6. La forma adoptada por una cuerda de densidad uniforme ρ que cuelga suspendida entre dos puntos en un campo gravitacional corresponde al mı́nimo de su energı́a potencial. Determine esa forma. 7. Encuentre la geodésica (i.e. la trayectoria de menor distancia) entre los puntos P1 = (a, 0, 0) y P2 = (−a, 0, π) sobre la superficie x2 + y 2 − a2 = 0. Use coordenadas cilı́ndricas. 1.8. PROBLEMAS 65 8. Un cuerpo se deja caer desde una altura h y alcanza el suelo en un tiempo T . La ecuación de movimiento concebiblemente podrı́a tener cualquiera de las formas y = h − g1 t, 1 y = h − g2 t2 , 2 1 y = h − g3 t3 ; 4 donde g1 , g2 , g3 son constantes apropiadas. Demuestre que la forma correcta es aquella que produce el mı́nimo valor de la acción. 9. El Lagrangiano de una partı́cula de masa m es L= m2 ẋ4 + mẋ2 f (x) − f 2 (x), 12 donde f (x) es una función diferenciable de x. Encuentre la ecuación de movimiento. 10. Encuentre la ecuación de movimiento de un péndulo paramétrico, el cual consiste en un péndulo de masa m cuya longitud se hace variar de la forma l = lo (1 + b sin ωt). 11. Una varilla de peso despreciable está suspendida de un extremo, de modo que puede oscilar en un plano vertical. Una partı́cula de masa m se desliza sin fricción a lo largo de la varilla. a) Encuentre la energı́a de la partı́cula. b) Obtenga las ecuaciones de movimiento de la partı́cula. 12. Una partı́cula de masa m se mueve sin fricción sobre un aro de radio R, el cual gira con velocidad angular uniforme ω alrededor de su diámetro vertical. a) Derive la ecuación de movimiento de la partı́cula. b) Encuentre la posición de equilibrio de la partı́cula. 13. Una partı́cula de masa m se desliza sin fricción sobre un aro de radio a, el cual rota con velocidad angular constante ω alrededor de su diámetro horizontal. ¿Cuál es la ecuación de movimiento de la partı́cula?. 14. Obtenga las ecuaciones de movimiento de un péndulo esférico, es decir, una partı́cula de masa m suspendida de una varilla rı́gida, sin peso y sin fricción, cuya longitud es l 15. Un aro de radio R y masa despreciable cuelga de un punto de su borde de modo que puede oscilar en su plano vertical. Una partı́cula de masa m se desliza sin fricción sobre el aro. Encuentre las ecuaciones de movimiento de la partı́cula. 66 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 16. Un péndulo compuesto está formado por una varilla de masa despreciable y longitud l, con un extremo fijo y el otro conectado al punto medio de una segunda varilla sin masa de longitud a, (a < l), en cuyos extremos hay dos masas m1 y m2 . Las varillas pueden rotar sin fricción en un mismo plano vertical. Encuentre las ecuaciones de movimiento de este sistema. 17. Un sistema consiste en una partı́cula de masa m que se mueve verticalmente colgada de un resorte de constante k y de la cual cuelga a su vez un péndulo de longitud l y masa m. Desprecie la masa de la varilla del péndulo y considere que éste se mueve en un plano vertical. Encuentre las ecuaciones de movimiento del sistema. 18. Encuentre la ecuación de movimiento para el parámetro angular θ en el problema de la braquistocrona. 19. Una manera de simular gravedad en una nave espacial es mediante rotación. Considere un péndulo de longitud l y masa m dentro de una nave, y cuyo soporte gira en un cı́rculo de radio R con velocidad angular constante ω en el mismo plano del péndulo. Calcule ω tal que el ángulo θ con respecto a la dirección radial describa el mismo movimiento que tendrı́a este péndulo colgado verticalmente de un punto fijo en el campo gravitacional terrestre. 20. Una partı́cula de masa m y carga q1 se mueve sin fricción sobre la superficie de una esfera de radio R en el campo gravitacional terrestre. Otra carga q2 se encuentra fija en el punto más bajo de la esfera. a) Encuentre las ecuaciones de movimiento de la primera carga. b) Encuentre la posición de equilibrio de la primera carga. 1.8. PROBLEMAS 67 21. Una masa m unida a una cuerda se mueve sin fricción sobre una mesa tal que el otro extremo de la cuerda pasa a través de un agujero en la mesa y está halado por alguien. Inicialmente, la masa se mueve en un cı́rculo, con energı́a E. La cuerda es halada a continuación, hasta que el radio del cı́rculo se reduce a la mitad. ¿Cuánto trabajo se hizo sobre la masa?. 22. Una cuerda de masa despreciable pasa a través una polea fija y soporta una masa 2m en un extremo. En el otro extremo de la cuerda se encuentra una masa m y, colgando de ésta por medio de un resorte de constante k, hay otra masa m. a) Encuentre las ecuaciones de movimiento del sistema. b) Encuentre la posición de la masa que cuelga del resorte en función del tiempo. 23. Una partı́cula de masa m1 cuelga de una varilla de masa despreciable y longitud l, cuyo punto de soporte consiste en otra partı́cula de masa m2 que se mueve horizontalmente sujeta a dos resortes de constante k cada uno. Encuentre las ecuaciones de movimiento. 68 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO 24. Un aro uniforme de radio a y masa m rueda sin deslizar dentro de un cilindro fijo de radio R, (R > a). Encuentre el perı́odo para pequeñas oscilaciones del aro. 25. Dos masas, m1 y m2 , están conectadas por una cuerda de longitud l a través de un agujero en el vértice de un cono vertical con ángulo de vértice α, de manera que m1 se mueve sobre la superficie interior del cono y m2 cuelga verticalmente. Desprecie la fricción. a) Determine las ecuaciones de movimiento del sistema. b) Calcule el radio de equilibrio de m1 . 26. Una partı́cula de masa m está atada a una cuerda de masa despreciable fija a un cilindro de radio R. La partı́cula se puede mover sobre un plano horizontal sin fricción. Inicialmente, la cuerda se encuentra totalmente enrollada alrededor del cilindro, de modo que la partı́cula toca al cilindro. Se le da un impulso radial a la partı́cula, tal que ésta adquiere una velocidad inicial v0 y la cuerda comienza a desenrollarse. a) Encuentre la ecuación de movimiento en términos de una coordenada generalizada apropiada. b) Encuentre la solución que satisface las condiciones iniciales. c) Calcule el momento angular de la partı́cula con respecto al eje del cilindro, usando el resultado de (b). 27. Encuentre la ecuación de movimiento de una partı́cula de masa m que se mueve en la dimensión x, cuyo Lagrangiano es L= 1 m(ẋ2 − ω 2 x2 )eγt , 2 (1.307) donde las constantes γ y ω son cantidades reales y positivas. ¿Qué sistema describe la ecuación de movimiento?. 28. Una partı́cula de masa m y carga q se desliza sin fricción sobre una varilla de masa despreciable que puede girar en un plano vertical alrededor de un extremo fijo. En el extremo fijo de la varilla hay una carga puntual fija −q, la cual está conectada a la partı́cula móvil mediante un resorte de constante k. a) Encuentre las ecuaciones de movimiento de la partı́cula. b) Calcule la energı́a del sistema. 1.8. PROBLEMAS 69 29. Considere un péndulo muy largo de longitud L, del cual cuelga una masa m que apenas toca la superficie terreste y que se mueve en un plano fijo. Desprecie el movimiento de la Tierra y asuma ésta como una esfera uniforme de radio RT . a) Encuentre la ecuación de movimiento del péndulo sin suponer que L es pequeño con respecto a RT . b) Encuentre la ecuación de movimiento si L RT . 30. Una partı́cula de masa m se desliza sin fricción por un cable recto muy largo, el cual está conectado en un punto P perpendicularmente a una varilla de longitud l, formando un plano vertical en el campo gravitacional terrestre. La varilla gira con respecto a su otro extremo fijo O en el plano vertical, con velocidad angular constante ω. Las masas de la varilla y del cable son despreciales. a) ¿Se conserva la energı́a mecánica de la partı́cula?. b) Encuentre y resuelva la ecuación de movimiento de la partı́cula. 70 CAPÍTULO 1. ECUACIONES DE MOVIMIENTO Capı́tulo 2 Leyes de conservación y simetrı́as 2.1. Momento conjugado Dado un sistema caracterizado por un Lagrangiano L(qj , q˙j , t), se define la cantidad pj ≡ ∂L ∂ q˙j (2.1) como el momento conjugado (o canónico) asociado a la coordenada generalizada qj . La cantidad pj no tiene necesariamente unidades de momento lineal; puede también corresponder a momento angular u a otras cantidades. Si un Lagrangiano L de un sistema no contiene explı́citamente una coordenada qj (puede contener q˙j , t), se dice que qj es una coordenada cı́clica o ignorable. Si qj es cı́clica, entonces ∂L = 0, (2.2) ∂qj y la ecuación de Lagrange para una coordenada cı́clica qj resulta en d ∂L dpj = = 0, dt ∂ q˙j dt ⇒ pj = cte. (2.3) (2.4) Es decir, el momento conjugado pj asociado a una coordenada ciclica qj es constante. Luego, la cantidad pj = cte constituye una cantidad conservada, llamada también una primera integral del movimiento. En general, si el Lagrangiano de un sistema no depende explı́citamente de una coordenada que representa un desplazamiento en una dirección espacial dada, la componente del momento lineal correspondiente a esa dirección se conserva. 71 72 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Similarmente, si un sistema posee un eje de simetrı́a rotacional, o simetrı́a axial, entonces su Lagrangiano no depende explı́citamente de la coordenada que describe el ángulo de rotación alrededor de ese eje. Como consecuencia, la componente del momento angular del sistema correspondiente a ese eje, se conserva. Ejemplo. 1. Partı́cula sobre un cono invertido. Vimos en el Cap. 1 que el Lagrangiano de este sistema es L(r, ϕ, ṙ, ϕ̇, t) = 1 m(ṙ2 csc2 α + r2 ϕ̇2 ) − mgr cot α. 2 (2.5) La coordenada ϕ, que representa el ángulo de rotación alrededor del eje z, es cı́clica, ∂L ∂L = 0 ⇒ pϕ = = mr2 ϕ̇ = cte. ∂ϕ ∂ ϕ̇ (2.6) El momento conjugado pϕ asociado con la coordenada angular ϕ es constante. Para identificar la cantidad pϕ , consideremos el momento angular de la partı́cula, i j k l = r × mv = m x y z . (2.7) ẋ ẏ ż La componente z de l es lz = m(xẏ − y ẋ). (2.8) En términos de las coordenadas generalizadas r y ϕ, x = r cos ϕ, ẋ = ṙ cos ϕ − rϕ̇ sin ϕ, y = r sin ϕ, ẏ = ṙ sin ϕ + rϕ̇ cos ϕ. (2.9) Sustituyendo en la Ec. (2.8), podemos expresar lz = mr2 ϕ̇ ≡ pϕ . (2.10) La cantidad conservada pϕ es la componente z del momento angular de la partı́cula. 2.2. Teorema de Noether Vimos en el Cap. 1 que las ecuaciones de movimiento son invariantes si el Lagrangiano de un sistema se transforma mediante la adición de una derivada total de alguna función f (qj , t) dependiente solamente de las coordenadas y del tiempo. 2.2. TEOREMA DE NOETHER 73 En efecto, sea Z t2 S= L dt (2.11) t1 la acción correspondiente a un Lagrangiano L. Consideremos la transformación L0 = L + La acción asociada con L0 es Z t2 Z S0 = L0 dt = = df (qj , t) . dt t2 t2 (2.12) df dt dt t1 t1 t1 S + [f (qj (t2 ), t2 ) − f (qj (t1 ), t1 )] = S + cte. Z L dt + (2.13) Entonces, δS = δS 0 . (2.14) El principio de mı́nima acción implica δS = δS 0 = 0. Luego, las ecuaciones de Lagrange derivadas de este principio usando L o L0 , tienen la misma forma; es decir, son invariantes ante la transformación (2.12). Una transformación infinitesimal del Lagrangiano L → L0 = L + δL que no modifica las ecuaciones de movimiento representa una simetrı́a del sistema (también llamada simetrı́a de la acción). Se dice que la acción es invariante bajo tal transformación. Teorema de Noether en Mecánica Clásica. Si la acción de un sistema con Lagrangiano L(qj , q̇j , t) es invariante bajo la transformación infinitesimal de coordenadas qj0 = qj + δqj que cambia el Lagrangiano a L0 = L + δL, tal que δL = f (qj , t), entonces la cantidad J= df (qj ,t) , dt para alguna función s X ∂L δqj − f ∂ q˙j j=1 (2.15) constituye una cantidad conservada asociada a esa transformación. La función J se denomina corriente de Noether. Demostración: La transformación qj0 = qj + δqj (donde t es fijo, δt = 0) produce la siguiente variación δL en el Lagrangiano L(qj , q̇j , t), δL(qj , q̇j , t) = s s X X ∂L ∂L δqj + δ q̇j . ∂q ∂ q˙j j j=1 j=1 (2.16) 74 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Usando las ecuaciones de Lagrange, tenemos s s X X d ∂L ∂L d δqj + (δqj ) dt ∂ q̇ ∂ q˙j dt j j=1 j=1 s d X ∂L = δqj . dt j=1 ∂ q̇j δL = Según el teorema, la variación δL se puede escribir δL = s d X ∂L df (qj , t) δqj = dt j=1 ∂ q̇j dt s X ∂L δqj − f ⇒J ≡ ∂ q̇ j j=1 (2.17) df (qj , t) ; luego dt ⇒ s d X ∂L δqj − f = 0 dt j=1 ∂ q̇j = cte. (2.18) El Teorema de Noether establece que a cada simetrı́a que posee un sistema, le corresponde una cantidad conservada. Las simetrı́as y sus cantidades conservadas asociadas permiten conocer propiedades de un sistema y hacer predicciones sobre el comportamiento del mismo, sin necesidad de obtener soluciones exactas de las ecuaciones de movimiento del sistema (las cuales pueden ser dificiles de encontrar en muchos casos). Las ecuaciones de movimiento son ecuaciones diferenciales de segundo orden en el tiempo para las qj , mientras que las cantidades conservadas J contienen derivadas de primer orden para las qj , en principio posibles de resolver si existen suficientes simetrı́as en el sistema. Figura 2.1: Emily Noether (1882-1935). El Teorema de Noether se extiende también a Mecánica Cuántica, Electromagnetismo, Teorı́as de Campos, etc., y tiene una importancia fundamental en la Fı́sica. 2.2. TEOREMA DE NOETHER 75 Ejemplos. ∂L = 1. Supongamos que la coordenada qi es cı́clica para un Lagrangiano L; es decir, ∂q i 0 0 0. Entonces, la transformación de coordenadas qi = qi +δqi , con δqi = cte, y qj = qj , δqj = 0, para i 6= j, no produce cambios en el Lagrangiano, 0 X ∂L X ∂L 0 7 ∂L > δL = δ q̇ = δqi = 0. δqj + j ∂qj ∂ q̇j ∂qi j j (2.19) Expresamos df = 0 ⇒ f = c = cte. dt La corriente de Noether conservada J es X ∂L J = δqj − f = cte ∂ q̇j j δL = ⇒ ⇒ ∂L δqi − c = cte, ∂ q̇i ∂L ≡ pi = cte. ∂ q̇i (2.20) (2.21) Luego, el momento conjugado pi asociado a la coordenada cı́clica qi es constante. 2. El Lagrangiano de una partı́cula en movimiento vertical en el campo gravitacional terrestre es 1 L = mẏ 2 − mgy. (2.22) 2 0 Consideremos la transformación de coordenadas y = y + δy, con δy = cte. El correspondiente cambio en L es δL = 0 ∂L ∂L δy + δ ẏ = −mg δy. ∂y ∂ ẏ (2.23) Escribimos df = −mg δy dt Entonces, la cantidad conservada J es δL = J ⇒ f = −mgt δy. (2.24) ∂L δy − f = cte ∂ ẏ ⇒ mẏ δy + mgt δy = cte, = ⇒ ẏ + gt = cte. (2.25) La transformación de coordenadas empleada equivale a sumar una constante a la energı́a potencial, y deja invariante la ecuación de movimiento de la partı́cula. 76 2.3. CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Homogeneidad del espacio y conservación del momento lineal Como una aplicación del Teorema de Noether, demostraremos la relación entre la conservación del momento lineal y la homogeneidad del espacio; es decir, la simetrı́a de traslación en un sistema. Homogenidad del espacio significa que las propiedades mecánicas de un sistema no cambian si todo el sistema es desplazado en una dirección arbitraria del espacio. Consideremos un sistema de N partı́culas con posiciones rα = (x1 (α), x2 (α), x3 (α)), α = 1, . . . , N , caracterizado por el Lagrangiano L(rα , ṙα , t). Supongamos la transformación de coordenadas r0α = rα + δr, donde δr = (δx1 , δx2 , δx3 ) es un vector infinitesimal cuyas componentes δxj son constantes; i. e., δ ṙ = 0. Esta transformación corresponde a una translación infinitesimal del sistema en una dirección arbitraria del espacio. Figura 2.2: Translación espacial infinitesimal. La homogeneidad del espacio implica que esta transformación infinitesimal no introduce cambios en el Lagrangiano del sistema; es decir, δL = 0. Entonces, la cantidad conservada J, de acuerdo al teorema de Noether, es J = 3 XX α j=1 ⇒ 3 XX α j=1 ∂L δxj − f ∂ ẋj (α) ∂L δxj = cte ∂ ẋj (α) X ∂L ⇒ · δr = cte, ∂ ṙα α puesto que f y J son constantes, y donde hemos definido ∂L ∂L ∂L ∂L ≡ , , . ∂ ṙα ∂ ẋ1 (α) ∂ ẋ2 (α) ∂ ẋ3 (α) (2.26) (2.27) 2.3. HOMOGENEIDAD DEL ESPACIO Y CONSERVACIÓN DEL MOMENTO LINEAL77 Puesto que δr es constante, la Ec. (2.26) implica que la cantidad vectorial X ∂L PT ≡ = cte. ∂ ṙα α (2.28) La cantidad PT es el momento lineal total del sistema. Para ver esto, consideremos el Lagrangiano de un sistema cuya energı́a potencial depende solamente de las coordenadas, 1X mα ṙ2α − V (rα ). (2.29) L= 2 α Entonces, PT = X ∂L X X = mα ṙ = mα vα . ∂ ṙα α α α (2.30) Note que el momento lineal de una partı́cula puede escribirse como pα = mα vα = ∂L . ∂ ṙα (2.31) Luego, la Ec. (2.28) expresa la conservación del momento total PT de un sistema debido a la homogeneidad del espacio. En un sistema donde existe simetrı́a translacional en una dirección espacial especı́fica, la componente del momento lineal del sistema en esa dirección se conserva. Ejemplo. P3 1. Consideremos una partı́cula libre cuyo Lagrangiano es L = 12 m i=1 ẋ2i . La variación de L bajo una transformación infinitesimal de traslación es 0 3 3 0 X X 7 ∂L ∂L δL = δẋ> δxi + i = 0. ∂x ∂ ẋi i=1 i=1 i Esta variación puede ponerse en la forma δL = constante. La cantidad conservada J es J = ⇒ df (qj ,t) dt (2.32) si escogemos f igual a una 3 X ∂L δxj − f = cte ∂ ẋj j=1 3 X mẋj δxj = cte. (2.33) j=1 Puesto que los δxj son constantes arbitrarias, la Ec. (2.33) implica que cada término en la suma es constante, mẋj ≡ pj = cte , ∀j. (2.34) 78 2.4. CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Isotropı́a del espacio y conservación del momento angular Isotropı́a espacial significa que las propiedades mecánicas de un sistema no varı́an cuando éste es rotado en el espacio. El Teorema de Noether permite demostrar la relación entre la isotropı́a del espacio y la conservación del momento angular de un sistema. Figura 2.3: Rotación infinitesimal δϕ del vector r. Consideremos una partı́cula en la posición r = (x, y, z) con origen en O. Supongamos una rotación infinitesimal del vector r alrededor de un eje que pasa por O, manteniendo su magnitud fija. Sea δϕ la magnitud constante del ángulo rotado y cuya dirección de rotación δϕ sobre el eje está definida por la regla de la mano derecha. El vector de posición de la partı́cula transformado por la rotación infinitesimal es r0 = r + δr, (2.35) donde el vector δr tiene dirección perpendicular al plano (r, δϕ) y magnitud δr = r sin θ δϕ, y donde θ es el ángulo entre δϕ y r. Luego, se puede expresar δr = δϕ × r . (2.36) Consideremos un sistema de N partı́culas con posiciones rα , α = 1, . . . , N , sujeto a una rotación infinitesimal δϕ. El cambio en el vector de posición de la partı́cula α es δrα = δϕ × rα . La isotropı́a del espacio implica que esta transformación infinitesimal no introduce cambios en el Lagrangiano del sistema; i. e., δL = 0. Expresando δL = df dt , obtenemos f = cte. Entonces, el teorema de Noether establece que J = 3 XX α j=1 ⇒ 3 XX α j=1 ∂L δxj (α) − f = cte ∂ ẋj (α) ∂L δxj (α) = cte ∂ ẋj (α) X ∂L ⇒ · δrα = cte. ∂ ṙα α (2.37) 2.4. ISOTROPÍA DEL ESPACIO Y CONSERVACIÓN DEL MOMENTO ANGULAR79 Sustituyendo pα = ∂∂L ṙα y δrα = δϕ × rα , podemos escribir la Ec. (2.37) como X X X pα · (δϕ × rα ) = δϕ · (rα × pα ) = δϕ · rα × pα = cte, α α (2.38) α donde hemos usado la identidad vectorial: a · b × c = b · c × a. Puesto que el vector δϕ es constante, la Ec. (2.38) implica que X lT ≡ rα × pα = cte. (2.39) α La cantidad vectorial lT es el momento angular total del sistema, y la Ec. (2.39) expresa su conservación si el sistema posee isotropı́a espacial. En general, si un sistema posee simetrı́a rotacional alrededor de un eje (simetrı́a axial), se conserva la componente del momento angular en la dirección de ese eje. Ejemplo. 1. Consideremos una rotación infinitesimal δϕ = δϕ ẑ alrededor del eje z. Entonces δr = δϕ × r, con r = (x, y, z), posee componentes δx = −y δϕ, δy = x δϕ, δ ẋ = −ẏ δϕ δ ẏ = ẋ δϕ. (2.40) Consideremos un oscilador armónico bidimensional, que consiste en una partı́cula de masa m moviéndose sobre el plano (x, y) sin fricción, sujeta a la fuerza de un resorte de constante k. El Lagrangiano puede escribirse como 1 1 L = m ẋ2 + ẏ 2 − k(x2 + y 2 ). (2.41) 2 2 La variación de L bajo esta transformación infinitesimal de rotación resulta en X ∂L X ∂L δL = δxi + δ ẋi ∂xi ∂ ẋi i i = kxy δϕ − yx δϕ − mẋẏ δϕ + mẏ ẋ δϕ = 0. La condición δL = J (2.42) df (qj ,t) dt implica que f = cte = c. La cantidad conservada J es X ∂L = δxj − f = m(−y ẋ + xẏ)δϕ − c = cte. (2.43) ∂ ẋj j Puesto que δϕ = cte, tenemos m(xẏ − y ẋ) ≡ lz = cte. (2.44) La componente del momento angular en la dirección z es constante. En coordenadas polares, L = 21 m(ṙ2 + r2 ϕ̇2 ) + 12 kr2 , y la coordenada ϕ es cı́clica. Entonces, ∂L ∂L = 0 ⇒ pϕ = = mr2 ϕ̇ ≡ lz = cte. ∂ϕ ∂ ϕ̇ (2.45) 80 2.5. CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Homogeneidad del tiempo y conservación de la energı́a Homogeneidad del tiempo significa que las propiedades mecánicas de un sistema no dependen del intervalo de tiempo en el cual se observen. Esta simetrı́a está relacionada con la conservación de energı́a. En un sistema homogéneo en el tiempo, el Lagrangiano L no depende explı́citamente de t; es decir L = L(qj , q̇j ). Luego ∂L ∂t = 0. Calculemos el cambio total de L con respecto al tiempo en tal sistema: 0 s 7 ∂L dL X ∂L ∂L = q˙j + q¨j + . (2.46) dt ∂qj ∂ q˙j ∂t j=1 d ∂L ∂L = dt Sustituimos la ecuación de Lagrange, ∂q ∂ q˙j , j X d ∂L dL ∂L = q˙j + q¨j dt dt ∂ q˙j ∂ q˙j j X d ∂L = q˙j dt ∂ q˙j j d X ∂L q˙j . = (2.47) dt j ∂ q˙j Luego, " # d X ∂L q˙j − L = 0 dt i ∂ q˙j X ∂L q˙j − L = cte. ⇒ ∂ q˙j j Definimos la función de energı́a de un sistema como s X ∂L E(qj , q˙j ) ≡ q˙j − L . ∂ q˙j j=1 (2.48) (2.49) Luego, en sistemas homogéneos en el tiempo, la función de energı́a del sistema se conserva. E(qj , q˙j ) = cte. (2.50) La función de energı́a se puede calcular para cualquier sistema, pero es constante sólo si ∂L ∂t = 0. Los sistemas para los cuales E(qj , q˙j ) es constante, se llaman sistemas conservativos. Para establecer bajo qué condiciones la función de energı́a es igual a T +V , utilizaremos a continuación un teorema debido a Euler. En el Cap. 6 veremos que la función de energı́a, expresada en términos de las coordenadas qj y de sus momentos conjugados pj , recibe el nombre de Hamiltoniano del sistema Ps y se designa como H(qj , pj ) ≡ j=1 pj q˙j − L. 2.6. TEOREMA DE EULER PARA LA ENERGÍA CINÉTICA 2.6. 81 Teorema de Euler para la energı́a cinética Una función de s variables f (y1 , . . . , ys ) es homogénea de grado (orden) n si, ∀λ ∈ <, satisface: f (λy1 , . . . , λys ) = λn f (y1 , . . . , ys ). (2.51) Ejemplos. 1. f (x1 , . . . , xs ) = Ps 2. f (x1 , . . . , xs ) = Qs xm i , es homogénea de grado m: X X m m f (λx1 , ..., λxs ) = λ m xm xm i =λ i = λ f. i=1 i xm i , es homogénea de grado ms: i=1 f (λx1 , . . . , λxs ) = s Y i 3. f (x1 , . . . , xs ) = i ms λ m xm i =λ s Y ms xm f. i =λ i Ps sin xi , no es homogénea: X X f (λx1 , . . . , xs ) = sin(λxi ) 6= λn sin xi = λn f. i=1 i i Teorema de Euler para funciones homogéneas. Si f (y1 , . . . , ys ) es una función homogénea de grado n, entonces f satisface: s X ∂f ∇f · y = yi = nf . ∂y i i=1 (2.52) Demostración: Si f es homogénea, satisface la Ec. (2.51). Derivemos ambos lados de la Ec. (2.51) con respecto a λ: En el lado izquierdo de la Ec. (2.51), sustituimos zi ≡ λyi , f (λy1 , λy2 , ..., λys ) = f (z1 , z2 , ..., zs ) (2.53) y derivamos, d df f (λy1 , ..., λys ) = (z1 , ..., zs ) dλ dλ X ∂f ∂zi X ∂f = = yi ∂zi ∂λ ∂zi i i X ∂f ∂yi 1 X ∂f = yi = yi . ∂yi ∂zi λ i ∂yi i (2.54) 82 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Derivamos el lado derecho de la Ec. (2.51), 0 X ∂f ∂y 7 d n i , [λ f (y1 , ..., ys )] = nλn−1 f + λn dλ ∂y ∂λ i i (2.55) puesto que yi y λ son independientes. Igualando ambos lados, 1 X ∂f yi = nλn−1 f , λ i ∂yi (2.56) lo cual es válido ∀λ. En particular, haciendo λ = 1, tenemos el Teorema de Euler para funciones homogéneas, X ∂f yi = nf ∂yi i . (2.57) El teorema de Euler para funciones homogéneas puede aplicarse a la energı́a cinética. En general, la energı́a cinética de un sistema es una función cuadrática de las velocidades generalizadas s 1 X Tjl q̇j q̇l , (2.58) T (q̇1 , . . . , q̇s ) = 2 j,l=1 donde los coeficientes Tjl pueden contener parámetros (masa, longitud, etc) o coordenadas del sistema. La función T es una función homogénea de segundo grado en las q̇j : T (λq̇1 , . . . , λq̇s ) = λ2 T (q̇1 , . . . , q̇s ). Entonces T satisface el Teorema de Euler, X ∂T q˙i = 2T. (2.59) ∂ q˙i i Supongamos que la energı́a potencial de un sistema depende tanto de las coordenadas como de las velocidades generalizadas: V (qj , q̇j ). Entonces L = T (q̇j ) − V (qj , q̇j ). La función de energı́a correspondiente para el sistema es X ∂T X ∂V X ∂L E(qj , q˙j ) = q˙j − L = q˙j − q˙j − (T − V ) ∂ q˙j ∂ q˙j ∂ q˙j j j j = 2T − X ∂V q˙j − T + V ∂ q˙j j = T +V − X ∂V q˙j . ∂ q˙j j (2.60) Si la energı́a potencial V es independiente de las velocidades, ∂∂V q̇j = 0; entonces la función de energı́a es igual a la energı́a mecánica total, E(qj , q˙j ) = T + V . Si V depende de q˙j , la función de energı́a contiene términos adicionales a T + V . 2.7. FUERZAS GENERALIZADAS: PARTÍCULA EN UN CAMPO ELECTROMAGNÉTICO83 2.7. Fuerzas generalizadas: partı́cula en un campo electromagnético Existen sistemas donde la energı́a potencial depende tanto de las coordenadas como de las velocidades, V (qj , q˙j ). En estos sistemas, también se puede definir una función de energı́a E(qj , q˙j ). Consideremos el Lagrangiano para una partı́cula en un potencial dependiente de la velocidad V = V (r, ṙ), en coordenadas cartesianas, L = T (ṙ) − V (r, ṙ), (2.61) donde 1 1 m(ẋ2 + ẏ 2 + ż 2 ) = mv 2 . 2 2 La ecuación de Lagrange para xi es d ∂L ∂L − = 0. dt ∂ ẋi ∂xi T (ṙ) = (2.62) (2.63) Sustitución de L conduce a ∂V ∂V d ∂T − + = 0, dt ∂ ẋi ∂ ẋi ∂xi d ∂T ∂V d ∂V =− + dt ∂ ẋi ∂xi dt ∂ ẋi ⇒ mẍi = Fi , (2.64) (2.65) (2.66) donde Fi es la componente i de la denominada fuerza generalizada sobre la partı́cula, ∂V d Fi ≡ − + ∂xi dt ∂V ∂ ẋi . (2.67) Las fuerzas generalizadas dependen de coordenadas y de velocidades. Un importante ejemplo de fuerza generalizada es aquella experimentada por una partı́cula en un campo electromagnético. Experimentalmente se sabe que una partı́cula de masa m y carga q, moviéndose con velocidad v, en presencia de un campo eléctrico E(r, t) y un campo magnético B(r, t), está sujeta a fuerza de Lorentz v F=q E+ ×B , (2.68) c donde c es la velocidad constante de la luz. La contribución del campo magnético a esta fuerza depende de la velocidad, por lo que F constituye una fuerza generalizada. 84 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Para encontrar el potencial V , dependiente de la velocidad, asociado a la fuerza de Lorentz, y el correspondiente Lagrangiano de una partı́cula en un campo electromagnético, consideremos primero las ecuaciones de Maxwell para los campos E(r, t) y B(r, t): ∇ · E = 4πρ, 1 ∂B ∇×E+ = 0, c ∂t ∇ · B = 0, 4π 1 ∂E = J. ∇×B− c ∂t c (2.69) (2.70) (2.71) (2.72) La Ec. (2.71) implica B = ∇ × A, (2.73) donde la cantidad vectorial A(r, t) se denomina potencial vector. Sustituyendo B en la Ec. (2.70), 1 ∂ (∇ × A) = 0 ∇×E+ c ∂t 1 ∂A ∇× E+ = 0. c ∂t (2.74) (2.75) El término entre paréntesis en la Ec. (2.75) debe ser proporcional al gradiente de una cantidad escalar; se escoge 1 ∂A = −∇ϕ c ∂t 1 ∂A ⇒ E = −∇ϕ − . c ∂t E+ (2.76) (2.77) La cantidad ϕ(r, t) se denomina potencial escalar. Luego, la fuerza de Lorentz, Ec. (2.68), se puede expresar en términos de los potenciales ϕ(r, t) y A(r, t) como 1 ∂A v F = q −∇ϕ − + × (∇ × A) . (2.78) c ∂t c Para encontrar la energı́a potencial V (r, ṙ) de la cual se deriva esta fuerza generalizada, consideremos el término v × (∇ × A). Usamos la identidad vectorial :0 :0 ∇(A · v) = A × (∇×v) + v × (∇ × A) + (A· ∇)v + (v · ∇)A, (2.79) donde se anulan términos porque el operador ∇ contiene derivadas espaciales y, aplicado a v, da cero pués v es independiente de las coordenadas r. Luego, v × (∇ × A) = ∇(A · v) − (v · ∇)A, (2.80) 2.7. FUERZAS GENERALIZADAS: PARTÍCULA EN UN CAMPO ELECTROMAGNÉTICO85 donde (v · ∇)A = 3 X i=1 ẋi ∂A . ∂xi Sustituyendo en Ec. (2.78), 1 1 ∂A 1 . F = q −∇ϕ + ∇(A · v) − (v · ∇)A − c c c ∂t Usando (2.81) (2.82) 3 ∂A ∂A dA X ∂A = ẋi + = (v · ∇)A + , dt ∂x ∂t ∂t i i=1 (2.83) 1 dA 1 F = q −∇ ϕ − A · v − c c dt (2.84) ∂ 1 dAi 1 Fi = q − ϕ− A·v − . ∂xi c c dt (2.85) obtenemos, cuya componente Fi es Comparando con la expresión general de la fuerza generalizada Ec. (2.67), vemos que la energı́a potencial satisface las relaciones ∂ 1 ∂V (2.86) = q ϕ− A·v , ∂xi ∂xi c ∂V q (2.87) = − Ai , ∂ ẋi c de donde se deduce 1 V =q ϕ− A·v . c (2.88) El Lagrangiano de una partı́cula en un campo electromagnético es, entonces, L= 1 q mv 2 − qϕ + A · v. 2 c (2.89) La función de energı́a correspondiente es E= X ∂L 1 ẋj − L, = mv 2 + qϕ. ∂ ẋ 2 j j Luego, para una partı́cula en un campo electromagnético, E 6= T + V , debido a que V depende de la velocidad de la partı́cula. Sin embargo, E se conserva puesto que ∂L ∂t = 0. Note que la función de energı́a E no depende del potencial vector A y, por tanto, tampoco depende del campo magnético B. El campo magnético no realiza trabajo, puesto que la fuerza magnética siempre es perpendicular a la velocidad de la partı́cula. 86 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS El momento conjugado pi asociado con la coordenada xi es ∂L q pi = = mẋi + Ai (r, t), (2.90) ∂ ẋi c q ⇒ p = mv + A(r, t). (2.91) c Luego, el momento depende, tanto de la velocidad, como de la posición de la partı́cula. Supongamos que los campos B(r, t) y E(r, t) se derivan de los potenciales A(r, t) y ϕ(r, t) según las Ecs. (2.73) y (2.77). Consideremos la siguiente transformación de los potenciales, denominada transformación de calibre, → A0 = A + ∇Λ, (2.92) ∂Λ 1 , (2.93) ϕ → ϕ0 = ϕ − c ∂t donde Λ(r, t) es un campo escalar arbitrario. Entonces, los campos eléctrico y magnético son invariantes bajo esta transformación, A B0 = ∇ × A0 = ∇ × A + ∇ × ∇Λ = ∇ × A = B. (2.94) 1 ∂Λ 1 ∂A 1 ∂ = −∇ϕ + ∇ − − (∇Λ) c ∂t c ∂t c ∂t 1 ∂A = E. (2.95) = −∇ϕ − c ∂t La invarianza de los campos B y E bajo una transformación de calibre implica que la fuerza de Lorentz, que es la manifestación fı́sica de estos campos, es también invariante. Del mismo modo, las ecuaciones de Maxwell conservan su forma bajo una transformación de calibre, lo cual indica la existencia de una simetrı́a fundamental en la interacción electromagnética, llamada simetrı́a de calibre. Por otro lado, el Lagrangiano de una partı́cula en un campo electromagnético se transforma, bajo una transformación de calibre, como 1 q L0 = mv 2 − qϕ0 + A0 · v 2 c 1 q ∂Λ q q 2 = mv − qϕ + + A · v + ∇Λ · v 2 c ∂t c c q ∂Λ = L+ + ∇Λ · v c ∂t q dΛ = L+ . (2.96) c dt Luego, las ecuaciones de movimiento que se derivan de L son invariantes bajo una transformación de calibre. Si expresamos L0 = L+δL, con la transformación infinitesimal δL = dΛ dt , por el teorema de Noether sabemos que debe existir una cantidad conservada asociada a tal transformación de simetrı́a. Aunque no es materia correspondiente a este curso, se puede demostrar que la simetrı́a de calibre presente en las ecuaciones de Maxwell implica la conservación de la carga eléctrica. 1 ∂A0 E0 = −∇ϕ0 − c ∂t 2.8. SISTEMAS INTEGRABLES Y SISTEMAS CAÓTICOS 2.8. 87 Sistemas integrables y sistemas caóticos Las cantidades conservadas constituyen primeras integrales del movimiento de un sistema; son funciones de las coordenadas y de sus velocidades (i. e. primera derivadas temporales). Denotamos por Ik (qj , q̇j ) = Ck , donde Ck = constante, y k = 1, . . . , n, el conjunto de cantidades conservadas en un sistema. En general, estas cantidades se pueden emplear para reducir el número de ecuaciones de Lagrange a integrar en el sistema. Un sistema con s grados de libertad es integrable si posee, al menos, s cantidades conservadas; es decir, si n = s. Las s cantidades conservadas de un sistema integrable constituyen un conjunto de s ecuaciones para las s velocidades generalizadas q̇j (t), las cuales se pueden reducir, en principio, a una ecuación diferencial de primer orden con respecto al tiempo para una coordenada generalizada. Esta, a su vez, en principio puede ser integrada. A partir de la integración de esa coordenada, las demás coordenadas pueden, en principio, ser integradas. Las soluciones para todas las coordenadas qj (t) pueden ser expresadas en términos de cuadraturas; es decir, integrales explı́citas que generalmente contienen raı́ces cuadradas de funciones conocidas. Si embargo, aunque las coordenadas en sistemas integrables son susceptibles de ser determinadas completamente en función de integrales, el cálculo exacto de éstas, en muchos casos, puede resultar no trivial. Si un sistema con s grados de libertad tiene menos de s cantidades conservadas (n < s), se denomina no integrable. Un sistema para el cual existen más cantidades conservadas que grados de libertad (n > s), se llama superintegrable. Existen pocos sistemas superintegrables conocidos; el ejemplo más simple es una partı́cula libre; otro ejemplo es el problema de dos cuerpos sujetos a interacción gravitacional (Cap. 3). Ejemplos. Consideremos algunos sistemas estudiados en el Cap. 1: 1. Oscilador armónico simple: s = 1; C1 = E = cte, n = 1; es integrable. 2. Péndulo simple: s = 1; C1 = E = cte, n = 1; es integrable. 3. Partı́cula sobre un cono: s = 2, C1 = lz = cte, C2 = E = cte, n = 2; es integrable. 4. Péndulo doble: s = 2; C1 = E = cte, n = 1; no es integrable. 5. Péndulo cuyo soporte gira en un cı́rculo con velocidad angular constante: s = 1, n = 0; no es integrable. 6. Péndulo de resorte: s = 2; C1 = E = cte, n = 1; no es integrable. 7. Partı́cula libre es superintegrable: s = 1; n = 2: C1 = E = cte, C2 = p = cte. 88 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS La integrabilidad puede ser considerada como un tipo de simetrı́a presente en varios sistemas dinámicos, y que conduce a soluciones con comportamiento regular (periódico o estacionario) en el tiempo. Sin embargo, la existencia de integrabilidad no es lo más común; muchos sistemas dinámicos no son integrables. Un sistema no integrable puede exhibir comportamiento caótico para algún rango de valores de sus parámetros. El fenómeno de caos consiste en la evolución irregular e impredecible de las variables de un sistema dinámico determinista debido a la presencia de una extrema sensibilidad ante cambios infinitesimales en las condiciones iniciales de esas variables. La no integrabilidad es una condición necesaria, pero no suficiente, para la existencia de caos en un sistema. Los sistemas con comportamiento caótico se caracterizan porque las ecuaciones que rigen su dinámica poseen funciones no lineales de las variables (una función f (x) es no lineal si f (x + y) 6= f (x) + f (y)). El péndulo doble constituye un ejemplo de un sistema no lineal y no integrable que exhibe comportamiento caótico. En el Cap. 1 obtuvimos las ecuaciones de Lagrange para los ángulos θ1 y θ2 que describen los grados de libertad de este sistema, θ̈1 = g(sin θ2 cos ∆θ − M sin θ1 ) − (l2 θ̇22 + l1 θ̇12 cos ∆θ) sin ∆θ l1 (M − cos2 ∆θ) (2.97) θ̈2 = gM (sin θ1 cos ∆θ − sin θ2 ) − (M l1 θ̇12 + l2 θ̇22 cos ∆θ) sin ∆θ , l2 (M − cos2 ∆θ) (2.98) donde ∆θ ≡ θ1 − θ2 , y M ≡ 1 + m1 /m2 . Figura 2.4: Izquierda: Coordenadas y parámetros del péndulo doble. Derecha: Movimiento caótico de la partı́cula m2 en el espacio. En el péndulo doble, dos trayectorias de una misma variable (por ejemplo, θ2 ) que parten de condiciones iniciales arbitrariamente cercanas, no se mantienen cercanas en el tiempo, sino que pueden evolucionar de maneras irregulares y muy diferentes (Fig. (2.5)), a pesar de que las Ecs. (2.97)-(2.98) que rigen la dinámica son deterministas. 2.8. SISTEMAS INTEGRABLES Y SISTEMAS CAÓTICOS 89 Figura 2.5: Realización experimental de caos en un péndulo doble. Arriba: θ1 vs. t. Abajo: θ2 vs. t. En cada gráfica, partiendo del reposo, se muestra la evolución del ángulo a partir de dos condiciones iniciales muy cercanas, ∆θ1 (0) = ∆θ2 (0) = 10−3 . Un sistema caótico posee una extrema sensibilidad ante cambios infinitesimales en sus condiciones iniciales: una pequeña perturbación en las condiciones iniciales de una variable resulta amplificada por la evolución dinámica del sistema, hasta que alcanza un tamaño comparable al intervalo de definición de la variable. Esto conlleva a limitaciones prácticas en la capacidad de predicción del comportamiento de sistemas caóticos. Las ecuaciones de movimiento del péndulo doble, Ecs. (2.97)-(2.98), contienen funciones no lineales de θ1 y θ2 . Si consideramos el lı́mite de pequeñas amplitudes de las oscilaciones, θ1 → 0 y θ2 → 0, estas ecuaciones pueden linealizarse usando las aproximaciones sin x ≈ x y cos x ≈ 1, para x → 0, quedando en la forma θ̈1 ≈ θ̈2 ≈ g(θ2 − M θ1 ) , l1 (M − 1) gM (θ1 − θ2 ) . l2 (M − 1) (2.99) (2.100) En este caso no se observa caos; el movimiento del sistema consiste en la superposición de dos modos de oscilación periódica con sus correspondientes frecuencias (Cap. 4): un modo en fase (θ1 = θ2 ) y otro modo en fases opuestas (θ1 = −θ2 ). El lı́mite de pequeñas amplitudes equivale a valores pequeños de la energı́a del sistema. Luego, el comportamiento del péndulo doble puede ser regular para ciertas condiciones, a pesar de que el sistema es no integrable. Esto ilustra el hecho de que la condición de no integrabilidad es necesaria, pero no suficiente, para la existencia de caos en un sistema. 90 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Otro ejemplo de un sistema no integrable y caótico, es el péndulo de resorte, cuyas ecuaciones de movimiento también fueron calculadas en el Cap. 1, rθ̈ + 2ṙθ̇ + g sin θ = 0, (2.101) k r̈ − rθ̇2 + (r − l) − g cos θ = 0. (2.102) m Este sistema exhibe comportamiento caótico para ciertos valores de su energı́a. Figura 2.6: Movimiento en el plano (x, y) de la partı́cula en el péndulo de resorte, para diferentes valores de su energı́a E. Izquierda: comportamiento regular (periódico). Derecha: caos. Note que no se requieren muchas variables (hay solamente dos grados de libertad en el péndulo doble o en el péndulo de resorte) para la ocurrencia de caos en un sistema. Se ha descubierto que el caos es un fenómeno ubı́cuo en la Naturaleza. Sistemas no lineales fı́sicos, quı́micos, biólogicos, fisiológicos, económicos, sociales, etc. presentan comportamiento caótico; el cual se manifiesta con propiedades universales, independientemente del contexto. 2.9. Movimiento unidimensional El caso más simple de integrabilidad es un sistema con un sólo grado de libertad, el cual se denomina sistema unidimensional. El Lagrangiano de un sistema unidimensional con coordenada q tiene la forma general 1 L = T (q̇ 2 ) − Vef (q) = aq̇ 2 − Vef (q) , (2.103) 2 donde el factor a representa algunos parámetros, como masa, etc., y Vef (q) corresponde a un potencial efectivo que contiene términos dependientes de la coordenada q. 2.9. MOVIMIENTO UNIDIMENSIONAL Puesto que ∂L ∂t 91 = 0, la energı́a es una cantidad conservada, E = = ∂L q̇ − L ∂ q̇ 1 2 aq̇ + Vef (q) = cte. 2 (2.104) Hay un grado de libertad y una cantidad conservada; el sistema es integrable. De la cantidad conservada E, se puede determinar t(q) en términos de una integral explı́cita, r 2 dq q̇ = = (E − Vef (q)) (2.105) dt a r Z a dq p + cte. (2.106) t(q) = 2 E − Vef (q) Luego, en principio, se puede invertir t(q) para obtener q(t). Para que la solución q(t) sea real, el movimiento puede ocurrir solamente para valores de q tales que E ≥ Vef (q). La condición de integrabilidad de sistemas unidimensionales permite calcular el perı́odo de movimientos oscilatorios en esos sistemas. Consideremos un sistema descrito por la coordenada cartesiana q = x y cuya energı́a potencial es Vef = V (x). Entonces, a ≡ m. El Lagrangiano del sistema es L = T − V = 21 mẋ2 − V (x) y la ecuación de movimiento correspondiente es dV mẍ = − . (2.107) dx La energı́a total es 1 E = mẋ2 + V (x) = cte. (2.108) 2 Puesto que 21 mẋ2 = E − V (x) ≥ 0, el movimiento sólo puede ocurrir para valores de x tal que E ≥ V (x). En la Fig. (2.7), esto corresponde a las regiones x ∈ [x1 , x2 ]; x ≥ x3 . Figura 2.7: Energı́a potencial de un sistema unidimensional con energı́a constante E. Movimiento puede ocurrir en los intervalos marcados en gris sobre el eje x. El punto xo es un punto de equilibrio estable; mientras que x0o es un punto de equilibrio inestable. 92 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Los puntos de retorno (o estacionarios) son aquellos donde la velocidad instantánea es cero, es decir, ẋ = 0. La Ec. (2.106) implica que los puntos de retorno corresponden a los valores de x tales que V (x) = E. En la Fig. (2.7), x1 , x2 y x3 son puntos de retorno, dados por: V (x1 ) = E, V (x2 ) = E, V (x3 ) = E. Los puntos de equilibrio x = xo son aquellos donde la fuerza instantánea se anula, dV = 0, (2.109) f (xo ) = 0 ⇒ dx xo o equivalentemente, donde la aceleración es cero, ẍ = 0. Note que un punto de equilibrio no es necesariamente un punto estacionario, y viceversa. Un punto estático satisface ambas condiciones: ẍ = 0, ẋ = 0. Un punto de equilibrio xo es estable si xo +δx, donde δx es una pequeña perturbación, tiende en el tiempo al valor xo . Un punto de equilibrio estable corresponde a un mı́mino del potencial V (x). d2 V Si > 0, xo es un punto de equilibrio estable. (2.110) dx2 xo d2 V Si < 0, xo es un punto de equilibrio inestable. (2.111) dx2 xo Si el rango del movimiento posible está entre dos puntos de retorno, x ∈ [x1 , x2 ], el movimiento es finito y oscilatorio. Entonces, debe existir un punto de equilibrio estable x = xo en el intervalo [x1 , x2 ]; es decir, existe un mı́nimo de V (x) en ese intervalo. El perı́odo de oscilación entre los puntos de retorno es dos veces el intervalo de tiempo del movimiento entre esos puntos, r Z x2 m dx p T (E) = 2 . (2.112) 2 x1 E − V (x) Un sistema integrable con varios grados de libertad puede reducirse, en principio, a un sistema unidimensional con una energı́a de la forma Ec. (2.104). Ejemplos. 1. Partı́cula de masa m moviéndose sobre un cono vertical con ángulo de vértice α. El Lagrangiano de este sistema fue calculado en el Cap. 1, L=T −V = 1 m(ṙ2 csc2 α + r2 ϕ̇2 ) − mgr cot α . 2 (2.113) Este sistema es integrable; posee dos grados grados de libertad, r y ϕ, y dos cantidades conservadas, C1 = lz y C2 = E, asociadas con la simetrı́a axial alrededor del ∂L eje z, ∂L ∂ϕ = 0, y con la homogeneidad del tiempo, ∂t = 0, respectivamente. 2.9. MOVIMIENTO UNIDIMENSIONAL 93 Las cantidades conservadas son la componente z del momento angular lz = mr2 ϕ̇ = C1 , (2.114) y la energı́a total del sistema E =T +V = Sustituyendo ϕ̇ = 1 m(ṙ2 csc2 α + r2 ϕ̇2 ) + mgr cot α = C2 . 2 (2.115) lz en la ecuación para E, podemos expresar mr2 E = = 1 2 2 1 lz2 mṙ csc α + + mgr cot α 2 2 mr2 1 2 2 mṙ csc α + Vef (r). 2 (2.116) La Ec. (2.116) tiene la forma de la energı́a de un sistema unidimensional, Ec. (2.104), donde identificamos a = m csc2 α, y Vef (r) = 1 lz2 + mgr cot α . 2 mr2 Luego, de la Ec. (2.116) podemos obtener r Z m dr csc α p + cte. t(r) = 2 E − Vef (r) (2.117) (2.118) Podemos obtener r(t) mediante inversión de la función t(r) y, sustituyendo r(t) en la Ec. (2.114), podemos calcular ϕ(t). Las soluciones para las coordenadas r(t) y ϕ(t) se expresan en términos de las cantidades conservadas lz y E. 2. Perı́odo de un oscilador armónico con una E dada. Figura 2.8: Energı́a potencial de un oscilador armónico con energı́a total E. La energı́a potencial es V (x) = 21 kx2 , y la energı́a total es E =T +V = 1 1 mẋ2 + kx2 = cte. 2 2 (2.119) 94 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Los puntos de retorno satisfacen la condición E = V (x); esto es, 1 2 kx 2r 2E = ± . k E = ⇒ x1,2 El perı́odo se calcula como Z √ 2E √ k T (E) = 2m √ q − 2E k = 2 E − 12 kx2 Usamos el cambio de variables, r x= tal que r dx 2E sin θ, k x = 0 → θ = 0; 2m E (2.120) Z √ 2E k 0 dx q . k 2 x 1 − 2E (2.121) r 2E dx = cos θ dθ k r 2E π x= → θ= . k 2 Sustituyendo en la integral, obtenemos r r Z π2 2m 2E cos θ dθ p T (E) = 2 E k 0 1 − sin2 θ r m π 2π = 4 · = , k 2 ω (2.122) (2.123) (2.124) (2.125) donde ω 2 ≡ k/m. El perı́odo de un oscilador armónico simple es independiente de la energı́a y, por tanto, de la amplitud de la oscilación. 3. Perı́odo de un péndulo simple con amplitud θ0 . Figura 2.9: Péndulo simple con amplitud θ0 . La energı́a potencial es V (θ) = −mgl cos θ, y la energı́a total es E =T +V = 1 2 2 ml θ̇ − mgl cos θ. 2 (2.126) 2.9. MOVIMIENTO UNIDIMENSIONAL 95 Despejamos θ̇, r dθ 2 p θ̇ = = E + mgl cos θ. dt ml2 Luego, la integral para el tiempo da r Z dθ m √ t=l . 2 E + mgl cos θ (2.127) (2.128) Los puntos de retorno están dados por E = V (θ0 ) = −mgl cos θ0 ⇒ θ1,2 = ±θ0 . (2.129) Calculamos el perı́odo como 4 veces el intervalo de tiempo entre θ = 0 y θ = θ0 , r Z θ0 m dθ √ (2.130) T (E) = 4l 2 0 E + mgl cos θ s Z θ0 √ dθ l √ T (θ0 ) = 2 2 . (2.131) g 0 cos θ − cos θ0 Note que el perı́odo del péndulo es independiente de la masa, un resultado encontrado experimentalmente por Galileo. Usando cos θ = cos(2θ/2) = cos2 (θ/2) − sin2 (θ/2) = 1 − 2 sin2 (θ/2), la Ec. (2.131) se puede expresar como s Z dθ l θ0 q T (θ0 ) = 2 g 0 2 sin (θ0 /2) − sin2 (θ/2) s Z θ0 l 1 dθ q . =2 sin2 (θ/2) g sin(θ0 /2) 0 1 − sin 2 (θ /2) 0 (2.132) (2.133) Hacemos el siguiente cambio de variables: sin y = sin(θ/2) sin(θ0 /2) ⇒ cos y dy = cos(θ/2) dθ. 2 sin(θ0 /2) (2.134) Entonces, cos(θ/2) = = dθ = = q q 1 − sin2 (θ/2) 1 − sin2 (θ0 /2) sin2 y . cos y 2 sin(θ0 /2) dy cos(θ/2) 2 sin(θ0 /2) cos y q dy. 1 − sin2 (θ0 /2) sin2 y (2.135) (2.136) 96 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS Hacemos el cambio de lı́mites: θ = 0 → y = 0; θ = θ0 → y = π . 2 Luego, la integral en la Ec. (2.133) queda s Z l π/2 dy q T (θ0 ) = 4 . g 0 1 − sin2 (θ0 /2) sin2 y (2.137) La integral definida (2.137) es una integral elı́ptica de la primera clase. Se puede obtener una aproximación de esta integral para θ0 1 (θ0 pequeño). Entonces, sin(θ0 /2) ≈ θ0 /2, y la Ec. (2.137) se convierte en s Z l π/2 dy r . (2.138) T (θ0 ) ≈ 4 g 0 θ02 2 sin y 1− 4 Usamos la siguiente expansión de Taylor para x 1, (1 ± x)n −1/2 ⇒ (1 − x) ≈ 1 ± nx + . . . 1 ≈ 1 + x + ... 2 (2.139) (2.140) y obtenemos r Z π/2 l θ2 T (θ0 ) ≈ 4 1 + 0 sin2 y dy . 2 0 8 (2.141) La integral del segundo término en la Ec. (2.141) se calcula como Z π/2 2 sin y dy = 0 π/2 π y sin(2y) = . − 2 4 4 0 (2.142) Luego, hasta segundo orden en θ0 , s T (θ0 ) ≈ ≈ l π π + θ02 + . . . g 2 32 s θ02 l 1+ . 2π g 16 4 (2.143) El perı́odo de un péndulo simple depende, en segundo orden, de la amplitud θ0 y por tanto de la energı́a total E. En sus experimentos, Galileo encontró que el perı́odo de un péndulo es independiente de la amplitud, que es el resultado correcto hasta primer orden; i.e.; para amplitudes pequeñas. 2.10. PROBLEMAS 2.10. 97 Problemas 1. Dos partı́culas con masas m1 y m2 están unidas por un resorte de constante k y longitud en reposo l, de manera que pueden deslizarse sin fricción sobre una mesa. Asuma que el resorte no se dobla. a) Encuentre las ecuaciones de movimiento del sistema. b) Encuentre e identifique las cantidades conservadas. c) Calcule el perı́odo de una oscilación a lo largo del resorte. 2. Una partı́cula de masa m y carga q está sujeta a un potencial electromagnético dado por ϕ = 0 y A = 12 B × r, donde B es un campo magnetico uniforme y constante. a) Verifique que B = ∇ × A. b) Encuentre las ecuaciones de movimiento de la partı́cula en coordenadas cilı́ndricas. c) Encuentre las cantidades conservadas. 3. Considere un sistema con el siguiente Lagrangiano: L= 1 1 a(ẋ2 sin2 y + ẏ 2 ) + b(ẋ cos y + ż)2 , 2 2 donde a y b son constantes. a) Derive las ecuaciones de movimiento del sistema. b) Calcule e identifique las cantidades conservadas. ¿Es integrable este sistema?. c) Calcule la energı́a del sistema. d) Suponga que y(t) = yo = cte. es una solución. ¿Cuáles son x(t) y z(t) en este caso?. 4. Una partı́cula de masa m se mueve con velocidad v sujeta al potencial V (r, v) = U (r) + n · l , donde r es el radio vector medido desde el origen del sistema de referencia, l es el momento angular con respecto a ese origen, n es un vector fijo en el espacio y U (r) es una función escalar. a) Encuentre la fuerza ejercida sobre la partı́cula. b) Obtenga las ecuaciones de movimiento de la partı́cula en coordenadas cartesianas. c) ¿Existe alguna cantidad constante?. 5. Una partı́cula de masa m y energı́a total E se mueve en la dirección x con energı́a potencial V (x) = k|x|n (k, n constantes), tal que el perı́odo del movimento es T . a) Encuentre los puntos de retorno de la partı́cula. b) Calcule el perı́odo resultante si la energı́a total se duplica. c) Demuestre que el perı́odo no cambia si el potencial corresponde al de un oscilador armónico simple. 6. Una partı́cula de masa m puede moverse sin fricción sobre la superficie z = k(x2 +y 2 ), donde z es la dirección vertical y k = cte. a) Encuentre las ecuaciones de movimiento de la partı́cula. b) ¿Es integrable este sistema?. 98 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS 7. Un aro de masa m y radio R puede girar libremente en un plano horizontal alrededor de un eje perpendicular que pasa por su centro. A lo largo del aro se encuentra enrollado un resorte de constante k, con un extremo fijo y el otro extremo conectado a una partı́cula de masa m, la cual desliza sin fricción sobre el aro. a) Resuelva las ecuaciones de movimiento resultantes para este sistema. b) Demuestre que existen dos cantidades conservadas en el sistema. 8. Un péndulo de masa m y longitud l está construido de modo que oscila en un plano perpendicular a un disco de masa M y radio R que puede rotar libremente sin fricción alrededor del eje vertical que pasa por su centro. Desprecie la masa de los soportes del péndulo. a) Obtenga las ecuaciones de movimiento para este sistema. b) Identifique las cantidades conservadas. ¿Es integrable este sistema?. c) Determine las condiciones iniciales del péndulo para que el disco rote con velocidad angular constante. 9. Dos masas, m1 y m2 , están conectadas por una cuerda a través de un agujero en una mesa sin fricción, de manera que m1 se mueve sobre la superficie de la mesa y m2 cuelga de la cuerda, moviéndose verticalmente. a) Determine las ecuaciones de movimiento del sistema. b) Identifique las cantidades conservadas. c) Encuentre la posición de equilibrio del sistema. d) Si m1 se encuentra inicialmente en reposo a una distancia a del agujero, determine la velocidad de m2 cuando m1 alcanza el agujero. 2.10. PROBLEMAS 99 10. Una partı́cula de masa m se mueve en la dirección x con energı́a potencial V (x) = k|x| (k = constante), tal que en un instante dado su velocidad en el origen es vo . a) Obtenga la ecuación de movimiento de la partı́cula. b) Calcule la frecuencia del movimiento. 11. Una partı́cula de masa m está unida a un resorte de constante k y longitud en reposo Lo , de modo que puede moverse sin fricción sobre un plano horizontal. A la partı́cula se le proporciona una velocidad vo perpendicular al resorte cuando éste está en reposo. a) Encuentre las ecuaciones de movimiento de la partı́cula. b) Calcule la velocidad de la partı́cula cuando la longitud del resorte es 2Lo . 12. Una varilla de masa despreciable y longitud l tiene un extremo en una pared vertical y el otro en el suelo. En el punto medio de la varilla hay una partı́cula fija de masa m. Ignore la fricción. a) Encuentre la ecuación dinámica del sistema. b) Si la varilla se suelta del reposo, formando un ángulo α con el suelo, calcule la velocidad de la masa cuando ésta choca contra el suelo. 13. Una partı́cula de masa m se mueve en el potencial unidimensional V0 . cosh2 αx a) Muestre que el movimiento de la partı́cula es finito si su energı́a E < 0, y es infinito si E ≥ 0. b) Encuentre los puntos de retorno y el mı́nimo posible valor de E. c) Para el movimiento finito, encuentre el perı́odo en función de E. V (x) = − 14. Encuentre q(t) para una partı́cula con masa m y energı́a E > k 2 = cte, que se mueve en el potencial k2 V (q) = . sin2 q 15. El Lagrangiano de un sistema se puede expresar como k m L= aẋ2 + 2bẋẏ + cẏ 2 − ax2 + 2bxy + cy 2 , 2 2 donde a, b, y c son constantes, pero sujetas a la condición b2 − ac 6= 0. Encuentre las ecuaciones de movimiento para este sistema. 100 CAPÍTULO 2. LEYES DE CONSERVACIÓN Y SIMETRÍAS 16. Determine la trayectoria de una partı́cula de masa m y carga q, moviéndose con velocidad v en el campo electromagnético E = Eo ẑ, B = Bo ẑ, donde Eo y Bo son constantes. 17. Una partı́cula con carga q y masa m se mueve en el campo electromagnético E = (xEo , 0, 0), B = (0, 0, Bo ), en coordenadas cartesianas, donde Eo y Bo son constantes. a) Encuentre el Lagrangiano de este sistema. b) Encuentre las ecuaciones de movimiento de la partı́cula. c) Encuentre los puntos estáticos de la partı́cula en el espacio. 18. El campo magnético producido por un monopolo con carga magnética b tendrı́a la forma B = br̂/r2 . Considere una partı́cula de carga q en la posición r y moviéndose con velocidad v en ese campo. Demuestre que la cantidad D ≡ l− bq c r̂ es una constante del movimiento en este sistema, donde l es el momento angular de la partı́cula y c es la velocidad de la luz. 19. Una partı́cula que se mueve sobre una superficie esférica suave de radio R gira horizontalmente en la dirección ecuatorial con frecuencia ω. Encuentre la distancia z que puede descender la partı́cula, si ω 2 R g, i.e., z R. 20. Considere una máquina de Atwood tal que una de las masas se mueve verticalmente mientras la otra puede oscilar libremente sobre un plano vertical en el campo gravitacional terrestre. La longitud de la cuerda que une las dos masas es fija. a) Encuentre las ecuaciones de movimiento para este sistema. b) Encuentre la energı́a total del sistema. c) ¿Es integrable este sistema? Capı́tulo 3 Fuerzas centrales 3.1. Problema de dos cuerpos Consideremos dos partı́culas con masas m1 y m2 ubicadas en posiciones r1 y r2 , respectivamente, con respecto a un origen O en un sistema de referencia inercial. Supongamos que las partı́culas interaccionan mediante un potencial que depende solamente de sus posiciones relativas, V (r1 , r2 ) = V (r2 − r1 ). Este sistema se conoce como el problema de dos cuerpos. Figura 3.1: Posiciones de las dos partı́culas y de su centro de masa. El sistema posee 6 grados de libertad, correspondientes a las 3 coordenadas espaciales del vector de posición r1 de la partı́cula 1 y a las 3 coordenadas del vector de posición r2 de la partı́cula 2. Definimos el vector de posición relativa de la partı́cula 2 con respecto a la partı́cula 1, como r = r2 − r1 . (3.1) Se define el vector de posición del centro de masa (CM) del sistema como R= m1 r1 + m2 r2 . m1 + m2 101 (3.2) 102 CAPÍTULO 3. FUERZAS CENTRALES Denotamos las posiciones relativas de las partı́culas al centro de masa como r01 = r1 − R, (3.3) r02 (3.4) = r2 − R, las cuales se pueden expresar en función del vector r, r01 r02 m1 r1 + m2 r2 m2 (r1 − r2 ) m2 = =− r m1 + m2 (m1 + m2 ) (m1 + m2 ) m1 r1 + m2 r2 m1 (r2 − r1 ) m1 = r2 − = = r. m1 + m2 (m1 + m2 ) (m1 + m2 ) = r1 − (3.5) (3.6) Figura 3.2: Posiciones relativas al centro de masa (CM). La energı́a cinética total del sistema es la suma de la energı́a cinética del centro de masa más la energı́a cinética relativa al centro de masa, T = Tcm + Trel , donde Tcm = 1 1 MT Ṙ2 = (m1 + m2 )Ṙ2 , 2 2 (3.7) (3.8) y Trel = = = = y donde hemos definimos la 1 1 02 m1 ṙ02 1 + m2 ṙ2 2 2 1 m21 m2 1 m1 m22 ṙ2 + ṙ2 2 2 (m1 + m2 ) 2 (m1 + m2 )2 1 (m1 m22 + m21 m2 ) 2 1 m1 m2 ṙ = ṙ2 2 (m1 + m2 )2 2 (m1 + m2 ) 1 2 µṙ , 2 masa reducida, m1 m2 . µ≡ (m1 + m2 ) (3.9) (3.10) El Lagrangiano del sistema se puede expresar como L(r, R, ṙ, Ṙ) = T − V (r2 − r1 ) 1 1 (m1 + m2 )Ṙ2 + µṙ2 − V (r) . = 2 2 (3.11) 3.1. PROBLEMA DE DOS CUERPOS 103 Los 6 grados de libertad del sistema se describen mediante las componentes de los vectores r y R. Las componentes cartesianas de R son coordenadas cı́clicas, lo que implica MT Ṙ = cte, (3.12) donde MT = m1 +m2 . Luego, el momento lineal total del sistema se conserva. Igualmente, debido a que no hay fuerzas externas sobre el sistema, puede verse que Fexterna total = 0 ⇒ PT = MT Ṙ = cte. (3.13) El centro de masa se mantiene en reposo o se mueve con velocidad constante, Ṙ = vcm = cte. La conservación del momento lineal total está asociada a la homogeneidad espacial, o simetrı́a traslacional, del problema de dos cuerpos. Luego, existen 3 cantidades conservadas correspondientes a las componentes del momento lineal total o, equivalentemente, a las tres componentes de la velocidad del centro de masa. El término Tcm correspondiente a la energı́a cinética del centro de masa es, por lo tanto, constante y se puede omitir en el Lagrangiano, Ec. (3.11), quedando L= 1 2 µṙ − V (r) , 2 (3.14) lo cual es equivalente al Lagrangiano de una partı́cula de masa µ moviéndose con velocidad ṙ en el potencial V (r). El problema de dos cuerpos se reduce a encontrar las ecuaciones de movimiento de una partı́cula de masa µ en la posición relativa r(t) con respecto a un origen O0 ubicado en una de las dos partı́culas (Fig. 3.3). Note que este sistema de referencia centrado en una de las partı́culas es un sistema no inercial, pues su origen O0 está acelerado. Figura 3.3: Equivalencia del problema de dos cuerpos. El problema puede simplificarse aún más si se consideran potenciales centrales; es decir, si V (r) es función de la magnitud |r| = r solamente. En ese caso, el potencial es V (r) y la fuerza sobre cualquiera de las partı́culas, en coordenadas esféricas, es F = −∇V (r) = − ∂V r̂ = f (r)r̂. ∂r (3.15) Una fuerza con la forma F = f (r)r̂ se denomina fuerza central. Una propiedad importante de esta tipo de fuerzas es que no ejercen torque neto sobre las partı́culas, τ = r × f (r)r̂ = 0 (3.16) ⇒ l = r × p = cte. (3.17) 104 CAPÍTULO 3. FUERZAS CENTRALES El vector momento angular total l se conserva si la fuerza de interacción entre las dos partı́culas es central. Luego, tanto la dirección como la magnitud de l son constantes, lo que proporciona una cuarta y una quinta cantidad conservada, respectivamente. Figura 3.4: Coordenadas polares sobre el plano del movimiento perpendicular a l. Como l es perpendicular al plano (r, p), la constancia de la dirección de l implica que el movimiento siempre ocurre sobre ese plano. Luego, el movimiento de la partı́cula de masa equivalente µ está confinado al plano (r, p) y, por lo tanto, se puede describir mediante dos coordenadas. Si escogemos la dirección de l en la dirección z, el plano del movimento es (x, y). La simetrı́a radial sugiere escoger coordenadas polares (r, θ) como coordenadas generalizadas sobre el plano del movimiento. Entonces, x = r cos θ ; ẋ = ṙ cos θ − rθ̇ sin θ (3.18) y = r sin θ ; ẏ = ṙ sin θ + rθ̇ cos θ. (3.19) Luego, ṙ2 = ẋ2 + ẏ 2 = ṙ2 + r2 θ˙2 , y el Lagrangiano Ec. (3.14) para un potencial central resulta en 1 L = µ ṙ2 + r2 θ˙2 − V (r). (3.20) 2 El Lagrangiano en la Ec. (3.20) posee simetrı́as que simplifican la obtención de las ecuaciones de movimiento para las coordenadas r y θ. La coordenada θ es cı́clica, pues ∂L ∂θ = 0. Entonces, la ecuación de Lagrange para θ da d ∂L ∂L − =0 (3.21) dt ∂ θ̇ ∂θ ∂L ⇒ = µr2 θ̇ = cte. (3.22) ∂ θ̇ La cantidad conservada es el momento conjugado a la coordenada angular θ, y corresponde a la magnitud del momento angular de la partı́cula de masa µ, l = µr2 θ̇ = cte. (3.23) 3.1. PROBLEMA DE DOS CUERPOS 105 Por otro lado, L en la Ec. (3.20) es independiente del tiempo y el potencial es independiente de las velocidades, por lo que la energı́a mecánica total se conserva, ∂L = 0 ⇒ E = T + V = cte. ∂t La energı́a E provee una sexta cantidad conservada, 1 2 µ ṙ + r2 θ̇2 + V (r) = cte. E = 2 (3.24) (3.25) Entonces, en el problema de dos cuerpos existen seis grados de libertad y al menos seis cantidades conservadas; por lo tanto, se trata de un sistema integrable. Las seis cantidades conservadas Ik (r1 , r2 , ṙ1 , ṙ2 ) = Ck (k = 1, . . . , 6) que permiten integrar las seis coordenadas en el problema de dos cuerpos sujetos a un potencial central V (|r2 − r1 |) = V (r) son: Las tres componentes del vector velocidad del centro de masa Ṙ. Se expresan como I1 = ẋcm = cte, I2 = ẏcm = cte, I3 = ẏcm = cte. Esto reduce el problema al movimiento del vector de posición relativa r (tres coordenadas). La dirección del momento angular l. Esto reduce el movimiento a un plano (dos coordenadas). Se puede expresar como I4 = z = 0. La magnitud del momento angular. Se expresa como I5 = µr2 θ̇ = l. La energı́a total. Corresponde a I6 = 21 µ(ṙ2 + r2 θ̇2 ) + V (r) = E. Figura 3.5: Coordenadas del movimiento de la masa reducida. Las cantidades conservadas E y l, Ecs. (3.23) y (3.25), permiten reducir el problema de dos cuerpos a un problema unidimensional equivalente y la integración de las coordenadas r y θ. En efecto, podemos escribir E= 1 2 1 l2 µṙ + + V (r) = cte. 2 2 µr2 (3.26) La Ec. (3.26) corresponde a un problema de movimiento unidimensional en la coordenada r, el cual es integrable (Sec. 2.9). A partir de la Ec. (3.26) obtenemos s 2 l2 dr = E − V (r) − . (3.27) ṙ = dt µ 2µr2 106 CAPÍTULO 3. FUERZAS CENTRALES Usando como condición inicial en t = 0 los valores de coordenadas r = r0 , θ = θ0 , podemos obtener t(r), r Z r dr µ s t(r) = , (3.28) 2 r0 l2 E − V (r) − 2µr2 y, mediante inversión, podemos obtener r(t) en función de tres constantes de integración: r0 , E, l. Del mismo modo, la Ec. (3.23) permite la integración de θ, dθ l = 2 dt µr l ⇒ dθ = 2 dt µr l dt dθ = 2 . ⇒ dr µr dr θ̇ = (3.29) (3.30) (3.31) Sustituyendo la Ec. (3.27) en la Ec. (3.31), obtenemos r l µ dθ 1 s = 2 . dr µr 2 l2 E − V (r) − 2µr2 (3.32) Usando las condiciones iniciales en t = 0, r = r0 , θ = θ0 , podemos expresar Z r l dr √ s θ= + θ0 , 2µ r0 l2 2 r E − V (r) − 2µr2 (3.33) lo cual da θ(r). Sustitución de r(t), da θ(r(t)) = θ(t), por lo que las coordenadas r y θ pueden determinarse en función del tiempo. En total hay cuatro constantes de integración, E, l, r0 , θ0 , para las coordenadas r y θ. Las cuatro constantes aparecen porque tenemos una ecuación de Lagrange para r y otra para θ, ambas de segundo orden, y las cuales requieren dos constantes de integración cada una. Cabe observar que las constantes E y l aparecen también el problema de un potencial central en Mecánica Cuántica. Note que la integración explı́cita de θ en la Ec. (3.33) (y la de t en la Ec. (3.28)) en términos de funciones elementales depende de la forma funcional del potencial V (r). El cambio de variable 1 1 u = ⇒ du = − 2 dr , (3.34) r r generalmente resulta útil al considerar integrales de potenciales centrales en el problema de dos cuerpos. Mediante este cambio, la Ec. (3.33) se convierte en 3.1. PROBLEMA DE DOS CUERPOS 107 1 u Z θ = θ0 − 1 u0 du r 2µE 2µV (u) − − u2 l2 l2 . (3.35) Las formas funcionales fı́sicamente más relevantes de potenciales centrales son V (r) = krn+1 , donde k = cte. Las fuerzas correspondientes son de la forma ∂V ∝ rn . (3.36) ∂r Por ejemplo, el exponente n = −1 corresponde a V = cte y f (r) = 0, es decir a una partı́cula libre. El valor n = −2 describe la fuerza gravitacional, mientras que n = 1 corresponde a un oscilador armónico esférico. Sustitución de V (u) = ku−(n+1) en la Ec. (3.35) da la integral Z u1 du r , (3.37) θ = θ0 − 1 2µk 2µE u0 −(n+1) 2 − 2 u −u l2 l la cual es integrable en términos de funciones elementales √ para ciertos valores de n. Si el integrando en la Ec. (3.37) tiene la forma R(u, au2 + bu + c), Z du √ , (3.38) R(u, au2 + bu + c) f (r) = − la integral se puede expresar en términos de funciones circulares sin−1 u, cos−1 u. Para que esto ocurra, el exponente de u−(n+1) en el integrando de la Ec. (3.37) debe tener, cuando mucho, un valor igual a 2; es decir, puede tomar los valores −(n + 1) = 0, 1, 2. Luego, los posibles valores de n para potenciales integrables en términos de funciones circulares son n = −1, −2, −3. (3.39) Estos valores incluyen los casos n = −1 para el potencial V = cte, y n = −2 correspondiente al potencial gravitacional k V (r) = − . (3.40) r El caso n = 1, correspondiente al potencial de un oscilador armónico esférico V (r) = kr2 , tambien se puede integrar en la Ec. (3.37). Haciendo el cambio de variable dx x = u2 ⇒ du = √ , 2 x la integral en la Ec. (3.37) resulta en Z r 2 dx 2µE 2µk x − 2 − x2 l2 l (3.41) , (3.42) la cual tiene un integrando de la forma Ec. (3.38) y, por tanto, es integrable en términos de funciones circulares. 108 CAPÍTULO 3. FUERZAS CENTRALES 3.2. Potencial efectivo Hemos encontrado que el Lagrangiano del problema de dos cuerpos que interactuan mediante el potencial central V (r) se reduce a 1 (3.43) L = µ ṙ2 + r2 θ˙2 − V (r). 2 Vimos que la ecuación de Lagrange para la coordenada θ da l = µr2 θ̇ = cte. Por otro lado, la ecuación de Lagrange para la coordenada r, ∂L d ∂L − = 0, dt ∂ ṙ ∂r resulta en µr̈ = − ∂V + µrθ̇2 . ∂r (3.44) (3.45) (3.46) Sustituyendo θ̇ = µrl 2 , la ecuación Ec. (3.46) se convierte en una ecuación de movimiento unidimensional para r, µr̈ = − ∂V l2 + 3. ∂r µr (3.47) La fuerza radial f (r) debida al potencial central V (r) es f (r) = − ∂V . ∂r (3.48) Luego, tenemos µr̈ = f (r) + l2 , µr3 (3.49) lo cual se puede expresar como µr̈ = fef (r), donde fef (r) ≡ f (r) + (3.50) l2 µr3 (3.51) se denomina fuerza efectiva radial. Esta fuerza efectiva surge de las contribuciones de la fuerza central f (r) = − ∂V ∂r y de la fuerza centrı́fuga Fc ≡ l2 = µrθ̇2 . µr3 (3.52) Esta fuerza centrı́fuga es una fuerza repulsiva ficticia que aparece en el sistema de referencia no inercial que estamos usando para describir el movimiento, cuyo origen ubicado en una de las partı́culas, se encuentra acelerado. 3.2. POTENCIAL EFECTIVO 109 Las fuerzas centrı́fugas son tı́picas de movimientos en campos centrales con momento angular l 6= 0. Por ejemplo, en el movimiento circular uniforme de una partı́cula de masa m que gira con velocidad angular constante θ̇ = ω, velocidad tangencial v = ωr, y posee momento angular l = rmv = mr2 ω, aparece una fuerza centrı́fuga cuando se describe el movimiento desde la perspectiva de la partı́cula, dada por Fc = mv 2 l2 . = mrω 2 = r mr3 (3.53) Figura 3.6: Movimiento circular uniforme. A partir de la fuerza efectiva Ec. (3.51), se puede definir una energı́a potencial efectiva, Vef (r) ≡ V (r) + l2 , 2µr2 (3.54) tal que ∂Vef , ∂r La energı́a total Ec. (3.25) puede entonces expresarse como fef (r) ≡ − 1 2 l2 µṙ + + V (r) 2 2µr2 1 = µṙ2 + Vef (r) = cte , 2 (3.55) E= (3.56) lo que resulta equivalente a la energı́a total de una partı́cula de masa µ, moviéndose en la dimensión r con energı́a potencial Vef (r). El movimiento radial puede analizarse a partir de la Ec. (3.56). La condición ṙ2 ≥ 0 implica que este movimento ocurre para valores de r tales que E ≥ Vef (r). Los puntos de retorno del movimiento radial están dados por la condición ṙ = 0 en la Ec. (3.56); es decir, E = ⇒ l2 + V (r) 2µr2 l2 Er2 − V (r)r2 − = 0, 2µ Vef (r) = (3.57) (3.58) 110 CAPÍTULO 3. FUERZAS CENTRALES la cual constituye una ecuación algebraica de grado al menos cuadrático en r; luego pueden existir al menos dos raı́ces reales, r = rmin , r = rmax . Si existe un rango de valores r ∈ [rmin , rmax ] para el cual E ≥ Vef (r), entonces el movimiento está confinado a esa región anular en el plano (r, θ). Figura 3.7: Movimiento radial y angular. Note que, si rmax < ∞ ⇒ movimiento es finito, oscilatorio en r, (3.59) si rmax → ∞ ⇒ movimiento sin retorno, (3.60) si rmin = rmax ⇒ movimiento es circular. (3.61) l ≥ 0, µr2 (3.62) Por otro lado, notamos que θ̇ = lo cual significa que la velocidad angular θ̇ nunca cambia de signo; el ángulo θ siempre se incrementa en el tiempo y, como consecuencia, el movimiento siempre ocurre en una misma dirección sobre el plano del movimiento (r, θ). En cambio, la distancia radial r(t) puede aumentar o disminuir en el tiempo. La Ec. (3.56) permite encontrar la condición para que una partı́cula caiga al centro de atracción de un potencial central; es decir, para que rmin = 0. Esto significa que las dos partı́culas chocan. La Ec. (3.56) implica que 1 2 µṙ 2 = ⇒ l2 >0 2µr2 l2 Er2 − V (r)r2 − > 0. 2µ E − V (r) − (3.63) Tomando el lı́mite r → 0, obtenemos la condición para caer al centro, lı́m [V (r)r2 ] < − r→0 l2 . 2µ (3.64) 3.2. POTENCIAL EFECTIVO 111 Consideremos un potencial atractivo de la forma V (r) = −k/rn . La condición Ec. (3.64) con l 6= 0 implica n > 2. El potencial V (r) = −k/r3 (n = 3) permite caer al centro, rmin = 0. Por otro lado, el potencial gravitacional V (r) = −k/r (n = 1) no permite l2 para alcanzar rmin = 0. El caso n = 2, correspondiente a V (r) = −k/r2 , requiere k > 2µ caer al centro de atracción. Ejemplos. 1. Dibujar esquemáticamente el potencial efectivo resultante del potencial V = − kr y analizar los tipos de movimiento posibles para diferentes valores de la energı́a. La fuerza correspondiente a este potencial es f (r) = − ∂V k = − 2. ∂r r (3.65) El potencial efectivo es Vef = V (r) + l2 k l2 = − + . 2µr2 r 2µr2 (3.66) Figura 3.8: Potencial efectivo para V (r) = − kr . El valor mı́nimo del potencial efectivo ocurre para un radio r = r0 dado por ∂Vef = 0. (3.67) ∂r r=r0 Posibles movimientos para diferentes valores de la energı́a E: a) E = E1 > 0 ⇒ rmin > 0 y rmax → ∞; órbita abierta. b) E = E2 = 0 ⇒ rmin > 0 y rmax → ∞; órbita abierta. c) E = E3 < 0 ⇒ r ∈ [rmin , rmax ]; movimiento radial oscilatorio. d ) E = E4 = Vef (min) < 0 ⇒; rmin = rmax = r0 ; órbita circular con r = r0 . 112 CAPÍTULO 3. FUERZAS CENTRALES 2. Potencial efectivo para el potencial V = armónico tridimensional. 1 2 2 kr , correspondiente a un oscilador El potencial efectivo es Vef (r) = l2 1 2 . kr + 2 2µr2 (3.68) . Figura 3.9: Potencial efectivo para V (r) = 1 kr2 . 2 El movimiento radial ocurre en la región r ∈ [rmin , rmax ] . La condición E ≥ Vef (r) implica que existen puntos de retorno rmin , rmax 6= 0; es decir, el movimiento radial es oscilatorio. La magnitud de la fuerza radial es f (r) = − ∂V ∂r = −kr. Las componentes de la fuerza radial f = −krr̂ son fx = −kx , fy = −ky . (3.69) El movimiento radial es el resultado de dos oscilaciones simples, perpendiculares entre sı́, con igual frecuencia ωx2 = ωy2 = k/µ. 3. Caracterizar los movimientos posibles en el potencial efectivo correspondiente al potencial V = − rk3 . El potencial efectivo es Vef (r) = − k l2 + . r3 2µr2 (3.70) El potencial efectivo exhibe un máximo Vef (max) que representa una barrera de potencial si E < Vef (max) . Los posibles movimientos son a) E = E1 > Vef (max) ; movimiento existe ∀ r. b) E = E2 < Vef (max) ; hay dos puntos de retorno r1 y r2 que satisfacen E = Vef . El movimiento ocurre para r ∈ [0, r1 ] y para r ≥ r2 . En Mecánica Clásica, el movimiento es imposible para r ∈ [r1 , r2 ]. c) E < 0; movimiento ocurre para r ∈ [0, r1 ]. 3.3. ECUACIÓN DIFERENCIAL DE LA ÓRBITA 113 Figura 3.10: Potencial efectivo para V = − rk3 . Movimiento radial para E = E2 < Vef (max) ocurre en las regiones r ≤ r1 y r ≥ r2 . 3.3. Ecuación diferencial de la órbita En la Sec. 3.1 vimos que, dado V (r) y cuatro constantes (E, l, r0 , θ0 ), se pueden determinar t(r) (y por tanto r(t)) y θ(r), mediante integración y que, en particular, existen formas de potenciales V (r) integrables explı́citamente en términos de funciones circulares. Consideremos ahora el problema inverso; es decir, dada una órbita r(θ) determinar el potencial V (r) (y la fuerza f (r)) que produce ésta órbita. Esto es posible mediante la obtención de la ecuación diferencial de la órbita. Consideremos la ecuación de movimiento Ec (3.49) para r(t), µr̈ − ∂V l2 = f (r) = − . µr3 ∂r (3.71) La Ec. (3.71) se puede transformar en una ecuación diferencial para r(θ). Las derivadas temporales de r(t) se pueden expresar como ṙ = dr dθ l dr dr = = 2 , dt dθ dt µr dθ (3.72) donde hemos usado θ̇ = µrl 2 . En general, para una función g(θ), ⇒ dg dt d dt = = dg dθ l dg = 2 dθ dt µr dθ l d . µr2 dθ (3.73) (3.74) Luego, r̈ = = d dr d l dr = dt dt dt µr2 dθ l d l dr . µr2 dθ µr2 dθ (3.75) 114 CAPÍTULO 3. FUERZAS CENTRALES Sustitución en la Ec. (3.71) da l d r2 dθ l dr µr2 dθ − ∂V l2 =− . µr3 ∂r (3.76) Usando el cambio de variables u = 1/r, tenemos du 1 dr dr =− 2 = −u2 , dθ r dθ dθ (3.77) y expresando el lado derecho de la Ec. (3.76) en términos de u, ∂V ∂u 1 ∂V ∂V ∂V = =− 2 = −u2 , ∂r ∂u ∂r r ∂u ∂u la Ec. (3.76) se puede escribir como l2 2 d du l2 ∂V u + u3 = −u2 ; µ dθ dθ µ ∂u (3.78) (3.79) es decir, l2 d2 u ∂V +u =− . µ dθ2 ∂u (3.80) La Ec. (3.80) constituye la ecuación diferencial de la órbita para r(θ) = 1/u(θ) en términos del potencial V (r) = V (1/u). Esta ecuación de la órbita se puede usar para encontrar el potencial (o la fuerza) central que da lugar a una órbita dada, o para determinar la órbita resultante de un potencial (o fuerza) dado. Ejemplo. 1. Encontrar el potencial V (r) que produce la órbita espiral r(θ) = ro e−aθ , con ro , a constantes. Tenemos u= 1 aθ 1 = e . r ro (3.81) Luego, d2 u a2 aθ = e = a2 u. dθ2 ro (3.82) Sustituyendo en la Ec. (3.80) para la órbita, se obtiene ∂V l2 2 (a + 1)u = − . µ ∂u (3.83) 3.4. FUERZA GRAVITACIONAL Y PROBLEMA DE KEPLER 115 Entonces, V (u) ⇒ V (r) l2 2 (a + 1)u2 2µ l2 2 k = − 2 , con k = (a + 1) = cte. r 2µ = − (3.84) Note que k > l2 /2µ, por lo que, según la condición Ec. (3.64), una partı́cula sujeta a este potencial cae al centro de atracción, r = 0, describiendo la órbita espiral dada. 3.4. Fuerza gravitacional y problema de Kepler La fuerza gravitacional entre dos partı́culas con masas m1 y m2 , separadas por una distancia r es una fuerza central atractiva dada por f (r) = − Gm1 m2 , r2 (3.85) donde G = 6,674 × 10−11 N (m/Kg)2 es la constante universal gravitacional. La forma de la fuerza gravitacional (ley de gravitación) fue descubierta por Isaac Newton y la constante G fue determinada experimentalmente por Henry Cavendish (1731-1810). La energı́a potencial gravitacional correspondiente es Gm1 m2 . (3.86) r La fuerza gravitacional que una partı́cula de masa m1 ejerce sobre otra partı́cula de masa m2 , que se encuentra en una posición r desde la primera partı́cula, es V (r) = − Gm1 m2 r̂. (3.87) r2 Se define la intensidad del campo gravitacional creado por m1 en la posición r de la partı́cula m2 como la cantidad vectorial F(r) = − g(r) ≡ F(r) Gm1 = − 2 r̂. m2 r (3.88) El campo g(r) corresponde a la fuerza gravitacional por unidad de masa producida por m1 en la posición r. Puesto que F(r) = −∇V (r), donde V (r) es la energı́a potencial de interacción gravitacional entre m1 y m2 , el campo g(r) se puede expresar como g(r) = −∇ϕ(r), (3.89) donde definimos el potencial gravitacional ϕ(r) producido por m1 como la cantidad escalar V (r) Gm1 ϕ(r) ≡ =− . (3.90) m2 r 116 CAPÍTULO 3. FUERZAS CENTRALES Figura 3.11: Izquierda: Flujo del campo gravitacional de una partı́cula a través de una superficie S. Derecha: Elemento de área contenido en un elemento de ángulo sólido dΩ a una distancia r. Consideremos una partı́cula de masa m dentro de una superficie arbitraria y cerrada S que contiene un volumen V. Se define el flujo del campo gravitacional a través de la superficie S como la integral cerrada de área I Φ= g · dA, (3.91) S donde g se evalúa sobre S y dA = dA n̂ es un elemento de área de S cuyo vector normal unitario es n̂. Entonces, I I 1 g · dA = −Gm dA r̂ · n̂. (3.92) 2 S S r El elemento diferencial de ángulo sólido dΩ con origen en m encierra un área dA cos θ a la distancia r. Luego, por definición, dΩ = dA cos θ dA n̂ · r̂ = . 2 r r2 (3.93) Entonces, I I g · dA = −Gm S dΩ = −4πGm; (3.94) S es decir, el flujo del campo gravitacional a través de S es proporcional a la masa de la partı́cula encerrada por S, independientemente de la ubicación de la partı́cula dentro de la superficie S. Por extensión, para un conjunto de partı́culas con masas mi , i = 1, . . . , N , encerradas por la superficie S, se obtiene I g · dA = −4πG S N X mi = −4πG Menc , (3.95) i=1 donde Menc es la masa total encerrada por S. La Ec. (3.95) es la ley de Gauss para la gravitación en su formal integral. 3.4. FUERZA GRAVITACIONAL Y PROBLEMA DE KEPLER 117 Usando el teorema de la divergencia para el campo g, tenemos I Z g · dA = ∇ · g dV, (3.96) S V donde dV es un elemento del volumen V encerrado por S. Si llamamos ρ(r) a la función que describe la densidad de masa contenida en el volumen V, tenemos Z Menc = ρ dV. (3.97) V Entonces, la ley de Gauss, Ec. (3.95), puede expresarse como Z Z ∇ · g dV = −4πG ρ dV. V (3.98) V Puesto que el volumen V es arbitrario, debemos tener ∇ · g = −4πGρ. (3.99) La Ec. (3.99) es la ley de Gauss para la gravitación en su forma diferencial. Ambas formas de la ley de Gauss son consecuencia de la dependencia con la distancia 1/r2 de la fuerza gravitacional. Usando g = −∇ϕ, podemos escribir la Ec. (3.99) como ∇2 ϕ = 4πGρ, (3.100) que constituye una ecuación de Poisson para el potencial gravitacional ϕ. La Ec. (6.71) es una manera alternativa de expresar la ley de gravitación de Newton. Figura 3.12: Monumento a Tycho Brahe (1546-1601) y Johannes Kepler (1571-1630) en Praga. El problema de Kepler se refiere al cálculo de la órbita de una partı́cula en un campo central correspondiente a la fuerza gravitacional f (r) = − kr , con k = Gm1 m2 . 118 CAPÍTULO 3. FUERZAS CENTRALES La órbita r(θ) correspondiente al potencial gravitacional V (r) = − kr puede ser determinada a partir de la ecuación diferencial de la órbita, Ec. (3.80), con u = 1/r, ∂V l2 d2 u + u =− , (3.101) µ dθ2 ∂u El potencial gravitacional puede expresarse como V = −ku. Sustituyendo, obtenemos µ d2 u +u=k 2 , 2 dθ l (3.102) que es una ecuación diferencial ordinaria inhomogénea de segundo orden. Su solución es u(θ) = uh + up , (3.103) donde up es una solución particular y uh es la solución de la ecuación homogénea u00h + uh = 0. (3.104) La solución de la ecuación homogénea se puede expresar como uh = A cos(θ − θ0 ) , A, θ0 ctes, (3.105) mientras que una solución particular de la Ec. (3.102) es up = k µ . l2 (3.106) Luego, la solución general de la Ec. (3.102) es kµ + A cos(θ − θ0 ) l2 (3.107) 1 kµ = 2 [1 + e cos(θ − θ0 )] , r l (3.108) u(θ) = ⇒ que corresponde la ecuación de una sección cónica en coordenas polares, cuya forma general está dada por q = 1 + e cos θ, (3.109) r con θ0 = 0, donde q y e son constantes. La constante e se denomina excentricidad y la constante q es el latus de la cónica. La órbita también puede obtenerse por integración explı́cita mediante la Ec. (3.35), Z du r θ = θ0 − , (3.110) 2µE 2µV (u) 2 − −u l2 l2 la cual, con V (u) = −ku, queda Z θ = θ0 − du r 2µE 2µk + 2 u − u2 l2 l . (3.111) 3.4. FUERZA GRAVITACIONAL Y PROBLEMA DE KEPLER La integral es del tipo Z √ du 1 (b + 2au) −1 √ √ = cos − , −a au2 + bu + c b2 − 4ac donde a = −1, b= 2µk , l2 c= 119 (3.112) 2µE , l2 2 2µk 2E 2 b − 4ac = 1+ l2 µk 2 2µk l2 u . b + 2au = 1− l2 µk 2 Luego, θ = θ0 − cos s 1+ −1 2 l u−1 µk s 2El2 1+ µk 2 2El2 l2 cos(θ0 − θ) = u − 1. 2 µk µk Escogiendo la condición inicial θ0 = 0 para t = 0 y despejando u = 1/r, s ! 2El2 1 µk = 2 1+ 1+ cos θ r l µk 2 (3.113) (3.114) (3.115) obtenemos que la órbita r(θ) tiene la forma general de la ecuación de una sección cónica en coordenadas polares cuyo origen se encuentra en uno de los focos, Ec. (3.109). Comparando con la Ec. (3.109), identificamos la excentricidad de la órbita, s 2El2 , (3.116) e= 1+ µk 2 y el latus de la cónica, q= l2 . µk (3.117) El latus corresponde al valor q = r( π2 ). La distancia mı́nima al foco ubicado en rmin se denomina perihelio (si se trata de órbita alrededor del Sol) o perigeo (si es una órbita alrededor de la Tierra), y corresponde al ángulo θ = 0, q r(0) = = rmin . (3.118) 1+e 120 CAPÍTULO 3. FUERZAS CENTRALES Figura 3.13: Latus q y perihelio rmin de la órbita en el problema de Kepler. Sustituyendo q y e, obtenemos l2 µk rmin = s 1+ . (3.119) 2El2 1+ µk 2 El movimiento de la masa reducida µ en el potencial V = −k/r sigue la trayectoria de una cónica dada por la Ec. (3.115). El tipo de cónica (circunferencia, elipse, parábola, hipérbola) que describe la partı́cula de masa µ en el potencial V (r) = −k/r depende del valor de la excentricidad e y, por tanto, de la energı́a total E, segun la Ec. (6.151). La órbita de cada una de las partı́culas m1 y m2 , separadas por una distancia r, es una sección cónica con un foco en el centro de masa del sistema. El movimiento radial en el problema de Kepler ocurre en el potencial efectivo Vef (r) = − l2 k + . r 2µr2 (3.120) Figura 3.14: Potencial efectivo para el problema de Kepler. Las órbitas posibles descritas por la Ec. (3.115), y cuyo movimiento radial es compatible con este potencial efectivo [Fig. (3.14)], son las siguientes: 3.4. FUERZA GRAVITACIONAL Y PROBLEMA DE KEPLER 121 1. Órbita circular. La ecuación de la cónica Ec. (3.109) con e = 0 describe una partı́cula con energı́a E=− µk 2 , 2l2 (3.121) moviéndose en una órbita circular de radio ro = q = l2 k = . µk 2|E| El radio ro corresponde al valor mı́nimo de la Vef , ∂Vef = 0. ∂r ro (3.122) (3.123) La energı́a de la órbita circular es igual al mı́nimo de la Vef , E = Vef (ro ) = − k l2 . + ro 2µro2 La velocidad angular del movimiento circular con radio ro es s k l θ̇ = 2 = . µro µro3 (3.124) (3.125) 2. Órbita elı́ptica. La ecuación de la cónica Ec. (3.109) q = 1 + e cos θ , r (3.126) para e < 1 (E < 0) corresponde a una elipse en coordenadas polares con centro en uno de los focos. Figura 3.15: Parámetros de la órbita elı́ptica. 122 CAPÍTULO 3. FUERZAS CENTRALES Los puntos de retorno del movimiento radial con E < 0 están dados por q , 1+e q = . 1−e θ = 0 ⇒ r = rmin = (3.127) θ = π ⇒ r = rmax (3.128) El movimiento radial es finito y oscilatorio, con r ∈ [rmin , rmax ]. Estos valores de rmin y rmax también corresponden a las raı́ces de la ecuación E = Vef , E = Vef = − k l2 + r 2µr2 ⇒ Er2 + kr − l2 = 0, 2µ (3.129) de donde obtenemos rmin rmax s ! 2El2 1− 1+ , µk 2 s ! 2El2 k =− 1+ 1+ . 2E µk 2 k =− 2E (3.130) (3.131) Se pueden escribir como k (1 − e) , 2 |E| k = (1 + e) . 2 |E| rmin = (3.132) rmax (3.133) La distancia rmin se llama perihelio y la cantidad rmax se denomina afelio, para órbitas elı́pticas alrededor del Sol (para órbitas alrededor de la Tierra estas cantidades se llaman perigeo y apogeo, respectivamente). El semieje mayor de la elipse a satisface la relación (Fig. (3.15)) rmin + rmax = 2a; (3.134) luego, a= k , 2 |E| o a= q . 1 − e2 (3.135) Se puede expresar también rmin = a (1 − e) , (3.136) rmax = a (1 + e) . (3.137) La distancia entre el centro geométrico de la elipse y cualquier foco es a − rmin = ae. (3.138) 3.4. FUERZA GRAVITACIONAL Y PROBLEMA DE KEPLER 123 Figura 3.16: Coordenadas cartesianas (x0 , y 0 ) con origen O0 en el centro geométrico de la elipse. La ecuación de la elipse, Ec. (3.126), también puede expresarse en coordenadas cartesianas (x, y) con origen O en el foco. En coordenadas cartesianas (x0 , y 0 ) con origen O0 en el centro geométrico de la elipse, la ecuación Ec. (3.126) corresponde a x02 y 02 + 2 = 1, 2 a b (3.139) donde a y b son los semiejes mayor y menor de la elipse, respectivamente. Mediante la transformación x0 = x + ae, y0 = y , (3.140) la ecuación de la elipse Ec. (3.109) puede escribirse en coordenas cartesianas con centro en el foco de atracción, y2 (x + ae)2 + = 1. (3.141) a2 b2 El semieje menor b puede obtenerse evaluando el punto (x = 0, y = q) en la Ec. (3.141), p q b= √ (3.142) = a 1 − e2 . 1 − e2 3. Órbita parabólica. La ecuación de la cónica Ec. (3.109) con e = 1 describe una parábola q = 1 + cos θ . r (3.143) La energı́a correspondiente de la partı́cula es E = 0. La distancia rmin corresponde a θ=0 ⇒ rmin = q l2 = , 2 2µk (3.144) mientras que θ=π ⇒ rmax → ∞ . (3.145) La condición E = 0 en la Ec. (3.25) implica que la velocidad radial ṙ de la partı́cula en rmax = ∞ es cero. 124 CAPÍTULO 3. FUERZAS CENTRALES Figura 3.17: Órbita parabólica. Un punto P de la parábola satisface d1 = d2 . Geométricamente, una parábola es el conjunto de puntos P tales que d1 = d2 , donde d1 es la distancia al foco de atracción f y d2 es la distancia perpendicular a la recta denominada directriz, Fig.(3.17). El punto correspondiente a (θ = π/2, r = q) indica que la distancia perpendicular entre el eje y y la recta directriz es igual a q. 4. Órbita hiperbólica. Corresponde a la Ec. (3.109) de una cónica con e > 1, (E > 0). La órbita es abierta, rmax = ∞, y el perihelio corresponde a q θ = 0 ⇒ rmin = . (3.146) 1+e Órbitas hiperbólicas aparecen en problemas de dispersión en campos de fuerzas centrales y serán estudiadas en la Sec. 3.7. La Fig. (3.18) muestra las cuatro órbitas posibles en el problema de Kepler. Figura 3.18: Tipos de órbitas en el potencial de Kepler V (r) = −k/r, correspondientes a un mismo valor de rmin = ro = l2 /µk. 3.5. LEYES DE KEPLER Y DEPENDENCIA TEMPORAL 3.5. 125 Leyes de Kepler y dependencia temporal La Primera Ley de Kepler establece que los planetas describen órbitas elı́pticas alrededor del Sol. En efecto, hemos visto que una partı́cula (planeta) sujeta al potencial gravitacional V (r) = −k/r, con E < 0, describe una órbita elı́ptica. Por otro lado, vimos en la Sec. 3.1 que un potencial central V (r) implica la conservación del momento angular l = µr2 θ̇ = cte. (3.147) La constancia de la cantidad l puede interpretarse geométricamente. Figura 3.19: Izquierda: Área barrida por el radio vector r(t) en un intervalo de tiempo dt. El diferencial de área barrida por el radio vector r en un tiempo infinitesimal dt es dA = 1 1 (rdθ)r = r2 dθ . 2 2 (3.148) El área barrida por unidad de tiempo es 1 dθ 1 dA = r2 = r2 θ̇. dt 2 dt 2 (3.149) Usando la Ec. (3.147), dA dt dA ⇒ dt = = 1 2 l r 2 µr2 l = cte. 2µ (3.150) La Ec. (3.150) constituye la Segunda Ley de Kepler : la velocidad areal es constante bajo fuerzas centrales, i.e., el radio vector barre áreas iguales en tiempos iguales. En órbitas elı́pticas, la Segunda Ley de Kepler implica que la velocidad angular aumenta cerca del centro (foco) de atracción y disminuye lejos de éste. En particular, 2 2 rmin θ̇max = rmax θ̇min , (3.151) donde θmax y θmin son los valores máximo y mı́nimo de la velocidad angular, respectivamente. 126 CAPÍTULO 3. FUERZAS CENTRALES Figura 3.20: Segunda Ley de Kepler para una órbita elı́ptica. Si la órbita es finita, r ∈ [rmin , rmax ], el área A encerrada por la órbita es finita y resulta barrida por el radio r en un tiempo igual al perı́odo del movimiento Tp , Z Tp l l A= Tp . (3.152) dt = 2µ 0 2µ En particular, si la órbita es una elipse en el potencial V (r) = −k/r, el área encerrada es A = √ πab, donde a es el semieje mayor, y b es el semieje menor de la elipse. Vimos que b = a 1 − e2 y q = a(1 − e2 ); luego p A = πa2 1 − e2 = πa3/2 q 1/2 s l2 = πa3/2 , (3.153) µk donde hemos usado q = tenemos l2 µk . Igualando la Ec. (3.152) con la Ec. (3.153), y despejando Tp , r µa3 Tp = 2π . (3.154) k La Ec (3.154) constituye la Tercera Ley de Kepler en su forma exacta. En el sistema solar, supongamos que M es la masa del Sol, situado en el foco, y m es la masa del planeta que describe una órbita elı́ptica. Entonces, podemos asumir m/M 1. La masa reducida correspondiente al sistema Sol-planeta es Mm Mm m −1 µ= = 1+ ≈ m. (3.155) M +m M M Entonces, usando k = GM m, la Ec (3.154) puede escribirse en forma aproximada como 4π 2 3 a GM ⇒ Tp2 ∝ a3 , Tp2 ≈ (3.156) (3.157) 3.5. LEYES DE KEPLER Y DEPENDENCIA TEMPORAL 127 donde la constante de proporcionalidad es la misma para todos los planetas del sistema solar. La Ec. (3.157) es la forma de la Tercera Ley formulada originalmente por Kepler. La Tercera Ley de Kepler se ha empleado en el descubrimiento de nuevos planetas fuera del sistema solar, denominados exoplanetas. El perı́odo orbital se puede determinar a partir de la observación del perı́odo del corrimiento Doppler en el espectro de la estrella, la cual gira alrededor del centro de masa del sistema exoplaneta-estrella. La masa de la estrella puede conocerse en muchos casos mediante técnicas espectrales. Entonces la Tercera Ley de Kepler permite calcular la distancia a de la órbita del exoplaneta. Figura 3.21: Diagrama de masa versus distancia de exoplanetas y planetas del sistema solar, identificados por sus iniciales. (Physics Today, p. 46, mayo 2009). En resumen, tenemos las tres Leyes de Kepler : 1. Primera Ley: los planetas describen órbitas elı́pticas alrededor del Sol, el cual se encuentra en uno de los focos de la elipse. (Consecuencia de la forma V (r) = − kr ). 2. Segunda Ley: el área barrida por unidad tiempo por el radio vector que va desde el Sol al planeta es constante: Ȧ = cte. (Consecuencia del potencial central V (r) y, por tanto, de la conservación de l). 3. Tercera Ley: el cuadrado del perı́odo del movimiento es proporcional al cubo del semieje mayor de la órbita, para todos los planetas: Tp2 ∝ a3 . (Consecuencia de l = cte y de la forma V (r) = − kr ). 128 CAPÍTULO 3. FUERZAS CENTRALES Ecuación de Kepler. La dependencia temporal de la coordenada radial r(t) en una órbita elı́ptica puede obtenerse por integración de la Ec. (3.28) para el potencial V = −k/r, r Z µ dr s t= , (3.158) 2 l2 k E− + 2µr2 r donde k < 0. 2a Expresemos l en términos de los parámetros de la elipse a y e, E=− l2 2El2 =1− 2 µk aµk 2 2 ⇒ l = (1 − e )aµk. e2 = 1 + Sustituyendo en la integral Ec. (3.158), tenemos r Z µ dr r t = 2 k (1 − e2 )ak k − − + 2a 2r2 r r Z µ r dr r = 2 kp 2 −r − (1 − e2 )a2 + 2ra 2a r Z µa rdr p = . 2 2 k e a − (r − a)2 (3.159) (3.160) (3.161) (3.162) Haciendo el cambio de variables r = a(1 − e cos ψ) , (3.163) dr = ae sin ψ dψ , (3.164) la integral Ec. (3.162) queda t r µa k r µa3 k = = r = Z a(1 − e cos ψ) ae sin ψ dψ p ea 1 − cos2 ψ Z (1 − e cos ψ) dψ µa3 (ψ − e sin ψ) + cte. k (3.165) Escogemos la condición inicial r(0) = rmin = a(1 − e) en t = 0; lo que implica ψ = 0 para t = 0; luego la constante es igual a cero en la Ec. (3.165). 3.5. LEYES DE KEPLER Y DEPENDENCIA TEMPORAL 129 Usando la Tercera Ley de Kepler, r Tp = 2π µa3 , k definimos la frecuencia angular del movimiento s 2π k . ω≡ = Tp µa3 (3.166) (3.167) Luego, la dependencia temporal del radio en una órbita elı́ptica en el problema de Kepler puede expresarse mediante las relaciones paramétricas ωt = ψ − e sin ψ, (3.168) r = a(1 − e cos ψ), (3.169) que se conocen como ecuaciones de Kepler. Estas ecuaciones permiten encontrar la distancia radial r(t) en función del tiempo, a través del parámetro ψ, dados los parámetros geométricos de la elipse a y e. Consecuentemente, puede encontrarse el ángulo θ(t) mediante la ecuación q = 1 + e cos θ(t) . (3.170) r(t) El parámetro ψ en la ecuación de Kepler se denomina anomalı́a excéntrica de la elipse y puede interpretarse geométricamente. Consideremos la Fig. (3.22). Figura 3.22: Definición de la anomalı́a excéntrica ψ. donde, P es un punto sobre la elipse con semiejes a y b, y excentricidad e. Q es un punto sobre la circunferencia de radio a que circunscribe la elipse. ψ es el ángulo denominado anomalı́a excéntrica. θ se denomina anomalı́a verdadera. a es el semieje mayor. b es el semieje menor. 130 CAPÍTULO 3. FUERZAS CENTRALES rmin = a(1 − e) es el perihelio. rmax = a(1 + e) es el afelio. q = a(1 − e2 ) es el latus. El punto P (x, y) satisface la ecuación de la elipse en coordenadas cartesianas, Ec. (3.141), y2 (x + ae)2 + = 1. a2 b2 (3.171) De la Fig. (3.22) tenemos, x + ae , (3.172) a y sustituyendo en la ecuación de la elipse en coordenadas cartesianas, podemos obtener cos ψ = y = sin ψ . b (3.173) En términos de a y e, x = a(cos ψ − e), p y = b sin ψ = a 1 − e2 sin ψ, (3.174) (3.175) √ (usando b = a 1 − e2 ). La coordenada radial r del punto P puede expresarse r 2 = x2 + y 2 = a2 (cos ψ − e)2 + a2 (1 − e2 ) sin2 ψ = a2 (1 − e cos ψ)2 . (3.176) r = a(1 − e cos ψ) , (3.177) Luego, que es el cambio de variable usado en la Ec. (3.163) para la integración de t. La Ec. (3.177) corresponde a la ecuación de la órbita elı́ptica en términos de la anomalı́a excéntrica. La relación entre los ángulos θ y ψ puede determinarse comparando la Ec. (3.177) con la ecuación de la elipse en coordenadas polares, q = 1 + e cos θ . r (3.178) Empleando la relación q = a(1 − e2 ), obtenemos (1 − e2 ) 1 + e cos θ e + cos θ cos ψ = . 1 + e cos θ 1 − e cos ψ = ⇒ (3.179) (3.180) 3.5. LEYES DE KEPLER Y DEPENDENCIA TEMPORAL 131 Ejemplos. 1. Área encerrada por una órbita elı́ptica con parámetros q y e. El elemento diferencial de área en coordenadas polares es dA = 1 2 r dθ . 2 (3.181) La órbita elı́ptica con e < 1 está dada por q . 1 + e cos θ r(θ) = (3.182) El área encerrada por la elipse corresponde a la integración 1 A= 2 Z 2π 1 r (θ) dθ = q 2 2 2 2 0 Z π 0 dθ . (1 + e cos θ)2 La integral puede encontrarse en tablas matemáticas en la forma Z dθ 2 −1 (1 − e) tan(θ/2) = tan (1 + e cos θ)2 (1 − e2 )3/2 (1 − e2 )1/2 e sin θ . − (1 − e2 )(1 + e cos θ) (3.183) (3.184) El segundo término en la expresión Ec. (3.184) se anula al ser evaluado en los lı́mites θ = 0 y θ = π, mientras que el primer término contribuye en tan−1 π (1 − e) tan(θ/2) π = 2. (1 − e2 )1/2 0 (3.185) Luego, A = q2 Z 0 = π dθ (1 + e cos θ)2 πq 2 . (1 − e2 )3/2 (3.186) Usando las relaciones q = a(1 − e2 ) y b = a(1 − e2 )1/2 , el área de la elipse también puede expresarse como A = πq 1/2 a3/2 (3.187) = πab. (3.188) 132 CAPÍTULO 3. FUERZAS CENTRALES 2. Similitud mecánica y perı́odo orbital para potenciales centrales V (r) = −kr−n . Una similitud mecánica es una transformación de las escalas de longitud y de tiempo que deja invariante la forma de la ecuación de movimiento de una partı́cula. Consideremos la ecuación de movimiento de una partı́cula de masa m en el potencial V (r) = −kr−n , mr̈ = −∇V (r) = −k n r−(n+1) r̂. (3.189) Sea a = (rmin + rmax )/2 la longitud que caracteriza el tamaño de una órbita finita; por ejemplo el semieje mayor en una órbita elı́ptica, y sea T el tiempo requerido para recorrer esa distancia; por ejemplo, el perı́odo de una órbita elı́ptica serı́a 2T . Consideremos la transformación r0 = λr, t0 = τ t, (3.190) donde λ y τ son constantes. Entonces dr dt d2 r dt2 τ dr0 , 0 λ dt τ d dr0 d dr τ 2 d2 r0 = = . dt dt λ dt dt0 λ dt02 = = (3.191) (3.192) La ecuación de movimiento en las nuevas variables r0 y t0 se transforma como 2 τ kn mr̈0 = −λ(n+1) 0(n+1) r̂0 . (3.193) λ r La transformación es una similitud mecánica; i. e., la ecuación de movimiento preserva su forma, si τ = λ(n+2)/2 . (3.194) La longitud caracterı́stica a y el tiempo caracterı́stico T se transforman como a0 = λa, T 0 = τ T. (3.195) Luego, T0 a0 = ⇒ τ T T a n/2 T n/2 =λ = λ a a a0 a (n+2)/2 0 (n+2)/2 T T = . a a0 (3.196) (3.197) Entonces, podemos escribir T ∝ a(n+2)/2 . (3.198) Para n = 1 tenemos el potencial gravitacional y la Ec. (3.198) reproduce la Tercera Ley de Kepler, T ∝ a3/2 . Para n = −2, el potencial corresponde a un oscilador armónico tridimensonal, y la Ec. (3.198) indica que el perı́odo de la órbita es independiente de su tamaño o amplitud. 3.6. ESTABILIDAD DE ÓRBITAS CIRCULARES Y ÁNGULO DE PRECESIÓN 133 3.6. Estabilidad de órbitas circulares y ángulo de precesión El radio ro de una órbita circular descrita por una partı́cula sujeta a un potencial efectivo l2 , (3.199) Vef (r) = V (r) + 2µr2 está dado por la condición ∂Vef =0 ∂r ro (3.200) ∂V l2 ⇒ − 3 = 0. ∂r ro µro (3.201) La órbita circular es estable si ro corresponde al valor mı́nimo del potencial efectivo Vef (min) = Vef (ro ); es decir, ∂ 2 Vef >0 ∂r2 ro (3.202) 3l2 ∂ 2 V + > 0. ⇒ ∂r2 ro µro4 (3.203) La fuerza central sobre una partı́cula en la órbita circular de radio ro es ∂V l2 f (ro ) = − =− 3, ∂r ro µro (3.204) donde el signo menos indica que la fuerza es atractiva. Luego, en términos de f (ro ), la condición de estabilidad de una órbita circular de radio ro , Ec. (3.203), se puede expresar como ∂f 3f (ro ) − − >0 ∂r ro ro ⇒ 3f (ro ) + f 0 (ro ) < 0. ro (3.205) Supongamos que la energı́a de la partı́cula es E > Vef (ro ), donde ro es el radio de la órbita circular estable. Entonces, los valores posibles de r ocurren en el intervalo entre rmin y rmax que contiene al radio ro . Consideremos una oscilación radial de pequeña amplitud η alrededor del radio de la órbita circular ro , tal que η/ro 1. r = ro + η. (3.206) 134 CAPÍTULO 3. FUERZAS CENTRALES Figura 3.23: Desviación η de una órbita circular de radio ro en un potencial efectivo Vef . Entonces, el potencial efectivo para este valor de r cercano a ro se obtiene mediante la expansión de Taylor de la función Vef (r) alrededor de ro , 0 > 1 ∂ 2 Vef ∂Vef Vef (r) = Vef (ro ) + (r − ro ) + (r − ro )2 + . . . 2 ∂r 2 ∂r ro ro (3.207) El primer término en la Ec. (3.207) es una constante, Vef (ro ) = cte, la cual puede ser suprimida del potencial efectivo, y el segundo término se anula en virtud de la Ec. (3.201). Luego, podemos escribir hasta segundo orden en el parámetro pequeño η, 1 ∂ 2 Vef 1 Vef (r) = (r − ro )2 + . . . ≈ Kη 2 , (3.208) 2 2 ∂r ro 2 donde hemos llamado K≡ ∂ 2 Vef = cte . ∂r2 ro (3.209) La fuerza efectiva correspondiente es fef (r) = − ∂Vef ∂ 2 Vef ≈− (r − ro ) = −Kη . ∂r ∂r2 ro (3.210) La ecuación de movimiento radial, Ec. (3.50), µr̈ = fef (r) (3.211) µη̈ = −Kη , (3.212) para r = ro + η resulta en puesto que r̈ = r̈0 + η̈ = η̈, (ro = cte). Esta ecuación corresponde a un oscilador armónico, η̈ + ωr2 η = 0 , (3.213) con frecuencia de oscilación radial ωr2 K 1 ∂ 2 Vef = = . µ µ ∂r2 r0 (3.214) 3.6. ESTABILIDAD DE ÓRBITAS CIRCULARES Y ÁNGULO DE PRECESIÓN 135 Figura 3.24: Oscilaciones radiales alredededor de una órbita circular de radio ro . Se denomina ángulo de precesión ∆θ al ángulo recorrido por la dirección del perihelio en el plano del movimiento durante un perı́odo de oscilación radial Tr . Luego, ∆θ = θ̇ Tr = 2π θ̇ , ωr (3.215) donde l (3.216) µr02 es la velocidad angular de la órbita circular. Sustituyendo en la Ec. (3.215), tenemos !−1/2 l 1 ∂ 2 Vef . (3.217) ∆θ = 2π 2 µr0 µ ∂r2 r0 θ̇ = La dirección del perihelio rmin cambia en un ángulo ∆θ durante la precesión de la órbita. La condición para que ocurra precesión es que ∆θ < 2π; es decir, θ̇ < ωr . Figura 3.25: Ángulo de precesión ∆θ durante un perı́odo de oscilación radial. Una órbita es cerrada si las coordenadas r y θ (módulo 2π) se repiten periódicamente. Para que una órbita sea cerrada, ésta debe ser finita, r ∈ [rmin , rmax ]. La órbita se cierra si m ∆θ = 2π , m, n, enteros; (3.218) n es decir, si ∆θ es una fracción racional de 2π. 136 CAPÍTULO 3. FUERZAS CENTRALES De la definición, Ec. (3.215), obtenemos la condición para que una órbita sea cerrada, θ̇ m = ωr n ⇒ nTr = mTθ ; (3.219) La órbita se cierra si el cociente θ̇/ωr es un número racional. Después de n perı́odos radiales (rmin → rmax → rmin ), el perihelio completa m revoluciones (m2π) y la órbita se cierra (se repite). Si θ̇/ωr es un número irracional, la órbita resultante se denomina cuasiperiódica y nunca se cierra. Recordemos que el ángulo θ en función de r puede calcularse mediante la Ec. (3.33), Z r dr l √ s + θ0 . (3.220) θ= 2µ r0 l2 2 r E − V (r) − 2µr2 El ángulo de precesión barrido por el perihelio durante un perı́odo de oscilación radial, rmin → rmax → rmin , corresponde a Z rmax dr 2l √ s ∆θ = . (3.221) 2µ rmin l2 2 r E− − V (r) 2µr2 El valor del ángulo de precesión ∆θ dado por la Ec. (3.221) depende de V (r). En particular, el hecho de que la órbita sea cerrada (i.e. ∆θ/2π es una fracción racional) depende de la forma del potencial central V (r). Teorema de Bertrand: Las únicas formas funcionales de potenciales centrales V (r) que producen órbitas cerradas son V (r) ∝ 1r (gravitacional) y V (r) ∝ r2 (oscilador armónico). Figura 3.26: Joseph Louis Francois Bertrand (1822-1900). Las órbitas elı́pticas en el potencial V (r) ∝ 1/r son cerradas y, como veremos, no precesan. La mayorı́a de las órbitas observadas en el Universo (sistemas planetarios, estrellas binarias, etc) son cerradas. Las pequeñas desviaciones detectadas de órbitas cerradas se pueden atribuir a la presencia de otros cuerpos. Por otro lado, las órbitas en el potencial V (r) ∝ r2 pueden exhibir precesión y formar figuras cerradas de Lissajous. 3.6. ESTABILIDAD DE ÓRBITAS CIRCULARES Y ÁNGULO DE PRECESIÓN 137 Ejemplos. 1. Determinar los valores del exponente n que producen órbitas circulares estables para la fuerza f (r) = −krn (k > 0). La condición de estabilidad Ec. (3.205) da −3kron−1 − nkron−1 < 0, ⇒ n > −3 . (3.222) En particular, la fuerza gravitacional (n = −2) y la fuerza de un resorte (n = 1) producen órbitas circulares estables. 2. Dibujar la órbita resultante si ∆θ = 2π/3. La Ec. (3.219) da m = 1 y n = 3; luego, la órbita se cierra después de 3 perı́odos de oscilación radial, Fig. (3.27). Figura 3.27: Órbita cerrada con ∆θ/2π = 1/3. 3. Calcular el ángulo de precesión ∆θ para oscilaciones radiales alrededor de una órbita circular de radio ro para una partı́cula en el potencial V (r) = g(r) − kr , donde g(r) es una función de r y k=cte. El potencial efectivo es Vef (r) = V (r) + l2 l2 k = g(r) − + , 2 2µr r 2µr2 (3.223) El radio ro satisface ∂Vef k l2 = g 0 (ro ) + 2 − 3 = 0 , ∂r ro ro µro (3.224) l2 = µ g 0 (ro )ro3 + kro . (3.225) de donde obtenemos La frecuencia radial es ωr2 1 ∂ 2 Vef 1 2k 3l2 00 = = g (ro ) − 3 + 4 . µ ∂r2 ro µ ro µr0 (3.226) 138 CAPÍTULO 3. FUERZAS CENTRALES Sustituyendo l2 , ωr2 = = 1 00 3 2k g (ro ) − 3 + 4 (g 0 (ro )ro3 + kro ) µ ro ro 1 3 k g 00 (ro ) + g 0 (ro ) + 3 . µ ro ro (3.227) La velocidad angular es θ̇ = 0 1/2 1 g (ro ) l k = . + µro2 µ ro ro3 (3.228) El ángulo de precesión es 1/2 g 0 (ro ) k + ro r03 = 2π 0 g (r ) k o 00 g (ro ) + 3 + 3 ro r0 1/2 0 2 g (ro )ro + k = 2π . g 00 (ro )ro3 + 3g 0 (ro )ro2 + k ∆θ = 2π θ̇ ωr ! (3.229) Notemos que si g = 0 (o constante); entonces ∆θ = 2π, i.e., no hay precesión. Esto significa que el potencial gravitacional V (r) = −k/r no produce precesión. Una órbita elı́ptica en el problema de Kepler no precesa (mantiene la dirección del perihelio constante). Si se observa precesión, debe existir alguna perturbación adicional al potencial V (r) = −k/r. En el sistema solar, la órbita del planeta Mercurio presenta una precesión de 4300 (segundos de arco) por siglo, cuya explicación, como una corrección a ese potencial, fue dada por Einstein usando la Teorı́a de Relatividad General. Figura 3.28: Precesión de la órbita del planeta Mercurio. 3.7. EL VECTOR DE LAPLACE-RUNGE-LENZ 3.7. 139 El vector de Laplace-Runge-Lenz Vimos que la órbita correspondiente al problema de Kepler con el potencial central V (r) = −k/r y la fuerza gravitacional f (r) = f (r)r̂, f (r) = −k/r2 , es una sección cónica, q = 1 + e cos θ, (3.230) r q 2 donde q = l2 /µk, e = 1 + 2El µk2 . Sustituyendo q, la Ec. (3.230) puede escribirse como rA cos θ = l2 − µkr, (3.231) A ≡ µke. (3.232) donde hemos definido La cantidad A puede expresarse como s p 2El2 = µ2 k 2 + 2µEl2 = cte. A = µk 1 + 2 µk (3.233) El lado izquierdo de la Ec. (3.231) se puede expresar como el producto escalar Ar cos θ = r · A, (3.234) donde A es un vector cuya magnitud es constante, dada por la Ec. (3.233), y su dirección debe estar en la dirección del perihelio. Si esa dirección yace sobre el eje x, entonces A = µke x̂. Figura 3.29: Ángulo entre r y la dirección fija de A (µ ≈ m, masa del planeta). Entonces, la ecuación de la cónica, Ec. (3.230), puede escribirse como r · A = l2 − µkr. (3.235) Para determinar el vector A, expresamos los términos del lado derecho de la Ec. (3.235) como l2 = l · l = l · (r × p) = r · (p × l), r r = r · r̂ = r · . r (3.236) (3.237) 140 CAPÍTULO 3. FUERZAS CENTRALES Sustituyendo en la Ec. (3.235), obtenemos r · A = r · [(p × l) − µkr̂] , (3.238) A ≡ p × l − µkr̂. (3.239) de donde podemos identificar El vector A se denomina vector de Laplace-Runge-Lenz y, como demostraremos, constituye otra cantidad conservada en el problema de Kepler. De la expresión de A se puede ver que A · l = 0, (3.240) puesto que l es perpendicular a p × l y a r. De la ortogonalidad entre A y l, se deriva que el vector A debe yacer sobre el plano del movimiento, el cual es perpendicular a la dirección de l. Consideremos la derivada total con respecto al tiempo del vector A, dA d dr̂ = (p × l) − µk . dt dt dt (3.241) 0 dp dl dp d (p × l) = ×l+p× = × (r × µv) , dt dt dt dt (3.242) Calculemos el primer término puesto que l es constante en un campo de fuerza central. Por otro lado, dp r = f (r) = f (r)r̂ = f (r) . dt r (3.243) f (r) dr d (p × l) = µ r× r× . dt r dt (3.244) Luego, Usando la identidad vectorial a × (b × c) = b(a · c) − c(a · b), tenemos d f (r) dr dr (p × l) = µ r r· − r2 . dt r dt dt (3.245) Esta expresión puede ser simplificada notando que d dr d dr (r · r) = 2r · = (r2 ) = 2r ; dt dt dt dt (3.246) d dr dr (p × l) = µf (r) r − r . dt dt dt (3.247) luego, Esta expresión puede simplicarse aún más si notamos que d r dr 1 r dr d r dr dr = − 2 ⇒ −r2 =r −r . dt r dt r r dt dt r dt dt (3.248) 3.7. EL VECTOR DE LAPLACE-RUNGE-LENZ 141 Luego, d d r . (3.249) (p × l) = −µf (r)r2 dt dt r Sustituyendo la fuerza gravitacional en el problema de Kepler, f (r) = −k/r2 , obtenemos d dr̂ d r = µk . (p × l) = µk (3.250) dt dt r dt Luego, la Ec. (3.241) da dA = 0, (3.251) dt lo cual implica que el vector de Laplace-Runge-Lenz es constante, A = p × l − µkr̂ = cte. (3.252) Figura 3.30: Vector de Laplace-Runge-Lenz en varias posiciones sobre una órbita Kepleriana. La magnitud del vector A (Ec. (3.233)) es dependiente de otras integrales del movimiento, l y E; pero la dirección de A, correspondiente a la dirección del perihelio, provee una nueva cantidad conservada en el problema de Kepler. La constancia de la dirección de A implica que una órbita en el potencial V (r) = −k/r no presenta precesión. Figura 3.31: Izquierda: Pierre-Simon Laplace (1749 -1827). Centro: Carl Runge (1856-1927). Derecha: Wilhem Lenz (1888-1957). El sistema de dos cuerpos sujetos a la fuerza gravitacional que varı́a como el inverso del cuadrado de la distancia constituye un sistema superintegrable, pues existen seis grados de libertad (tres para cada partı́cula) y siete cantidades conservadas: las tres componentes de la velocidad del centro de masa vcm , la dirección del momento angular l, su magnitud l, la energı́a E y la dirección del vector de Laplace-Runge-Lenz A. 142 3.8. CAPÍTULO 3. FUERZAS CENTRALES Dispersión en campo de fuerza central Dispersión (scattering) en un campo de fuerza central consiste en la desviación de la trayectoria de una partı́cula con E > 0 debida a la interacción en un potencial V (r), que puede ser atractivo o repulsivo. La partı́cula describe una trayectoria abierta desde r = ∞ hasta r = rmin y retorna a r = ∞, cambiando la dirección de su velocidad v. El ángulo entre la dirección de la velocidad inicial y la dirección de la velocidad final se denomina ángulo de dispersión χ. En el problema de Kepler, la trayectoria de una partı́cula con E > 0 describe una órbita hiperbólica. Ésta puede ser de dos tipos: 1) Potencial de Kepler atractivo, V (r) = − kr , correspondiente a la fuerza gravitacional entre dos partı́culas o a la fuerza de Coulomb entre cargas eléctricas de signo opuesto. Consideremos la ecuación de la órbita, Ec. (3.80), l2 00 dV (u + u) = − , µ du (3.253) donde u = 1/r. Para V = −ku, esta ecuación resulta en µk . l2 (3.254) u = uh + up , (3.255) u00 + u = Su solución tiene la forma donde uh es la solución de la ecuación homogénea u00h + uh = 0 (3.256) uh = A cos(θ − θ0 ) , (3.257) correspondiente a y up es la solución particular kµ . l2 (3.258) kµ 1 = 2 (1 + e cos θ) , r l (3.259) up = Luego, la solucion se puede expresar como u= con la condición θ = 0 → r = rmin y e = cte. Esta corresponde a la hipérbola q = 1 + e cos θ, r donde l2 q= , µk puesto que E > 0. s e= 1+ 2El2 > 1, µk 2 (3.260) (3.261) 3.8. DISPERSIÓN EN CAMPO DE FUERZA CENTRAL 143 De la Ec. (3.260) obtenemos q , para θ = 0 , (3.262) 1+e 1 π rmax → ∞ para cos θmax = − ⇒ θmax > . (3.263) e 2 El potencial atractivo produce una desviación de la trayectoria que encierra al foco. El ángulo de dispersión χ corresponde al ángulo entre las ası́ntotas: χ = 2θmax − π. rmin = Figura 3.32: Órbita hiperbólica para V (r) = −k/r. 2) Potencial de Kepler repulsivo V (r) = kr ; por ejemplo, correspondiente a la fuerza de Coulomb entre dos cargas eléctricas del mismo signo, f (r) = rk2 r̂. La ecuación de la órbita en este caso es kµ u00 + u = − 2 , (3.264) l y su solución es u = uh + up , donde uh es la solucion de la ecuación homogénea, Ec. (3.256), y up es la solución particular up = − kµ . l2 (3.265) Luego, se puede expresar µk 1 = 2 (e cos θ − 1) r l con la condición θ = 0 → r = rmin . Con q = µk l2 , esto es u= q = e cos θ − 1, r lo que corresponde a un hipérbola que no encierra al foco. De la Ec. (3.267) obtenemos q , para θ = 0 , rmin = e−1 1 π rmax → ∞ , para cos θmax = ⇒ θmax < . e 2 (3.266) (3.267) (3.268) (3.269) 144 CAPÍTULO 3. FUERZAS CENTRALES Figura 3.33: Órbita hiperbólica para V (r) = k/r. La órbita no tiene intersección con el eje y. El potencial repulsivo causa una desviación de la trayectoria hacia fuera del foco. El ángulo de dispersión es χ = π − 2θmax . Ángulo de dispersión y sección eficaz en un potencial central. Consideremos un potencial de interacción V (r) entre una partı́cula de masa M situada en el foco y una partı́cula con masa m M (µ ≈ m) incidente desde r → ∞ y que describe una órbita simétrica con respecto al perihelio (eje x). Asumimos que la energı́a inicial es E = 21 mv02 , donde v0 es la velocidad inicial de la partı́cula incidente. El ángulo de dispersión χ es el ángulo entre la dirección del vector velocidad inicial v0 y la dirección del vector velocidad final vf . Figura 3.34: Dispersión en un potencial repulsivo V (r). Se define el parámetro de impacto b como la distancia perpendicular entre la dirección de la velocidad inicial v0 de la partı́cula incidente y la ası́ntota adyacente. Los datos iniciales que se emplean generalmente en problemas de dispersión en campos centrales son b y E. De la Fig. (3.35), obtenemos la magnitud del momento angular, l = rp sin(π − α) = mv0 r sin α = mv0 b. (3.270) l2 = m2 v02 b2 = 2Emb2 . (3.271) Luego, 3.8. DISPERSIÓN EN CAMPO DE FUERZA CENTRAL 145 Figura 3.35: Parámetro de impacto. Notemos también que se puede expresar s r 2 2 2El 2Eb e= 1+ = 1 + . mk 2 k El ángulo θmax está dado por la integral Z rmax l θmax = √ 2m rmin Z = ∞ b rmin dr r l2 E − V (r) − 2mr2 dr r , 2 b V (r) − 2 r2 1 − E r (3.272) , (3.273) r2 (3.274) donde hemos sustituido l. Con el cambio de variable u = 1/r, la integral Ec. (3.274) se convierte en Z um du r θmax = b , (3.275) V (u) 0 2 2 −b u 1− E donde los nuevos lı́mites son u = 0 (r → ∞) y um = 1/rmin . Conociendo θmax , el ángulo de dispersión χ puede determinarse geométricamente. Generalmente se emplea un haz de partı́culas idénticas en experimentos de dispersión. Las diferentes partı́culas en el haz tienen distintos parámetros de impacto con respecto al centro de fuerza y, por lo tanto, son dispersadas con diferentes ángulos χ. Figura 3.36: Flujo de partı́culas incidentes sobre un blanco situado en f. Se define la intensidad del flujo I como el número de partı́culas incidentes por unidad de área y por unidad de tiempo, # part. I= . (3.276) A×t 146 CAPÍTULO 3. FUERZAS CENTRALES Las partı́culas en el haz incidente que poseen un mismo valor de b son dispersadas en un cono con vértice en el foco f y ángulo de vértice χ, puesto que el problema posee simetrı́a axial. Este cono encierra un ángulo sólido Ω. Figura 3.37: Dispersión en ángulo sólido dΩ. El diferencial de ángulo sólido dΩ es (Fig. (3.37)) dΩ = dA (2πr sin χ)(rdχ) = = 2π sin χdχ. r2 r2 (3.277) Sea n(Ω) el número partı́culas que son desviadas dentro del ángulo sólido Ω por unidad de tiempo. Se define la sección eficaz de dispersión σ(Ω) como la fracción de partı́culas incidentes que son desviadas dentro del ángulo sólido Ω por unidad de tiempo, σ(Ω) = n(Ω) . I (3.278) Note que la sección eficaz posee unidades de área. Luego, la expresión σ(Ω) dΩ = n(Ω) dΩ, I (3.279) corresponde a la fracción de partı́culas dispersadas por unidad de tiempo en dΩ; es decir, representa la probabilidad de dispersión en un diferencial de ángulo sólido dΩ. La conservación del número de partı́culas implica que el número de partı́culas incidentes en el anillo de radio b y ancho db por unidad de tiempo debe ser igual al número de partı́culas dispersadas en el diferencial de ángulo dΩ por unidad de tiempo, n(Ω)dΩ. Esto es, I2πb db = Iσ(Ω) dΩ, 2πb db = σ(Ω)2π sin χ dχ. (3.280) Luego, la sección eficaz σ(Ω) en función del ángulo de dispersión χ se puede expresar como 3.8. DISPERSIÓN EN CAMPO DE FUERZA CENTRAL σ(χ) = b sin χ db , dχ 147 (3.281) donde se toma el modulo de la derivada para garantizar que la candidad σ(χ) sea positiva, puesto que representa una probabilidad. Como un ejemplo, calculemos el ángulo de dispersión de una partı́cula incidente con energı́a E > 0 y parámetro de impacto b en un potencial central repulsivo V (r) = k/r. La integral Ec. (3.275) para este potencial es Z um du r θmax = b , (3.282) k 0 1 − u − b2 u 2 E Usando la integral Ec. (3.112), obtenemos um 2b2 E 1+ um u 2b2 E k −1 1 −1 1+ u . θmax = cos s 2 = cos e k 0 2bE 1+ k (3.283) 0 De la ecuación de una hipérbola en un potencial de Kepler repulsivo, Ec. (3.267), tenemos q rmin = , (3.284) e−1 l2 um = e − 1, (3.285) mk 2Eb2 ⇒ 1+ um = e. (3.286) k Luego, θmax ⇒ cos θmax :0 −1 (1) = cos − cos−1 = 1 1 =s e 1+ 2bE k 1 e 2 , (3.287) que es el mismo resultado que se obtiene directamente de la órbita hiperbólica correspondiente a un potencial de Kepler repulsivo, Ec. (3.269). Entonces, 2 2bE 1 = − 1 = tan2 θmax , 2 k cos θmax 2bE ⇒ tan θmax = . (3.288) k 148 CAPÍTULO 3. FUERZAS CENTRALES El ángulo de dispersión χ para un potencial de Kepler repulsivo es χ = π − 2θmax ⇒ θmax = π χ − . 2 2 (3.289) Luego, tan θmax = χ cos(χ/2) sin(π/2 − χ/2) . = = cot cos(π/2 − χ/2) sin(χ/2) 2 (3.290) Sustituyendo en Ec. (3.288), obtenemos cot χ 2 = 2bE , k (3.291) lo que permite expresar el ángulo de dispersión en función de datos iniciales b, E, y de la constante k del potencial V (r) = k/r. Consideremos los casos lı́mites: 1. b = 0 ⇒ cot χ2 = 0 ⇒ χ = π. Choque frontal; la partı́cula retrocede completamente. 2. b → ∞ ⇒ cot χ2 → ∞ ⇒ χ = 0. La partı́cula pasa muy lejos del centro repulsivo; no hay dispersión. Como una aplicación del cálculo de la sección eficaz de dispersión, Ec. (3.281), consideremos el experimento de Rutherford que condujo al descubrimiento del núcleo atómico. En este caso, tenemos un potencial de Coulomb repulsivo V (r) = qq 0 /r, donde el núcleo, que actúa como centro dispersor, tiene una carga q = +Ze (Rutherford empleó átomos de oro, Z = 79) y las partı́culas incidentes son partı́culas α (núcleos de helio), con carga q 0 = +2e, de modo que k = qq 0 = 2Ze2 , donde e es la carga del electrón. Figura 3.38: Experimento de Rutherford. De la Ec. (3.291), tenemos b= χ k cot , 2E 2 (3.292) luego, db = k csc2 χ . dχ 4E 2 (3.293) 3.8. DISPERSIÓN EN CAMPO DE FUERZA CENTRAL 149 Sustituyendo en la Ec. (3.281), encontramos la sección eficaz σ(χ) = = = 1 k k cot(χ/2) csc2 (χ/2) sin χ 2E 4E k 2 cot(χ/2) csc2 (χ/2) 8E 2 2 sin(χ/2) cos(χ/2) 2 χ 1 k . csc4 4 2E 2 (3.294) Figura 3.39: Sección eficaz de dispersión en función de χ en el experimento de Rutherford. Notemos que el valor de σ(χ) es grande para χ → 0; lo que indica que la mayorı́a de las partı́culas α pasan sin desviarse mucho. Sin embargo, para χ = π, σ(π) alcanza su valor mı́nimo no nulo; es decir, existe una probabilidad pequeña de observar partı́culas α dispersadas completamente hacia atrás. Estos comportamientos fueron observados por Rutherford, quien determinó experimentalmente la sección eficaz Ec. (3.294) que se deriva de un potencial central de Coulomb repulsivo V (r) = qq 0 /r. Este experimento demostró la existencia del núcleo atómico: la carga positiva del átomo está concentrada en una región muy pequeña comparada con el tamaño del átomo1 . Figura 3.40: Ernest Rutherford (1871-1937). 1 Una expresión similar para σ(χ) se obtiene en Mecánica Cuántica con el potencial V (r) = k/r. 150 3.9. CAPÍTULO 3. FUERZAS CENTRALES Problemas 1. La velocidad angular máxima de cierto satélite alrededor del Sol es cuatro veces su velocidad angular mı́nima. a) Encuentre la excentricidad de la órbita del satélite. b) Determine en cuánto debe disminuir su energı́a para caer en una órbita circular con el mismo momento angular que su órbita original. 2. Dos partı́culas se mueven una alrededor de la otra en órbitas circulares con perı́odo T , bajo la influencia de su mutua atracción gravitacional. Suponga que el movimiento de ambas partı́culas es detenido repentinamente en un instante dado, y que las partı́culas se dejan caer una hacia la otra. Encuentre el tiempo que tardan en chocar. 3. Una partı́cula de masa m se mueve sin fricción sobre la superficie z = r2 (coordenadas cilı́ndricas), donde z es la dirección vertical. a) Encuentre la condición de estabilidad de una órbita circular de radio ro sobre esta superficie. b) Encuentre la frecuencia de pequeñas oscilaciones radiales alrededor de esta órbita circular. 4. La sonda espacial Mariner IV fue diseñada para viajar de la Tierra a Marte en una órbita elı́ptica alrededor del sol, con perihelio igual al radio de la órbita terrestre, RT = 1UA, y afelio igual al radio de la órbita de Marte, RM = 1,5UA. Ambas órbitas pueden considerarse aproximadamente circulares. Desprecie los efectos gravitacionales de ambos planetas sobre el Mariner IV. a) ¿Cuántos meses tardó el Mariner IV en llegar a Marte?. b) Calcule con qué velocidad relativa a la Tierra debió ser lanzado el Mariner IV y con cuál dirección. 5. Un cometa de masa m se mueve en una trayectoria parabólica alrededor del sol y cruza la órbita terrestre. Suponga que la órbita terrestre es circular y que está en el mismo plano que la trayectoria del cometa. Encuentre el máximo número de dı́as que el cometa puede permanecer dentro de la órbita de la Tierra. 6. Una partı́cula se mueve en el potencial V (r) = b a + 2. r r a) Determine la órbita de la partı́cula. b) Dibuje esquemáticamente el potencial efectivo para este sistema. 7. Una partı́cula con momento angular l describe la órbita r = a(1 + cos θ). a) Encuentre la fuerza central que produce esta órbita. b) Calcule el perı́odo de esta órbita. c) Determine la energı́a mı́nima que debe tener la partı́cula para escapar de esta órbita. 8. Encuentre la relación entre la distancia radial y el tiempo para un asteroide con energı́a igual a cero, sujeto a la atracción solar. 3.9. PROBLEMAS 151 9. Una partı́cula de masa m se mueve en el potencial de Yukawa V (r) = − k −r/a e , r donde k > 0 y a > 0 son constantes. a) Encuentre la condición de estabilidad de una órbita circular de radio ro . b) Determine el perı́odo de pequeñas oscilaciones radiales alrededor de esta órbita circular. 10. Un planeta de masa m gira alrededor de una estrella de masa M . La estrella está rodeada por un plasma de densidad uniforme ρ, que alcanza a envolver la órbita del planeta. a) Calcule el perı́odo de una órbita circular estable de radio r = ro para el planeta. b) Calcule el momento angular de esta órbita circular. c) Encuentre el ángulo de precesión, si la órbita circular es ligeramente perturbada. 11. Una partı́cula describe la órbita r = aθ2 , con a = constante. Encuentre la fuerza que causa esta órbita. 12. Se observa que un cometa está a 108 km del Sol y se mueve con una velocidad de 50,9 km/s que forma un ángulo de 45o con el radio vector dirigido desde el Sol. a) Determine los parámetros e y q de la órbita del cometa. b) Calcule el ángulo al cual fue observado el cometa. c) Calcule el perı́odo del cometa. 13. Una partı́cula se mueve en el potencial V (r) = a/rp +b/rq , donde a y b son constantes. a) Encuentre los valores de p y q que producen la órbita r = kθ2 , con k constante. b) Encuentre los valores de las constantes a y b en ese caso. c) Determine y dibuje el potencial efectivo para esta órbita. 14. Un satélite se encuentra en una órbita circular de radio ro alrededor de la Tierra. En un instante dado, los cohetes propulsores incrementan la velocidad tangencial del satélite en un 20 %. a) Calcule la excentricidad de la órbita resultante. b) Calcule el apogeo de la órbita resultante del satélite. 15. Una partı́cula de masa m gira en un cı́rculo de radio a, sometida a la fuerza central f (r) = −kr (oscilador armónico esférico). a) Encuentre la frecuencia de pequeñas oscilaciones radiales alrededor de la órbita circular, si ésta es ligeramente perturbada. b) Calcule el ángulo de precesión durante una oscilación radial. 16. Dos partı́culas con masas m1 y m2 se sueltan en reposo cuando están separadas por una distancia R. Calcule las velocidades de las partı́culas cuando la separación entre ellas es r. 152 CAPÍTULO 3. FUERZAS CENTRALES 17. El perihelio de un asteroide es la mitad del radio de la órbita terrestre alrededor del Sol (supuesta circular), y su velocidad en el perihelio es el doble de la velocidad orbital de la Tierra. Suponga que la órbita de la Tierra se encuentra en el mismo plano que la órbita del asteroide. Ignore los efectos de la Tierra y otros planetas sobre el asteroide. a) Encuentre la velocidad del asteroide cuando éste cruza la órbita terrestre. b) Determine si el asteroide escapa del sistema solar. 18. Imagine una “escalera espacial“ que consiste en satélite terrestre formado por una larga varilla uniforme alineada a lo largo de la dirección radial desde el centro de la Tierra y colocada en órbita estacionaria ecuatorial. El extremo inferior de la varilla alcanza a tocar la superficie de la Tierra. Calcule la longitud de la varilla en km. 19. La trayectoria de una partı́cula con momento angular l en un campo central se puede describir por r = a cos θ. a) Encuentre el potencial asociado a esta trayectoria. b) Si la partı́cula se encuentra a una distancia a del centro de atracción, calcule el tiempo que la partı́cula tarda en caer al centro. c) Determine la energı́a total de la partı́cula. 20. Una partı́cula describe una órbita circular bajo la influencia de una fuerza central atractiva f (r) = −k/rn , dirigida hacia un punto fijo en el cı́rculo. a) Demuestre que la fuerza debe variar como el inverso de la quinta potencia de la distancia, es decir, n = 5. b) Demuestre que la energı́a total de la partı́cula es cero. c) Encuentre el perı́odo del movimiento. 21. Una partı́cula se mueve en una órbita dada por r = R e−αθ , donde R y α son constantes. a) Encuentre la fuerza que causa esta órbita. b) Si la partı́cula se encuentra inicialmente a una distancia R del centro de atracción, calcule el tiempo que tarda en caer al centro. c) ¿Cuántas revoluciones completa la partı́cula hasta alcanzar el centro?. 22. La Tierra se mueve en una órbita casi circular de radio 1.5 × 108 km alrededor del Sol con una velocidad de 30 km/s. Se observa que la velocidad de un cometa alrededor del Sol es 50 km/s en su perihelio y 10 km/s en su afelio. a) Calcule la distancia del afelio para el cometa. b) Calcule el perı́odo del cometa alrededor del Sol. 3.9. PROBLEMAS 153 23. Una partı́cula de masa m y momento angular l se mueve en el potencial V = −k/r2 . a) Encuentre la condición para que la partı́cula caiga al centro de atracción. b) Determine la órbita descrita por la partı́cula para alcanzar el centro. 24. Considere el movimiento de una partı́cula de masa m en el potencial V = kr1/2 . a) Encuentre el potencial efectivo para esta partı́cula. b) Encuentre la relación entre el perı́odo y el radio ro de una órbita circular. 25. Un cometa de masa MT /8 y velocidad −5vT tiene una colisión completamente inelástica con la Tierra (i.e., el cometa y la Tierra quedan unidos después de la colisión), donde MT y vT son la masa y la velocidad orbital de la Tierra, respectivamente. La órbita terrestre puede asumirse circular alrededor del Sol con un radio R. a) Calcule el afelio y el perihelio de la órbita de la Tierra después de la colisión. b) ¿Cuántos dı́as dura un año terrestre después de la colisión? 26. Determine la órbita de una √ partı́cula de masa m que incide con parámetro de impacto √ b 2 y momento angular k/b sobre un punto que ejerce una fuerza central atractiva f (r) = −k/r5 . 27. Calcule el ángulo de precesión del perihelio de una partı́cula con momento angular l y masa m moviéndose alrededor de una estrella de masa M que produce el potencial GM m V (r) = − + 2 , donde es una constante muy pequeña. r r 28. Calcule la sección eficaz σ(χ) para dispersión de partı́culas con velocidad vo en el potencial V (r) = k/r2 . 29. La sección eficaz total de dispersión σT se define como Z Z π σT = σ(Ω)dΩ = 2π σ(χ)dχ, 0 donde χ es el ángulo de dispersión. Calcule σT para partı́culas con energı́a E en el potencial ( k k − , r < a. V (r) = r a 0, r > a. 30. Una partı́cula con masa m y velocidad vo incide en el potencial atractivo V (r) = −k/rn , donde n > 2. a) Determine el máximo parámetro de impacto para que la partı́cula caiga al centro de atracción. b) Calcule la sección eficaz total de dispersión para que la partı́cula caiga al centro. 154 CAPÍTULO 3. FUERZAS CENTRALES Capı́tulo 4 Oscilaciones pequeñas 4.1. Oscilaciones en una dimensión Consideremos un sistema con un grado de libertad, o reducible a un problema unidimensional co coordenada q. La energı́a total se puede expresar como E= 1 2 aq̇ + Vef (q) , 2 (4.1) donde a representa parámetros constantes del sistema, como la masa de la partı́cula, etc, y Vef (q) corresponde a un potencial efectivo. El Lagrangiano correspondiente es L= 1 2 aq̇ − Vef (q) , 2 (4.2) La ecuación de movimiento para q, obtenida del Lagrangiano, se puede escribir como aq̈ = fef (q) , (4.3) donde la fuerza efectiva fef (q) es fef (q) = − ∂Vef . ∂q La posición de equilibrio q0 de la coordenada q está dada por la condición ∂Vef fef (q0 ) = 0 ⇒ = 0. ∂q q0 (4.4) (4.5) El equilibrio es estable si Vef (q0 ) corresponde a un mı́mino del potencial efectivo Vef (q); es decir, ∂Vef2 > 0. (4.6) ∂q 2 q0 155 156 CAPÍTULO 4. OSCILACIONES PEQUEÑAS Figura 4.1: Pequeño desplazamiento η alrededor de la posición de equilibrio estable q0 . Consideremos un desplazamiento pequeño η alrededor de un punto de equilibrio estable q0 , η q = q0 + η, con 1. (4.7) q0 El valor del potencial Vef (q) = Vef (q0 + η) cerca del punto de equilibrio q0 se puede obtener mediante una expansión de Taylor de Vef (q) alrededor de q = q0 , 0 > ∂Vef 1 ∂ 2 Vef Vef (q) = Vef (q0 + η) = V (q0 ) + η + η2 + · · · , 2 ∂q 2 ∂q q q 0 0 (4.8) donde Vef (q0 ) es un valor constante y el segundo término se anula debido a la condición de equilibrio Eq. (4.5). Luego, despreciando términos muy pequeños en potencias de η de orden superior al cuadrático, se puede escribir el potencial cerca del punto de equilibrio Vef (q) = Vef (q0 + η) = 1 Kη 2 , 2 donde η = q − q0 es el desplazamiento desde el equilibrio y ∂ 2 Vef K≡ = constante > 0 . ∂q 2 q0 (4.9) (4.10) Luego, cerca del valor de equilibrio q0 , el potencial corresponde al de un oscilador armónico. La ecuación de movimiento para η se obtiene sustituyendo q = q0 + η en la Ec. (4.3), aη̈ = aη̈ = ∂Vef ∂η ∂Vef (q0 + η) = − ∂q ∂η ∂q −Kη. − (4.11) Entonces, la ecuación de movimiento para el pequeño desplazamiento η es η̈ + ω 2 η = 0, (4.12) 4.1. OSCILACIONES EN UNA DIMENSIÓN donde K 1 ∂ 2 Vef ω ≡ = a a ∂q 2 q0 2 157 (4.13) es la frecuencia angular de las pequeñas oscilaciones alrededor de q0 . La Eq. (4.12) tiene solución η(t) = c1 cos ωt + c2 sin ωt = A cos(ωt + ϕ), (4.14) donde A es la amplitud de las oscilaciones y ϕ es la fase. En general, se emplea la notación compleja ei(ωt+ϕ) = cos(ωt + ϕ) + i sin(ωt + ϕ). (4.15) Luego, η(t) = Re[Aei(ωt+ϕ) ] = Re(aeiωt ), donde a = Ae iϕ (4.16) es la amplitud compleja. Se acostumbra escribir simplemente η(t) = aeiωt , (4.17) sobreentendiéndose que se toma la parte real de esta expresión para η. Las soluciones de ecuaciones de movimiento para sistemas oscilatorios escritas en forma compleja son convenientes porque la expresión eix no cambia su forma bajo integración o diferenciación. Ejemplo. 1. Encontrar la frecuencia de pequeñas oscilaciones alrededor de un radio de equilibrio r0 para una partı́cula de masa m moviéndose sobre un cono vertical con ángulo de vértice α. Figura 4.2: Pequeñas oscilaciones alrededor de radio r0 para una partı́cula sobre un cono. El Lagrangiano de este sistema fue calculado en los capı́tulos anteriores. La energı́a cinética es 1 1 T = m(ẋ2 + ẏ 2 + ż 2 ) = m(ṙ2 csc2 α + r2 θ̇2 ) . (4.18) 2 2 158 CAPÍTULO 4. OSCILACIONES PEQUEÑAS La energı́a potencial es V = mgz = mgr cot α . (4.19) El Lagrangiano es L=T −V = 1 m(ṙ2 csc2 α + r2 θ̇2 ) − mgr cot α . 2 La ecuación de movimiento para θ es ∂L d ∂L − = 0. dt ∂ θ̇ ∂θ (4.20) (4.21) El ángulo θ es una coordenada cı́clica, ∂L =0 ∂θ ⇒ ∂L = mr2 θ̇ = lz = cte. ∂ θ̇ (4.22) La ecuación para r es d dt ∂L ∂ ṙ − ∂L = 0, ∂r (4.23) la cual resulta en mr̈ csc2 α − mrθ̇2 + mg cot α = 0 . Sustituyendo θ̇ = (4.24) lz , podemos expresar la Ec. (4.24) como mr2 mr̈ = lz2 sin2 α − mg sin α cos α , mr3 (4.25) la cual tiene la forma de un problema unidimensional Ec. (4.3), con m = a, y donde podemos identificar la fuerza efectiva fef (r) = − ∂Vef l2 = z 3 sin2 α − mg sin α cos α . ∂r mr (4.26) La posición de equilibrio ro está dada por ∂Vef fef (r0 ) = − =0 ∂r r0 cos α lz2 =g 3 2 m r0 sin α 2 l tan α ⇒ r03 = z 2 . m g ⇒ (4.27) (4.28) (4.29) El potencial efectivo es Vef (r) = lz2 sin2 α + mgr sin α cos α , 2mr2 (4.30) 4.2. OSCILACIONES DE SISTEMAS CON VARIOS GRADOS DE LIBERTAD 159 luego, 3lz2 sin2 α ∂ 2 Vef 3mg = = sin α cos α ≡ K . ∂r2 r0 mr04 r0 La frecuencia angular para pequeñas oscilaciones alrededor de r0 es 3g K 1 ∂ 2 Vef 2 = ω = = sin α cos α, 2 m m ∂r r0 r0 (4.31) (4.32) y el movimiento de la pequeña oscilación η = r − r0 se puede expresar en la forma de la Ec. (4.12). 4.2. Oscilaciones de sistemas con varios grados de libertad Consideremos un sistema con s grados de libertad {qi : i = 1, . . . , s} cuya energı́a potencial es V (q1 , . . . , qs ). La configuración de equilibrio de este sistema corresponde a un conjunto de valores {q0i : i = 1, . . . , s}; donde los q0i están dados dados por las s condiciones ∂V = 0, i = 1, 2, . . . , s. (4.33) ∂qi q0i La configuración de equilibrio {q0i } = (q01 , . . . , q0s ) es estable si los valores q0i , ∀i, corresponden a un mı́nimo de V (q1 , q2 , . . . , qs ): ∂ 2 V > 0. (4.34) ∂qi2 q0i Figura 4.3: Potencial V (q1 , q2 ), mostrando las posiciones de equilibrio (q01 , q02 ). 160 CAPÍTULO 4. OSCILACIONES PEQUEÑAS Consideremos pequeñas oscilaciones alrededor de las posiciones de equilibrio estable q0i . La pequeña desviación del equilibrio correspondiente a la coordenada qi la denotaremos por ηi , ηi 1. (4.35) qi = q0i + ηi , con q0i El valor del potencial V (q1 , . . . , qs ) cerca de la configuración de equilibrio se puede obtener mediante la expansión de Taylor en varias variables de V (q1 , . . . , qs ) alrededor de {q0i }, con qi = q0i + ηi , * 0 1 X X ∂2V X ∂V ηi + ηi ηj + · · · , V (q1 , . . . , qs ) = V (q01 , . . . , q0s ) + ∂q 2 i j ∂qi ∂qj {q0i } i i {q0i } (4.36) donde V (q01 , . . . , q0s ) es un valor constante y las derivadas parciales están evaluadas en {q0i } = (q01 , . . . , q0s ). Luego, cerca de la configuración de equilibrio qi = q0i + ηi , el potencial se puede expresar como V (q1 , . . . , qs ) = V (η1 , . . . , ηs ) = 1X Vij ηi ηj , 2 i,j (4.37) donde definimos los coeficientes Vij ≡ ∂2V ∂qi ∂qj . (4.38) {q0i } Estos coeficientes son simétricos, i.e., Vij = Vji , y dependen de propiedades locales del potencial cerca de la configuración de equilibrio y, por tanto, son caracterı́sticos de cada sistema. La energı́a cinética del sistema cerca de la configuración de equilibrio también puede expresarse en función de los pequeños desplazamientos ηi , T = 0 0 1X 1X > + η̇i )(q̇0j > + η̇j ) , Tij q̇i q̇j = Tij ( q̇0i 2 i,j 2 i,j (4.39) (los valores q0i son constantes). Luego, T = 1X Tij η̇i η̇j , 2 i,j (4.40) donde los coeficientes Tij = Tji representan parámetros constantes que dependen de propiedades del sistema (masas, longitudes, etc.). El Lagrangiano del sistema cerca de la configuración de equilibrio es L=T −V = 1X (Tij η̇i η̇j − Vij ηi ηj ) 2 i,j i, j = 1, 2, . . . , s. (4.41) 4.2. OSCILACIONES DE SISTEMAS CON VARIOS GRADOS DE LIBERTAD La ecuación de movimiento para una pequeña desviación del equilibrio ηk es d ∂L ∂L − = 0. dt ∂ η̇k ∂ηk 161 (4.42) Evaluamos los términos ∂L ∂ η̇k = ∂L ∂ηk = − 1X 2 i,j X X X 1 Tkj η̇j + Tik η̇i = Tkj η̇j , Tij (δik η̇j + δjk η̇i ) = 2 j i j X 1X (Vij δik ηj + Vij δjk ηi ) = − Vkj ηj . 2 i,j j Luego, la ecuación de movimiento Ec. (4.42) para la desviación ηk queda X (Tkj η̈j + Vkj ηj ) = 0 , (4.43) j donde cada término de la suma tiene la forma de una ecuación para un oscilador armónico. Existen s ecuaciones de movimiento de este tipo para el sistema, k = 1, 2, . . . , s. La solución de la Ec. (4.43) tiene la forma ηj (t) = aj eiωt , (4.44) donde ω es la frecuencia del movimiento oscilatorio. Sustituyendo en la Ec. (4.43), junto con η̈j = −ω 2 aj eiωt , obtenemos X (−ω 2 Tkj + Vkj )aj eiωt = 0 j ⇒ X (Vij − ω 2 Tij )aj = 0 , (4.45) j donde hemos renombrado el ı́ndice k → i. El conjunto de ecuaciones Ec. (4.45) para los grados de libertad i = 1, 2, . . . , s constituye un sistema de s ecuaciones lineales homogéneas para los coeficientes aj , con j = 1, 2, . . . , s. Como ejemplo, consideremos el sistema Ec. (4.45) con s = 2, i = 1 : (V11 − ω 2 T11 )a1 + (V12 − ω 2 T12 )a2 = 0 i = 2 : (V21 − ω 2 T21 )a1 + (V22 − ω 2 T22 )a2 = 0. (4.46) En general, existe solución no trivial ηj (t) 6= 0 si aj 6= 0, ∀j. Esta condición se cumple para los coeficientes a1 , . . . , as en el sistema Ec. (4.45) si el determinante de estos coeficientes es cero: 162 CAPÍTULO 4. OSCILACIONES PEQUEÑAS det Vij − ω 2 Tij = 0 . (4.47) La condición Ec. (4.47) constituye una ecuación algebraica de grado s para ω 2 , que se denomina ecuación caracterı́stica. Las s raı́ces de la ecuación caracterı́stica dan como resultado s valores para las frecuencias ω 2 , llamadas frecuencias caracterı́sticas del sistema, que corresponden a s diferentes modos de oscilación del sistema alrededor de su configuración de equilibrio. Las frecuencias caracterı́sticas ω deben ser reales para que las soluciones tengan sentido fı́sico. Si alguna ω es compleja, entonces se puede escribir como ω = a + bi y, por lo tanto, eiωt = eiat e−bt . Como consecuencia, la solución η(t) ∝ e−bt crece o decrece en el tiempo y la energı́a no se conservarı́a, E ∝ e−bt . Ejemplos. 1. Encontrar las frecuencias de un sistema de dos partı́culas de masa m conectadas mediante resortes horizontales, cada uno con constante k y longitud en reposo l. El sistema posee dos grados de libertad (s = 2). Consideremos pequeños desplazamientos del equilibrio η1 y η2 , con xi = x0i + ηi , como se muestra en la Fig. (4.4). Figura 4.4: Oscilaciones de dos partı́culas conectadas mediante resortes horizontales. La energı́a cinética en función de los pequeños desplazamientos del equilibrio es T = 1 1 1X mη̇12 + mη̇22 = Tij η̇i η̇j 2 2 2 i,j (4.48) donde identificamos los coeficientes T11 = m, T22 = m, T12 = T21 = 0. (4.49) La energı́a potencial del sistema en términos de los pequeños desplazamientos del equilibrio es V = 1 2 1 0 1 1 kη + k(l − l)2 + kη22 = k[η12 + (η2 − η1 )2 + η22 ] , 2 1 2 2 2 (4.50) 4.2. OSCILACIONES DE SISTEMAS CON VARIOS GRADOS DE LIBERTAD 163 donde hemos usado la siguiente relación, observando la Fig. (4.4), l0 − l = (x2 − x1 ) − (x02 − x01 ) = η2 − η1 . (4.51) Luego, V = 1 1X [2kη12 + 2kη22 − 2kη1 η2 ] = Vij ηi ηj , 2 2 i,j (4.52) donde podemos identificar los los coeficientes V11 = 2k, V22 = 2k, V12 = V21 = −k. La condición Ec. (4.47) para este sistema es V11 − ω 2 T11 V12 − ω 2 T12 V21 − ω 2 T21 V22 − ω 2 T22 Sustituyendo los coeficientes Tij y Vij , tenemos 2k − ω 2 m −k −k 2k − ω 2 m = 0. = 0. (4.53) (4.54) (4.55) La ecuación caracterı́stica resultante es (2k − ω 2 m)2 − k 2 = 0, (4.56) 2k − ω 2 m = ±k, 2k ± k . ⇒ ω2 = m (4.57) (4.58) Luego, r ω1 = 3k , m r ω2 = k . m (4.59) 2. Encontrar las frecuencias para pequeñas oscilaciones de un péndulo doble. Figura 4.5: Péndulo doble. Las energı́as cinética y potencial de este sistema fueron calculadas en el Cap. 1 en términos de las coordenadas generalizadas θ1 y θ2 , T = 1 1 (m1 + m2 )l12 θ̇12 + m2 l22 θ̇22 + m2 l1 l2 θ̇1 θ̇2 cos(θ1 − θ2 ) , 2 2 (4.60) 164 CAPÍTULO 4. OSCILACIONES PEQUEÑAS V = −(m1 + m2 )gl1 cos θ1 − m2 gl2 cos θ2 . Las posiciones de equilibrio están dadas por ∂V ∂V = 0, =0 ⇒ ∂θ1 θ01 ∂θ2 θ02 θ01 = 0, (4.61) θ02 = 0. (4.62) La energı́a potencial es mı́nima para estos valores de las coordenadas en el equilibrio. Consideremos pequeñas oscilaciones alrededor de la configuración de equilibrio, θ1 = θ01 + η1 = η1 , θ2 = θ02 + η2 = η2 , (4.63) donde η1 y η2 son pequeños. Luego, cerca del equilibrio, cos θ1 = cos η1 ' 1 − η12 , 2 η22 , 2 (4.64) 1 2 (η1 − η2 ) . 2 (4.65) cos θ2 = cos η2 ' 1 − cos(θ1 − θ2 ) = cos(η1 − η2 ) ' 1 − Manteniendo términos hasta segundo orden, obtenemos T = 1 1 (m1 + m2 )l12 η̇12 + m2 l22 η̇22 + m2 l1 l2 η̇1 η̇2 , 2 2 (4.66) 1 1 (m1 + m2 )gl1 η12 + m2 gl2 η22 , 2 2 (4.67) V = donde se han suprimido términos constantes en V . Comparando con las formas generales cerca del equilibrio, T = 1X Tij η̇i η̇j , 2 i,j V = 1X Vij η1 ηj , 2 i,j (4.68) obtenemos los coeficientes T11 = (m1 + m2 )l12 , T22 = m2 l22 , T12 = T21 = m2 l1 l2 , V11 = (m1 + m2 )gl1 , V22 = m2 gl2 , V12 = V21 = 0. (4.69) Los coeficientes Vij también pueden obtenerse directamente como V11 = V22 V12 = ∂2V ∂θ12 ∂2V ∂θ22 = V21 = = (m1 + m2 )gl1 , (4.70) = m2 gl2 , (4.71) (θ01 ,θ02 ) (θ01 ,θ02 ) 2 ∂ V ∂θ1 ∂θ2 = 0. (θ01 ,θ02 ) (4.72) 4.3. MODOS NORMALES 165 La condición Ec. (4.47) para estos coeficientes es V11 − ω 2 T11 −ω 2 T12 −ω 2 T21 V22 − ω 2 T22 = 0. (4.73) La ecuación caracterı́stica es 2 (V11 − ω 2 T11 )(V22 − ω 2 T22 ) − (ω 2 )2 T12 = 0. (4.74) Con el cambio de notación ω 2 ≡ x, tenemos la ecuación cuadrática 2 V11 V22 − (T11 V22 + T22 V11 )x + (T11 T22 − T12 )x2 = 0, (4.75) cuya solución es x= (T11 V22 + T22 V11 ) ± p (T11 V22 + T22 V11 )2 − 4(T11 T22 − T12 )V11 V22 . (4.76) 2(T11 T22 − T12 )2 Sustituimos los términos T11 V22 − T22 V11 = (m1 + m2 )m2 gl12 l2 − (m1 + m2 )m2 gl1 l22 = (m1 + m2 )m2 gl1 l2 (l1 − l2 ), 2 T12 = (m1 + m2 )m2 l12 l22 − m22 l12 l22 = m1 m2 l12 l22 , V11 V22 = (m1 + m2 )m2 g 2 l1 l2 , T11 T22 − y obtenemos, i h p g (m1 + m2 )(l1 + l2 ) ± (m1 + m2 )[(m1 + m2 )(l1 + l2 )2 − 4m1 l1 l2 ] . 2m1 l1 l2 (4.77) En el caso m1 m2 , las frecuencias tienden a los valores correspondientes a oscilaciones independientes de dos péndulos simples, 2 ω1,2 = 2 ω1,2 = ⇒ 4.3. g [m1 (l1 + l2 ) ± m1 (l1 − l2 )] 2m1 l1 l2 g g ω22 = . ω12 = , l1 l2 (4.78) (4.79) Modos normales Hemos visto que las s ecuaciones de movimiento para un sistema con s grados de libertad que realiza pequeñas oscilaciones {η1 , η2 , . . . , ηs } alrededor de los valores de equilibrio de sus coordenadas generalizadas {q01 , q02 , . . . , q0s } son X (Tij η̈j + Vij ηj ) = 0, i = 1, 2, . . . , s. (4.80) j 166 CAPÍTULO 4. OSCILACIONES PEQUEÑAS La solución particular de la forma ηj (t) = aj eiωt conduce a las s ecuaciones X (Vij − ω 2 Tij )aj = 0 i = 1, 2, . . . , s. (4.81) j La condición Ec. (4.47) det Vij − ω 2 Tij = 0 , (4.82) implica la existencia de soluciones no triviales aj 6= 0, ∀j, y permite calcular las s frecuencias de las pequeñas oscilaciones mediante las soluciones del polinomio caracterı́stico resultante de la Ec. (4.47). Denotamos estas frecuencias por wk , k = 1, 2, . . . , s. Para cada ωk , existe una solución ηj (t) = aj (ωk )eiωk t y, por lo tanto, existe un sistema de s ecuaciones del tipo Ec. (4.81) para los coeficientes aj (ωk ). Puesto que las frecuencias ωk son reales, los coeficientes aj (ωk ) también deben ser reales. Por ejemplo, para s = 2, i=1: i=2: (V11 − ωk2 T11 )a1 + (V12 − ωk2 T12 )a2 = 0 (V21 − ωk2 T21 )a1 + (V22 − ωk2 T22 )a1 = 0 . (4.83) Hay 2 ecuaciones para cada ωk , (k = 1, 2). Sustitución de una ωk da 2 ecuaciones lineales para a1 (ωk ) y a2 (ωk ) que permiten obtener las amplitudes relativas a1 (ωk )/a2 (ωk ). La solución general de la ecuación de movimiento para el pequeño desplazamiento ηj (t) consiste en la superposición de las soluciones particulares correspondientes a cada ωk , X ηj (t) = ck aj (ωk )eiωk t , (4.84) k donde ck son coeficientes que representan la fase compleja. Cabe recordar que se debe tomar la parte real para tener las soluciones oscilatorias fı́sicas. Definimos las coordenadas o modos normales del sistema como ξk ≡ ck eiωk t , k = 1, 2, . . . , s. (4.85) aj (ωk )ξk , (4.86) Luego, se puede escribir ηj (t) = X k es decir, la solución general es una combinación lineal de las coordenadas normales. En el caso de s = 2, las soluciones generales para los pequeños desplazamientos son η1 = a1 (ω1 )ξ1 + a1 (ω2 )ξ2 , η2 = a2 (ω1 )ξ1 + a2 (ω2 )ξ2 . (4.87) Cada coordenada normal ξk satisface la ecuación ξ¨k + ωk2 ξk = 0 , (4.88) que corresponde a un oscilador armónico simple. Luego, cada ξk describe una oscilación global del sistema con una sola frecuencia ωk : todas las partı́culas oscilan con la misma 4.3. MODOS NORMALES 167 frecuencia ωk , pero con amplitudes aj (ωk ) que pueden ser distintas entre sı́. Por ejemplo, para el modo normal ξ2 , con s = 2, tenemos η1 = a1 (ω2 )ξ2 , η2 = a2 (ω2 )ξ2 ; (4.89) es decir, cada uno de los 2 grados de libertad oscila con la frecuencia ω2 alrededor de su posición de equilibrio, pero con amplitudes respectivas a1 (ω2 ) y a2 (ω2 ). En general, la configuración de un modo normal ξk está dada por las amplitudes relativas correspondientes a ese modo; es decir, por los cocientes de las amplitudes ai (ωk )/aj (ωk ). En sistemas que presentan oscilaciones pequeñas con varios grados de libertad, la frecuencia mayor corresponde al modo normal con amplitudes en fases opuestas. Ejemplos. 1. Encontrar las frecuencias y la configuración de los modos normales de vibración en un modelo de la molécula lineal CO2 . Figura 4.6: Modelo de la molécula triatómica lineal CO2 . M es la masa del átomo C; m es masa de los átomos O; l es la separación entre las posiciones de equilibrio de los átomos; la constante k describe la interacción C-O como un resorte; l1 , l2 , miden las distancias entre los átomos fuera del equilibrio. Sean x01 , x02 , x03 las posiciones de equilibrio de las tres partı́culas, respectivamente. Consideremos pequeños desplazamientos del equilibrio, ηi = xi − x0i , i = 1, 2, 3. (4.90) La energı́a cinética es T = = 1 mẋ21 + 2 1 mη̇ 2 + 2 1 1 1 M ẋ22 + mẋ23 2 2 1 1 M η̇22 + mη̇32 . 2 2 (4.91) 168 CAPÍTULO 4. OSCILACIONES PEQUEÑAS La energı́a potencial es V = 1 1 k(l1 − l)2 + k(l2 − l)2 , 2 2 (4.92) donde l1 − l = (x2 − x1 ) − (x02 − x01 ) = η2 − η1 , (4.93) l2 − l = (x3 − x2 ) − (x03 − x02 ) = η3 − η2 . (4.94) Luego, V = = 1 1 k(η2 − η1 )2 + k(η3 − η2 )2 2 2 1 k(η12 + 2η22 + η32 − 2η1 η2 − 2η2 η3 ). 2 (4.95) Comparando con las formas generales cerca del equilibrio, 1X 1X T = Tij η̇i η̇j , V = Vij ηi ηj , 2 i,j 2 i,j (4.96) identificamos los coeficientes Tij , T11 = m T21 = 0 T31 = 0 T12 = 0 T22 = M T32 = 0 T13 = 0 T23 = 0 T33 = m, (4.97) V11 = k V21 = −k V31 = 0 V12 = −k V22 = 2k V32 = −k V13 = 0 V23 = −k V33 = k. (4.98) y los coeficientes Vij , Las frecuencias están dadas por la condición det |Vij − ω 2 Tij | = 0; es decir, k − ω2 m −k 0 2 = 0, M −k −k 2k − ω (4.99) 0 −k k − ω2 m la cual conduce a la siguiente ecuación caracterı́stica cúbica para ω 2 , (k − ω 2 m) (2k − ω 2 M )(k − ω 2 m) − k 2 − k 2 (k − ω 2 m) = 0 ⇒ ω 2 (k − ω 2 m) k(M + 2m) − ω 2 M m = 0. (4.100) (4.101) con soluciones r ω1 = 0 , ω2 = k , m s ω3 = k m 2m 1+ M . (4.102) 4.3. MODOS NORMALES 169 Las frecuencias ω2 y ω3 para la molécula de CO2 se encuentran en el infrarrojo. La frecuencia angular ω1 = 0 corresponde a una traslación uniforme de la molécula, puesto que la Ec. (4.88) implica ζ̈1 = 0 ⇒ ⇒ ζ̇1 = cte reposo o velocidad constante. La ecuación para las amplitudes aj X (Vij − ωk2 Tij )aj = 0, (4.103) (4.104) j equivale a un sistema de 3 ecuaciones para cada ωk , i=1: (k − ωk2 m)a1 − ka2 i = 2 : −ka1 + (2k − ωk2 M )a2 − ka3 i=3: −ka2 + (k − ωk2 m)a3 = = = 0 0 0. (4.105) Para ω1 , a1 (ω1 ) = a2 (ω1 ) = a3 (ω1 ). (4.106) Figura 4.7: Configuración del modo normal correspondiente a ω1 . Para ω2 , k − ω22 m = 0, (4.107) luego, a2 (ω2 ) = 0, a1 (ω2 ) = −a3 (ω2 ). (4.108) Figura 4.8: Configuración del modo normal correspondiente a ω2 . Para ω3 , tenemos 2m 2mk k − ω32 m = k − k 1 + =− M M (4.109) 170 CAPÍTULO 4. OSCILACIONES PEQUEÑAS luego, a1 (ω3 ) = a3 (ω3 ) k − ω32 m 2m a2 (ω3 ) = a1 (ω3 ) = − a1 (ω3 ) k M (4.110) (4.111) Figura 4.9: Configuración del modo normal correspondiente a ω3 . La configuración de los modos normales refleja el hecho que el momento lineal total de la molécula es constante, puesto que la fuerza externa total sobre la molécula es cero. 2. Encontrar las frequencias de pequeñas oscilaciones y los modos normales de un péndulo con soporte deslizante horizontalmente. Figura 4.10: Péndulo con soporte deslizante horizontalmente. El Lagrangiano de este sistema ya fue obtenido en el Cap. 1. La energı́a cinética es T = 1 1 (m1 + m2 )ẋ21 + m2 (l2 θ̇2 + 2lẋ1 θ̇ cos θ) , 2 2 (4.112) y la energı́a potencial, V = −m2 gl cos θ. (4.113) Las posiciones de equilibrio son θ0 = 0, x0 ; luego η1 = x1 − x0 , η2 = θ − θ0 = θ. Para pequeños desplazamientos, cos θ = cos η ≈ 1 − T = (4.114) η2 . Luego, 2 1 1 (m1 + m2 )η̇12 + m2 (l2 η̇22 + 2lη̇1 η̇2 ) 2 2 (4.115) 4.3. MODOS NORMALES 171 1 m2 glη22 . 2 Comparando con las formas generales cerca del equilibrio, 1X Vij ηi ηj , V = 2 i,j V = T = (4.116) (4.117) 1X Tij η̇i η̇j , 2 i,j (4.118) identificamos los coeficientes Vij , V11 = 0, V21 = 0, V12 = 0 V22 = m2 gl (4.119) y los coeficientes Tij , T11 = (m1 + m2 ), T12 = m2 l T21 = m2 l, T22 = m2 l2 . (4.120) Las frecuencias están dadas por la condición det |Vij − ω 2 Tij | = 0, −ω 2 T11 −ω 2 T12 −ω 2 T21 V22 − ω 2 T22 , = 0 (4.121) la cual conduce a la siguiente ecuación caracterı́stica cuadrática para ω 2 , 2 (ω 2 )2 T12 + ω 2 T11 (V22 − ω 2 T22 ) = 0, (4.122) cuyas soluciones son ω12 = 0, ω22 = T11 V22 (m1 + m2 )m2 gl 2 = (m + m )m l2 − m2 l2 = T11 T22 − T12 1 2 2 2 (4.123) 1+ m2 m1 g . l (4.124) Note que si m1 → ∞ (soporte fijo), entonces ω22 = g/l, correspondiente a la frecuencia para pequeñas oscilaciones de un péndulo simple. La ecuación para las amplitudes aj X (Vij − ωk2 Tij )aj = 0, (4.125) j equivale a un sistema de 2 ecuaciones para cada ωk , i=1: i=2: −ωk2 (m1 + m2 )a1 − ωk2 m2 la2 −ωk2 m2 la1 − (m2 gl − ωk2 m2 l2 )a2 = = 0 0. (4.126) Para ω1 = 0, las amplitudes del modo correspondiente resultan en a2 (ω1 ) = 0, a1 (ω1 ) = arbitrario. (4.127) 172 CAPÍTULO 4. OSCILACIONES PEQUEÑAS Figura 4.11: Configuración del modo normal correspondiente a ω1 . Para ω2 , m2 l a1 (ω2 ) =− < 0, a2 (ω2 ) (m1 + m2 ) (4.128) es decir, en este modo las partı́culas se mueven siempre con amplitudes opuestas. Figura 4.12: Configuración del modo normal correspondiente a ω2 . 3. Dos osciladores armónicos con masas m1 y m2 , acoplados verticalmente mediante resortes de constante k y longitud en reposo l. Figura 4.13: Osciladores armónicos acoplados verticalmente. Las posiciones de equilibrio de las masas m1 y m2 son y01 y y02 , respectivamente. Los pequeños desplazamientos del equilibrio son η1 = y1 − y01 , η2 = y2 − y02 . 4.3. MODOS NORMALES 173 La energı́a potencial del sistema es V = 1 1 k(y1 − l)2 + k(y2 − y1 − l)2 − m1 gy1 − m2 gy2 . 2 2 Las posiciones de equilibrio están dadas por ∂V ∂V = 0, = 0; ∂y1 (y01 ,y02 ) ∂y2 (y01 ,y02 ) (4.129) (4.130) esto es, ∂V = k(y01 − l) − k(y02 − y01 − l) − m1 g = 0 ∂y1 (y01 ,y02 ) ∂V = k(y02 − y01 − l) − m2 g = 0, ∂y2 (4.131) (4.132) (y01 ,y02 ) lo que conduce a y01 = l + (m1 + m2 )g , k y02 = y01 + l + m2 g . k (4.133) La energı́a potencial, Ec. (4.129), se puede expresar en términos de los pequeños desplazamientos, 1X ∂ 2 V V = Vij ηi ηj , donde Vij = . (4.134) 2 i,j ∂yi ∂yj (y01 ,y02 ) Luego, V12 ∂ 2 V = 2k ∂y12 (y01 ,y02 ) ∂ 2 V =k = ∂y22 (y01 ,y02 ) V11 = (4.135) V22 (4.136) ∂ 2 V = = −k = V21 . ∂y1 ∂y2 (y01 ,y02 ) (4.137) La energı́a potencial del sistema para pequeños desplazamientos del equilibrio se puede obtener directamente de las contribuciones de la energı́a potencial de los resortes como 1 1 V = kη12 + k(η2 − η1 )2 , (4.138) 2 2 lo que da los coeficientes Vij ya encontrados. La energı́a cinética es T = 1 1 1 1 m1 ẏ12 + m2 ẏ22 = m1 η̇12 + m2 η̇22 . 2 2 2 2 (4.139) 174 CAPÍTULO 4. OSCILACIONES PEQUEÑAS Comparando con la forma T = 1X Tij η̇i η̇j , 2 i,j (4.140) tenemos T11 = m1 , T12 = 0 = T21 , T22 = m2 . (4.141) Las frecuencias de oscilación están dadas por la condición det |Vij − ω 2 Tij | = 0, V11 − ω 2 T11 V12 − ω 2 T12 2k − ω 2 m1 −k =0 (4.142) = 2 V21 − ω 2 T21 V22 − ω 2 T22 −k k − ω m2 Note que la energı́a potencial gravitacional no influye en las frecuencias de las oscilaciones, sólo cambia las posiciones de equilibrio de las partı́culas. Luego, (2k − m1 ω 2 )(k − m2 ω 2 ) − k 2 = 0. (4.143) Llamando x = ω 2 , tenemos m1 m2 x2 − k(m1 + m2 )x + k 2 = 0 , q k 2 2 2 x = ω± = (m1 + 2m2 ) ± m1 + 4m2 . 2m1 m2 P Las ecuaciones para las amplitudes j (Vij − ω 2 Tij )aj = 0, resultan (2k − ωk2 m1 )a1 − ka2 = 0 −ka1 + (k − ωk2 m2 )a2 = 0 ⇒ m2 ωk2 a1 (ωk ) =1− . a2 (ωk ) k (4.144) (4.145) (4.146) (4.147) Para ω1 = ω+ , s 2 a1 (ω1 ) 1 m2 m2 =1− 1+2 + 1+4 < 0. a2 (ω1 ) 2 m1 m1 (4.148) En el modo normal correspondiente a ω1 = ω+ , las amplitudes están siempre en fases opuestas. Para ω2 = ω− , s 2 a1 (ω2 ) 1 m2 m2 =1− 1+2 − 1+4 > 0. a2 (ω2 ) 2 m1 m1 Para el modo normal asociado a ω2 = ω− , las amplitudes están en fase. (4.149) 4.4. OSCILACIONES FORZADAS Y AMORTIGUADAS 4.4. 175 Oscilaciones forzadas y amortiguadas Consideremos el movimiento de pequeñas oscilaciones de un sistema sobre el cual actúa una fuerza externa. Supongamos, además, que el movimiento ocurre en un medio cuyo efecto sobre el movimento no puede ser despreciado. Cuando una partı́cula se mueve en un medio, éste ejerce una fuerza de resistencia o fricción sobre la partı́cula que tiende a retrasar su movimiento. La energı́a suministrada por la fuerza externa a la partı́cula en movimiento eventualmente se disipa en el medio en forma de calor. Los movimientos oscilatorios en presencia de fuerzas externas y de fricción, se denominan oscilaciones forzadas y amortiguadas. Para velocidades suficientemente pequeñas, se sabe experimentalmente que la fuerza de fricción sobre un cuerpo que se mueve en un medio es opuesta a la dirección de la velocidad del cuerpo y proporcional a su magnitud. Esto es, ffr = −αv, donde α > 0 es el coeficiente de fricción caracterı́stico del medio. La fuerza externa puede tener cualquier forma; aqui consideraremos el caso de fuerzas oscilatorias porque tienen mucho interés y aplicaciones en sistemas fı́sicos. Esto es, supondremos fuerzas externas de la forma Fext = f cos νt, donde f y ν son la amplitud y la frecuencia angular de la fuerza, respectivamente. Por simplicidad, consideremos un partı́cula que realiza un movimiento oscilatorio con un grado de libertad, sujeto a una fuerza externa y amortiguado. Tomando en cuenta las consideraciones anteriores, la ecuación de movimiento de la partı́cula es mẍ ⇒ mẍ = −kx + ffr + Fext = −kx − αẋ + f cos νt. (4.150) Esta ecuación también describe el movimiento de un modo normal de un sistema con varios grados de libertad, forzado y amortiguado en un medio homogéneo. La Ec. (4.150) se puede escribir como ẍ + 2λẋ + ω 2 x = f cos νt, m (4.151) donde ω 2 = k/m y hemos definido la constante 2λ ≡ α/m. La Ec. (4.151) se puede escribir en forma compleja como ẍ + 2λẋ + ω 2 x = f iνt e . m (4.152) La Ec. (4.152) es una ecuación diferencial ordinaria no homogénea. Su solucion tiene la forma x = xh + xp , donde xh es la solución de la ecuación homogénea y xp es una solución particular de la Ec. (4.152). La solución de la Ec. (4.151) corresponde a la parte real de la solución de la Ec. (4.152). Buscamos una solución particular de la Ec. (4.152) en la forma xp = B eiνt = b ei(νt+δ) , (4.153) 176 CAPÍTULO 4. OSCILACIONES PEQUEÑAS donde B = b eiδ es una amplitud compleja, y b, δ ∈ < son parámetros a determinar. Sustitución de xp en la Ec. (4.152) conduce a −ν 2 b + i2λνb + ω 2 b = f −iδ e . m (4.154) Igualando la parte real y la parte imaginaria en ambos lados de la Ec. (4.154), tenemos b(ω 2 − ν 2 ) = 2λνb = f cos δ, m f − sin δ, m (4.155) (4.156) de donde obtenemos tan δ = b = 2λν , ν 2 − ω2 1 f . m [(ω 2 − ν 2 )2 + 4ν 2 λ2 ]1/2 (4.157) (4.158) Tomando la parte real de xp , tenemos xp = b cos(νt + δ). (4.159) La solución xh satisface la ecuación homogénea ẍh + 2λẋh + ω 2 xh = 0. (4.160) Buscamos una solución en la forma xh = eirt , donde r es un parámetro a determinar. Sustitución en la Ec. (4.160) conduce a la siguiente ecuación para r, r2 − i2λr − ω 2 = 0. La Ec. (4.161) da dos valores complejos para r, p r1,2 = iλ ± ω 2 − λ2 = iλ ± γ, (4.161) (4.162) donde hemos definido γ≡ p ω 2 − λ2 , (4.163) y hemos asumido que ω > λ, de manera que exista movimiento oscilatorio para tiempo asintótico. Luego, la solución general de la ecuación homogénea Ec. (4.160) debe ser la combinación lineal de eir1 t y eir2 t , que son complejos conjugados. Entonces, podemos expresar xh como xh = e−λt Aeiγt + A∗ e−iγt = 2 e−λt Re A eiγt , (4.164) 4.4. OSCILACIONES FORZADAS Y AMORTIGUADAS 177 donde A = (a/2) eiφ es una amplitud compleja, con a, φ ∈ <. Tomando la parte real de xh , obtenemos xh = a e−λt cos(γt + φ). (4.165) Luego, la solución de la ecuación de movimiento, Ec. (4.152), es x(t) = a e−λt cos(γt + φ) + b cos(νt + δ). (4.166) Para tiempos suficientamente grandes, t 1/λ, el primer término en la Ec. (4.166) decae, y el movimiento está determinado por el segundo término, el cual representa el estado asintótico y estacionario del sistema. Esto es, el movimiento estacionario corresponde a la solución xe (t) = b cos(νt + δ). (4.167) La respuesta del sistema en el estado estacionario esta desfasada en un factor δ con respecto a la fuerza externa. En el movimiento estacionario, existe un flujo de energı́a que entra y sale del sistema. La energı́a es continuamente absorbida por el sistema desde la fuerza externa, y disipada en el medio por la fricción. La frecuencia de resonancia de la fuerza externa νR es aquella para la cual la respuesta del sistema exhibe su máxima amplitud. El valor de νR se puede determinar a partir de la condición db = 0, (4.168) dν νR donde b es la amplitud dada por la Ec. (4.158). Calculamos la derivada como f 2ν[(ω 2 − ν 2 ) − 2λ2 ] db = . dν m [(ω 2 − ν 2 )2 + 4ν 2 λ2 ]3/2 (4.169) La condición Ec. (4.168) conduce al valor de la frecuencia de resonancia, νR = ω 2 − 2λ2 . (4.170) El valor de la amplitud de respuesta del sistema en resonancia es bmax = f 1 . m 2λ(ω 2 − λ2 )1/2 (4.171) En ausencia de fricción, λ = 0; entonces νR = ω y b → ∞. Luego, el amortiguamiento reduce el valor de la frecuencia de resonancia y limita el crecimiento de la amplitud en resonancia. Note que si ω 2 < 2λ2 , la frecuencia νR tiene un valor imaginario y no hay resonancia; la amplitud b simplemente decrece con el incremento de ν. 178 4.5. CAPÍTULO 4. OSCILACIONES PEQUEÑAS Problemas 1. Una partı́cula de masa m se mueve sin fricción sobre la superficie z = kr2 (coordenadas cilı́ndricas), donde z es la dirección vertical y k es constante. a) Encuentre la condición de estabilidad de una órbita circular de radio ro sobre esta superficie. b) Encuentre la frecuencia de pequeñas oscilaciones radiales alrededor de esta órbita circular. 2. Una partı́cula de masa M cuelga de una varilla de masa despreciable y longitud l, cuyo punto de soporte consiste en otra partı́cula de masa m sujeta horizontalmente a dos resortes de constante k cada uno. a) Encuentre las frecuencias de pequeñas oscilaciones para este sistema. b) Encuentre y dibuje esquemáticamente la configuración de los modos normales correspondientes a esas frecuencias. 3. Un péndulo triple consiste en tres masas, λm, m y m, unidas por varillas de longitud l cada una. a) Determine el valor del parámetro λ tal que una de las frecuencias para pequeñas oscilaciones de este sistema sea igual a la frecuencia para pequeñas amplitudes de un péndulo simple con longitud l/2. b) Encuentre y dibuje esquemáticamente el modo normal correspondiente a esta frecuencia del sistema. 4.5. PROBLEMAS 179 4. Considere dos péndulos de longitud l y masa m cada uno, acoplados por un resorte de constante k. a) Encuentre las frecuencias de pequeñas oscilaciones del sistema. b) Encuentre y dibuje esquemáticamente las configuraciones de los modos normales correspondientes a estas frecuencias. 5. Encuentre las frecuencias y las configuraciones de los modos normales correspondientes a pequeñas oscilaciones longitudinales del sistema de dos masas y tres resortes mostrado en la figura. 6. Considere un sistema formado por tres partı́culas de masa m cada una, las cuales se mueven sin fricción sobre una circunferencia de radio R, conectadas entre sı́ por resortes idénticos de constante k a lo largo de la circunferencia. a) Encuentre las frecuencias para pequeñas oscilaciones de este sistema. b) Encuentre y dibuje esquemáticamente la configuración de los modos normales correspondientes a estas frequencias. 7. Calcule las frecuencias y las configuraciones de correspondientes los modos normales para pequeñas oscilaciones transversales de un sistema formado por dos masas m, conectadas entre sı́ y a las paredes por resortes horizontales de constante k cada uno. 180 CAPÍTULO 4. OSCILACIONES PEQUEÑAS 8. Dos partı́culas con masa m y carga +q cada una están conectadas entre sı́ y a paredes fijas mediante resortes iguales de constante k y longitud en reposo l. Encuentre la ecuación caracterı́stica para las frecuencias del sistema. 9. Encuentre las frecuencias para oscilaciones verticales y los correspondientes modos normales para el sistema de tres masas y tres resortes mostrado en la figura. 10. Un bloque de masa m se encuentra unido por medio de un resorte de constante k a una cuña de masa M y altura h que forma un ángulo α con la horizontal, como se muestra en la figura. La masa M puede deslizarse sobre la superficie horizontal. Desprecie la fricción. a) Calcule las frecuencias de pequeñas oscilaciones del sistema alrededor del equilibrio. b) Encuentre y dibuje esquemáticamente las configuraciones relativas de los modos normales correspondientes a cada frecuencia del sistema. 11. Considere una masa m colgada verticalmente de un resorte de constante k en el campo gravitacional terrestre, e inmersa en un medio viscoso cuyo coeficiente de fricción es α. a) Encuentre la ecuación de movimiento de la masa. b) Encuentre la trayectoria en función del tiempo. c) Describa el estado estacionario del sistema. 4.5. PROBLEMAS 181 12. Un sistema consiste en dos aros, de radio a y masa m cada uno, que pueden girar sin fricción alrededor de ejes que pasan por sus respectivos centros fijos. Los aros están conectados entre ellos por un resorte de constante k1 y, a su vez, cada uno está conectado a una pared fija mediante un resorte de constante k2 . a) Calcule las frecuencias para pequeñas oscilaciones en este sistema. b) Encuentre y dibuje las configuraciones de los modos normales correspondientes a cada frecuencia del sistema. 182 CAPÍTULO 4. OSCILACIONES PEQUEÑAS Capı́tulo 5 Movimiento de cuerpos rı́gidos 5.1. Velocidad angular de un cuerpo rı́gido Un cuerpo rı́gido es un sistema de partı́culas cuyas distancias mutuas son fijas, i.e., no varı́an en el tiempo. Por ejemplo, los cuerpos sólidos, las estructuras fijas, andamios, son cuerpos rı́gidos. La descripción del movimiento de un cuerpo rı́gido se puede hacer en términos de la posición de su centro de masa y de la orientación relativa del cuerpo en el espacio. Esto requiere de dos sistemas de coordenadas: 1. Un sistema inercial o laboratorio, denotado por (x, y, z) y con origen O. 2. Un sistema en movimiento, fijo en el cuerpo, con origen en el centro de masa (CM ), identificado por (x1 , x2 , x3 ). Figura 5.1: Sistemas de coordenadas para un cuerpo rı́gido. 183 184 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Mediante estos sistemas de coordenadas, un pequeño desplazamiento general del cuerpo rı́gido se puede representar como la suma de dos movimientos: 1. Translación del centro de masa, sin cambiar la orientación relativa entre (x, y, z) y (x1 , x2 , x3 ). 2. Rotación de las coordenadas (x1 , x2 , x3 ) alrededor de un eje que pasa por el centro de masa. La posición R de cualquier punto P del cuerpo rı́gido en un instante dado con respecto al sistema de referencia del laboratorio (x, y, z) es R = Rcm + r, (5.1) donde Rcm : r: posición del centro de masa con respecto al laboratorio (x, y, z), (5.2) posición de P con respecto al sistema fijo en el cuerpo (x1 , x2 , x3 ). (5.3) Consideremos un desplazamiento infinitesimal de P en el laboratorio, dR = dRcm + dr. (5.4) Un cambio infinitesimal dr en las coordenadas (x1 , x2 , x3 ) sólo puede deberse a un cambio de dirección del vector r, no a un cambio de su magnitud (puesto que la distancia de P al centro de masa es fija). Luego, un cambio dr debe ser el resultado de una rotación infinitesimal alrededor de un eje dado instantáneo que pasa por el centro de masa del cuerpo rı́gido. Figura 5.2: Rotación infinitesimal alrededor de un eje instantáneo con dirección dΦ que pasa por el centro de masa. Sea dΦ la magnitud el ángulo infinitesimal de rotación alrededor del eje que pasa por el centro de masa cuya dirección es dΦ. El sentido de la rotación se asigna según la regla de la mano derecha, con el pulgar derecho apuntando en la dirección dΦ. Sea θ el ángulo entre la dirección dΦ y el vector r. El vector dr es perpendicular al plano (dΦ, r). Su magnitud es dr = (r sin θ)dΦ y su dirección está dada por dr = dΦ × r. (5.5) 5.2. ÁNGULOS DE EULER 185 Luego, dR = dRcm + dΦ × r, (5.6) dR dRcm dΦ = + × r, dt dt dt (5.7) v = vcm + Ω × r, (5.8) y la variación en el tiempo es lo cual puede escribirse como donde dR dt dRcm = dt dΦ Ω= dt v= vcm : velocidad de P en el laboratorio (x, y, z), (5.9) : velocidad de traslación del centro de masa en (x, y, z), (5.10) : velocidad angular instantánea de rotación. (5.11) La dirección de la velocidad angular instantánea Ω es la misma que la del vector dΦ. En general, la dirección y la magnitud de Ω pueden cambiar durante el movimiento del cuerpo rı́gido. En un instante dado, todos los puntos del cuerpo están girando con la misma velocidad angular Ω. Figura 5.3: Velocidad angular Ω alrededor de un eje que pasa por el centro de masa. 5.2. Ángulos de Euler La ubicación de un punto P de un cuerpo rı́gido en el sistema de referencia del laboratorio (x, y, z) está dada por el vector Rcm y por la dirección del vector r, ya que la magnitud de r no puede cambiar. La dirección de r está dada por la orientación relativa de los ejes (x1 , x2 , x3 ) del sistema de referencia fijo en el cuerpo con respecto a 186 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS los ejes (x, y, z) del sistema de referencia del laboratorio. La descripción de la orientación relativa entre dos sistemas de coordenadas cartesianas requiere de tres ángulos entre los respectivos ejes de cada sistema. Luego, un cuerpo rı́gido posee en total 6 grados de libertad: tres coordenadas para la posición del centro de masa en el laboratorio y tres ángulos para describir la orientación del cuerpo con respecto al sistema del laboratorio. Se escogen como ángulos convenientes los ángulos de Euler, por cuanto éstos describen de manera natural los movimientos giratorios de un cuerpo rı́gido, tal como un trompo. Estos movimientos son: precesión (rotación alrededor de un eje fijo en el laboratorio), nutación (inclinación con respecto al eje fijo) y rotación (rotación del cuerpo sobre sı́ mismo). Figura 5.4: Movimientos de un cuerpo rı́gido en términos de ángulos de Euler. P : precesión φ (rotación alrededor de un eje fijo en el laboratorio); N : nutación θ (inclinación con respecto al eje fijo; y R: rotación ψ (rotación del cuerpo sobre sı́ mismo). Para determinar la orientación de los ejes (x1 , x2 , x3 ) con respecto a los ejes (x, y, z) mediante los ángulos de Euler, hacemos coincidir los orı́genes de ambos sistemas, CM y O. Los ángulos de Euler se definen de acuerdo a las rotaciones de los ejes (x1 , x2 , x3 ) con respecto a los ejes fijos (x, y, z), mostradas en la Fig. (5.5), de la siguiente manera: (a) Angulo de precesión, φ ∈ [0, 2π]: ángulo de rotación con respecto al eje z, sobre el plano (x, y), medido desde el eje x hasta el eje x1 = N , donde N es la lı́nea de intersección del plano (x1 , x2 ) con el plano (x, y), y se denomina lı́nea nodal. (b) Angulo de nutación, θ ∈ [0, π]: ángulo de rotación con respecto a la lı́nea nodal N , medido desde z hasta x3 . (c) Angulo de rotación, ψ ∈ [0, 2π]: ángulo de rotación con respecto al eje x3 , sobre el plano (x1 , x2 ), medido desde N a x1 . 5.2. ÁNGULOS DE EULER 187 Figura 5.5: Angulos de Euler φ, θ y ψ. Las velocidades angulares correspondientes a los ángulos de Euler apuntan en las siguientes direcciones, siguiendo la regla de la mano derecha: (a) φ̇: dirección z; (b) θ̇: dirección lineal nodal N , perpendicular al plano (x3 , z); (c) ψ̇: dirección x3 . Figura 5.6: Angulos de Euler y sus respectivas velocidades. 188 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Las velocidades angulares φ̇, θ̇ y ψ̇ pueden expresarse en términos de sus componentes o proyecciones sobre los ejes (x1 , x2 , x3 ). Figura 5.7: Angulos de Euler y orientación de los ejes (x1 , x2 , x3 ) con respecto a los ejes (x, y, z). Las componentes de ψ̇ = (ψ̇1 , ψ̇2 , ψ̇3 ) sobre los ejes (x1 , x2 , x3 ) son: ψ̇3 = ψ̇, ψ̇2 = 0, en dirección del eje x3 , (5.12) (5.13) ψ̇1 = 0. (5.14) Para obtener las componentes de θ̇ y ψ̇ sobre los ejes (x1 , x2 , x3 ), consideremos la Fig. (5.8). Figura 5.8: Izquierda: componente φ̇3 y proyección de φ̇ sobre el plano (x1 , x2 ). Derecha: Componentes φ̇2 y φ̇2 de la proyección de φ̇ sobre el plano (x1 , x2 ). 5.3. ENERGÍA CINÉTICA Y TENSOR DE INERCIA 189 Las componentes de θ̇ = (θ̇1 , θ̇2 , θ̇3 ) en la Fig. (5.8) son: θ̇1 = θ̇ cos ψ, (5.15) θ̇2 = −θ̇ sin ψ, (5.16) θ̇3 = (5.17) 0, puesto que θ̇ es perpendicular a x3 . Por último, consideremos las componentes de φ̇ = (φ̇1 , φ̇2 , φ̇3 ). La proyección de φ̇ sobre el eje x3 es φ˙3 = φ̇ cos θ. (5.18) La proyección de φ̇ sobre el plano (x1 , x2 ) es igual a φ̇ sin θ. Luego, las componentes φ̇2 y φ̇2 sobre el plano (x1 , x2 ) son φ̇1 = (φ̇ sin θ) sin ψ, (5.19) φ̇2 = (φ̇ sin θ) cos ψ. (5.20) La velocidad angular instantánea Ω de un cuerpo rı́gido es una combinación de rotaciones asociadas a los tres ángulos de Euler. Las componentes del vector Ω = (Ω1 , Ω2 , Ω3 ) en el sistema (x1 , x2 , x3 ) se pueden expresar en términos de los ángulos de Euler (θ, φ, ψ) y de sus correspondientes velocidades angulares (θ̇, φ̇, ψ̇). Para cada componente Ωi , podemos escribir Ωi = θ̇i + φ̇i + ψ̇i , i = 1, 2, 3. (5.21) Reagrupando las componentes de φ̇, θ̇ y ψ̇, y sustituyendo en la Ec. (5.21), tenemos Ω1 5.3. = φ̇ sin θ sin ψ + θ̇ cos ψ, (5.22) Ω2 = φ̇ sin θ cos ψ − θ̇ sin ψ, (5.23) Ω3 = ψ̇ + φ̇ cos θ. (5.24) Energı́a cinética y tensor de inercia La energı́a potencial de interacción entre las partı́culas de un cuerpo rı́gido es constante; toda la energı́a potencial del cuerpo equivale a la energı́a potencial de su centro de masa. Por otro lado, la energı́a cinética de un cuerpo rı́gido cuya velocidad angular instantánea es Ω, está dada por T = cuerpo 1 X mj vj2 , 2 j j = 1, 2, . . . , (5.25) donde la sumatoria sobre j se extiende a todas las partı́culas del cuerpo, mj es la masa de la partı́cula j del cuerpo y vj es su velocidad, dada por la Ec. (5.8), vj = vcm + Ω × rj , (5.26) 190 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS donde rj = (x1 (j), x2 (j), x3 (j)). La velocidad angular Ω es la misma para todas las partı́culas del cuerpo. Luego, 1X 2 mj (vcm + Ω × rj ) T = 2 j X 1X 1X 2 mj vcm + mj vcm · (Ω × rj ) + mj (Ω × rj )2 . 2 j 2 j j = El primer término en la Ec. (5.27) es X 1 1X 1 2 2 2 mj vcm mj vcm = = M vcm . 2 j 2 2 j (5.27) (5.28) P donde M = j mj es la masa total del cuerpo. El segundo término en la Ec. (5.27) se puede evaluar usando la identidad vectorial a · (b × c) = b · (c × a) = c · (a × b), la cual conduce a 0 > X X X = 0 , (5.29) mj vcm · (Ω × rj ) = mj rj · (vcm × Ω) = (vcm × Ω) · m j rj j j j puesto que en el sistema de coordenadas (x1 , x2 , x3 ) con origen en el centro de masa P j mj rj = 0. (5.30) Rcm = M El tercer término en la Ec. (5.27) se puede evaluar usando la identidad vectorial (a × b) · (c × d) = (a · c)(b · d) − (a · d)(b · c), la cual da (Ω × rj )2 = (Ω × rj ) · (Ω × rj ) = Ω2 rj2 − (Ω · rj )2 . Sustituyendo en la Ec. (5.27), tenemos 1 1X 2 T = M vcm + mj Ω2 rj2 − (Ω · rj )2 2 2 j = Tcm + Trot , (5.31) (5.32) (5.33) donde el primer término es la energı́a cinética de traslación del cuerpo y el segundo término corresponde a la contribución debida a la rotación del cuerpo rı́gido. Se puede expresar X Ωi = Ωk δik , i, k = 1, 2, 3, (5.34) k Ω 2 = X Ω2i = i X Ωi i X Ωk δik = k ! 2 (Ω · rj ) = X i X Ωi xi (j) Ωi Ωk δik , (5.35) i,k ! X k Ωk xk (j) = X i,k Ωi Ωk xi (j)xk (j) . (5.36) 5.3. ENERGÍA CINÉTICA Y TENSOR DE INERCIA 191 En lo que sigue, suprimiremos el ı́ndice j de las partı́culas en la componentes de rj , i.e., xk (j) → xk . Luego, Trot = cuerpo X 1 X mj Ωi Ωk rj2 δik − Ωi Ωk xi xk 2 j i,k = 1X 2 Ωi Ωk X mj rj2 δik − xi xk , (5.37) j i,k donde i, k = 1, 2, 3 y el ı́ndice j cuenta las partı́culas del cuerpo. La Ec. (5.37) se puede escribir en la forma Trot = 1X Iik Ωi Ωk , 2 (5.38) i,k donde hemos definido el tensor de inercia del cuerpo rı́gido como X Iik ≡ mj rj2 δik − xi xk . (5.39) j El tensor de inercia se puede expresar como una matriz, I11 I12 I13 I = I21 I22 I23 I31 I32 I33 P P P mj (x22 + x23 ) − m x x − j m j x1 x3 jP P j 2j 1 22 P mj (x1 + x3 ) − j mj x2 x3 . = − Pj mj x2 x1 jP P − j m j x3 x1 − j m j x3 x2 mj (x21 + x22 ) (5.40) El tensor de inercia es simétrico, Iik = Iki , por lo que posee solamente seis componentes independientes. El tensor Iik es una propiedad del cuerpo rı́gido que caracteriza la distribución de masa del cuerpo en torno a los ejes (x1 , x2 , x3 ). Fı́sicamente, cada componente del tensor de inercia expresa la resistencia o inercia de un cuerpo a ser rotado en torno a un eje dado. Por ejemplo, I33 mide la resistencia del cuerpo a ser rotado alrededor del eje x3 . Con una escogencia adecuada de los ejes (x1 , x2 , x3 ) para cuerpos simétricos, es posible hacer que I sea diagonal: Iik = 0, si i 6= k. En ese caso, 1 (I11 Ω21 + I22 Ω22 + I33 Ω23 ). 2 (5.41) R Para una distribución continua de masa, pasamos al lı́mite continuo j mj → ρdV , donde ρ es la densidad y dV = dx1 dx2 dx3 es el elemento de volumen del cuerpo. En ese caso, el tensor de inercia se expresa como Z Iik = ρ(r)[r2 δik − xi xk ] dV . (5.42) Trot = P 192 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Teorema de los ejes paralelos. Sea Iik el tensor de inercia de un cuerpo rı́gido, expresado en el sistema de coordenadas (x1 , x2 , x3 ) con origen en el centro de masa del cuerpo. Entonces, en un sistema diferente de coordenadas fijas (x01 , x02 , x03 ), cuyo origen O0 se encuentra en una posición a con respecto al centro de masa del cuerpo, el tensor de inercia es X 0 Iik = Iik + mj (a2 δik − ai ak ). (5.43) j Figura 5.9: Diferentes sistemas de coordenadas fijas para un cuerpo rı́gido. Demostración: El tensor de inercia en el sistema de coordenadas (x1 , x2 , x3 ) con origen en el centro de masa del cuerpo, es X Iik = mj rj2 δik − xi xk . (5.44) j Supongamos un sistema diferente de coordenadas fijas (x01 , x02 , x03 ), cuyo origen O0 se encuentra en una posición a con respecto al centro de masa del cuerpo. La posición de un punto P del cuerpo en el sistema (x1 , x2 , x3 ) es rj ⇒ xi = a + r0 j , (5.45) = x0i . (5.46) ai + Luego, en el sistema de coordenadas (x01 , x02 , x03 ), tenemos X 0 Iik = mj (rj02 δik − x0i x0k ) , (5.47) j donde rj02 = (rj − a)2 = rj2 + a2 − 2 X l xl al . (5.48) 5.3. ENERGÍA CINÉTICA Y TENSOR DE INERCIA 193 Sustituyendo, " 0 Iik = X rj2 + a2 − 2 mj j = # ! X xl al δik − (xi − ai )(xk − ak ) (5.49) l X X mj rj2 δik − xi xk + mj (a2 δik − ai ak ) j (5.50) j −2 X mj X j xl al δik + X mj xi ak + j l X mj xk ai . (5.51) j Pero en el sistema de coordenadas (x1 , x2 , x3 ), tenemos *0 X = 0, m mj xi ak = ak j xi (j) j j *0 X X = 0. m mj xk ai = ai j xk (j) j j X (5.52) (5.53) Además, *0 X al m = 0. j xl (j) j X j mj X xl al = l X l (5.54) Luego tenemos, 0 Iik = Iik + X mj (a2 δik − ai ak ). (5.55) j En particular, si i = k, el teorema de ejes paralelos implica que X 0 I33 = I33 + mj (a2 − a23 ) X = I33 + mj (a21 + a22 ) = I33 + M a2⊥ , donde M es la masa total del cuerpo y a⊥ = ejes x3 y x03 . En general, a21 + (5.56) a22 es la distancia perpendicular entre Iii0 = Iii + M a2⊥ , donde a⊥ es la distancia perpendicular entre ejes xi y x0i . (5.57) 194 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Ejemplos. 1. Momentos de inercia de un cuerpo rı́gido plano. Figura 5.10: Cuerpo rı́gido plano. Llamemos (x1 , x2 ) al plano del cuerpo rı́gido. Entonces el eje x3 es perpendicular al cuerpo y rj = (x1 (j), x2 (j), 0), ∀j. Luego, X I11 = mj x22 , (5.58) j I22 = X mj x21 , (5.59) mj (x21 + x22 ) = I11 + I22 . (5.60) j I33 = X 2. Momentos de inercia de un aro uniforme, de masa M y radio R. Figura 5.11: Aro. Sea x3 el eje perpendicular al plano del aro. Entonces, Z Z 2 2 2 I33 = (x1 + x2 )ρ dV = R ρ dV = M R2 . (5.61) El aro posee simetrı́a axial con respecto al eje x3 ; luego I11 = I22 . Adicionalmente, puesto que el aro es un cuerpo rı́gido plano, tenemos I33 1 I11 = I22 = = M R2 . (5.62) 2 2 5.3. ENERGÍA CINÉTICA Y TENSOR DE INERCIA 195 3. Momentos de inercia de un cilindro uniforme de altura h, radio R y masa M . Figura 5.12: Cilindro. M . El elemento de volumen de un πR2 h cascarón cilı́ndrico se puede expresar como dV = 2πrh dr, donde r2 = x21 + x22 . Entonces, Z I33 = ρ (x21 + x22 ) dV Z R = 2π ρ h r2 r dr La densidad de masa del cilindro es ρ = 0 = 1 M R2 . 2 Notemos que, por definición, Z Z I11 + I22 = ρ(x21 + x22 + 2x23 ) = I33 + 2 ρ x23 dV. (5.63) (5.64) Adicionalmente, por la simetrı́a axial, los momentos de inercia I11 = I22 . Luego, Z I33 + ρ x23 dV. (5.65) I11 = I22 = 2 Usando el elemento de volumen dV = πR2 dx3 , correspondiente a una sección transversal (disco) de espesor dx3 , calculamos 3 Z Z h/2 h 1 2 2 2 22 = M h2 . (5.66) ρ x3 dV = ρπR x3 dx3 = ρπR 3 2 12 −h/2 Entonces, I11 = 1 1 M R2 + M h2 = I22 . 4 12 (5.67) A partir de los resultados para un cilindro, pueden obtenerse los momentos de inercia correspondientes a otros cuerpos rı́gidos. 196 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Si R → 0, tenemos una varilla uniforme de longitud h y masa M . Figura 5.13: Varilla de longitud L. En ese caso, I33 I11 = I22 = 0, 1 = M L2 , 12 (5.68) (5.69) donde hemos llamado h = L. Por otro lado, si h → 0 tenemos un disco uniforme de masa M y radio R. Entonces, 1 I33 = M R2 . (5.70) 2 I33 I11 = I22 = . (5.71) 2 0 4. Sea una varilla de longitud L y masa M . Calcular el momento de inercia I22 con 0 respecto a un eje x2 que pasa por un extremo de la varilla, paralelo al eje x2 . Figura 5.14: Ejes paralelos x2 y x02 para un varilla de longitud L. Tenemos a = (0, 0, −L/2) y a⊥ = a = L/2. Luego, 0 I22 = I22 + M a2⊥ L2 1 1 = I22 + M = M L2 + M L2 4 12 4 1 = M L2 . 3 (5.72) (5.73) (5.74) 5.3. ENERGÍA CINÉTICA Y TENSOR DE INERCIA 197 5. Momentos de inercia de una esfera uniforme, de masa M y radio R. Figura 5.15: Cuerpo rı́gido esférico. La simetrı́a esférica implica que I11 = I22 = I33 . Por otro lado, la suma X X I11 + I22 + I33 = 2 mj (x21 + x22 + x23 ) = 2 mj rj2 j ⇒ I11 = 2X mj rj2 . 3 j Para una distribución continua y uniforme de masa, tenemos Z 2 I11 = ρ r2 dV 3 Z R 2 R5 2 ρ r2 (4πr2 ) dr = 4πρ , = 3 0 3 5 (5.75) j (5.76) (5.77) donde hemos empleado el elemento de volumen dV = 4πr2 dr. Sustituyendo la 3M densidad de masa ρ = , obtenemos 4πR3 2 I11 = I22 = I33 = M R2 . (5.78) 5 Si tenemos un cascarón esférico de radio R y masa M , la densidad de masa se puede M δ(r − R), donde δ(r − R) es la función delta de Dirac, tal expresar como ρ = 4πR2 que δ(r − R) = 0 si r 6= R. La integral de volumen de esta densidad da la masa del cascarón, Z Z ∞ M ρ dV = 4πr2 δ(r − R) dr = M. (5.79) 4πR2 0 Luego, los momentos de inercia de un cascarón esférico de radio R y masa M son Z 2 I11 = I22 = I33 = r2 ρ dV 3 Z R 2 M = 4πr4 δ(r − R) dr 3 4πR2 0 2 = M R2 . (5.80) 3 198 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS 6. Energı́a cinética de un elipsoide (I11 6= I22 6= I33 ) que rota sobre eje AB con velocidad angular ω, y sobre eje CD con velocidad angular ν, como se muestra en la Fig. (5.16). Figura 5.16: Elipsoide en rotación simultánea sobre dos ejes perpendiculares. Escogemos eje AB en la dirección x3 . Entonces los ejes x1 y x2 rotan alrededor de AB = x3 . La dirección de ω es a lo largo de x3 y la dirección de ν está sobre el plano (x1 , x2 ). Figura 5.17: Velocidad angular ν sobre el plano (x1 , x2 ). La velocidad angular del cuerpo es Ω = (Ω1 , Ω2 , Ω3 ), donde Ω3 = ω, (5.81) Ω1 = ν cos ωt, (5.82) Ω2 = ν sin ωt. (5.83) Luego, T = Trot = = 1 1 1 I11 Ω21 + I2 Ω222 + I33 Ω23 2 2 2 1 1 2 (I11 cos ωt + I22 sin2 ωt)ν 2 + I33 ω 2 . 2 2 (5.84) 5.3. ENERGÍA CINÉTICA Y TENSOR DE INERCIA 199 7. Energı́a cinética de un cilindro de masa M y radio a, rodando sin deslizar dentro de una superficie cilı́ndrica de radio R > a. Figura 5.18: Izquierda: Cilindro rodando sin deslizar dentro de otro cilindro. Derecha: Condición de rodar sin deslizar para el cilindro de radio a La energı́a cinética es T = Tcm + Trot , (5.85) donde 1 2 M vcm . 2 La velocidad de traslación del centro de masa es Tcm = (5.86) vcm = (R − a)φ̇ . (5.87) Sea x3 = z el eje del cilindro rodante. Entonces Ω = Ω3 x̂3 , con Ω3 = ψ̇, y Trot = 1 1 I33 Ω23 = I33 ψ̇ 2 . 2 2 (5.88) La condición de rodar sin deslizar implica que vcm = aψ̇. (5.89) Luego, vcm (R − a)φ̇ = . a a (5.90) 1 1 (R − a)2 2 M (R − a)2 φ̇2 + I33 φ̇ . 2 2 a2 (5.91) ψ̇ = Sustitución en la Ec. (5.85) da T = Para el cilindro rodante, I33 = 12 M a2 . Sustituyendo, T = = 1 1 M (R − a)2 φ̇2 + M (R − a)2 φ̇2 2 4 3 2 2 M (R − a) φ̇ . 4 (5.92) 200 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS 5.4. Momento angular de un cuerpo rı́gido El momento angular de un sistema depende del conjunto de coordenadas con respecto al cual estén definidas las posiciones de las partı́culas del sistema. Para un cuerpo rı́gido, es conveniente escoger el sistema de coordenadas (x1 , x2 , x3 ) con origen en el centro de masa para definir el momento angular del cuerpo, X X l= rj × pj = mj (rj × vj ), (5.93) j j donde rj es el vector de posición de la particula j en las coordenadas (x1 , x2 , x3 ). Figura 5.19: Sistema de referencia para definir el momento angular de un cuerpo rı́gido. La velocidad de la partı́cula j en este sistema se debe sólo a la rotación del cuerpo, y está dada por vj = Ω × rj , (5.94) donde Ω es la velocidad angular instantánea del cuerpo. Luego, X l= mj rj × (Ω × rj ). (5.95) j Usando la identidad vectorial A × (B × C) = (A · C)B − (A · B)C, podemos expresar X l= mj [rj2 Ω − (rj · Ω)rj ] (5.96) j Consideremos la componente i del vector l en la Ec. (5.96), " # X X 2 li = mj rj Ωi − xi (j) xk (j)Ωk j k " = X mj # X j = X = k mj X j k X Ωk X k j Ωk rj2 δik − X xi (j)xk (j)Ωk k Ωk [rj2 δik − xi (j)xk (j)] mj rj2 δik − xi (j)xk (j) . (5.97) 5.4. MOMENTO ANGULAR DE UN CUERPO RÍGIDO Recordemos que el tensor de inercia es X Iik = mj [rj2 δik − xi (j)xk (j)]. 201 (5.98) j Luego, podemos escribir la componente i del vector l como li = 3 X Iik Ωk . (5.99) k=1 En forma vectorial esto es l = I Ω, (5.100) donde I es la forma matricial del tensor de inercia, Ec. (5.40). En particular, si I es diagonal, l1 = I11 Ω1 , (5.101) l2 = I22 Ω2 , (5.102) l3 = I33 Ω3 . (5.103) Note que, en general, el momento angular l no es paralelo a la dirección de la velocidad angular Ω. Figura 5.20: Momento angular l y velocidad angular Ω de un cuerpo rı́gido. Si el vector Ω posee solamente una componente sobre un eje xk , tenemos Ω = Ωx̂k y entonces l = Ikk Ωx̂k ; es decir, el momento angular l es paralelo a la velocidad angular Ω. Igualmente, para cuerpos esféricos, I11 = I22 = I33 , y l = I11 Ω; l es paralelo a Ω. Ejemplo. 1. Rotación libre de un trompo. Un trompo es un cuerpo rı́gido que posee dos momentos principales de inercia iguales, por ejemplo I11 = I22 6= I33 . Se escoge x3 como el eje de simetrı́a axial. Los ejes x1 y x2 pueden apuntar en cualquier dirección, manteniendo su mutua perpendicularidad. 202 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Un trompo libre de torque tiene τ = 0 y, por lo tanto l = cte. Por ejemplo, la fuerza de gravedad no ejerce torque sobre un trompo en caı́da libre o sobre un satélite artificial en órbita. Escogemos la dirección constante del vector l en la dirección del eje z, sobre el plano (x2 , x3 ). Entonces, l1 = 0. La simetrı́a axial implica que la descripción del movimiento no depende del valor del ángulo ψ; podemos fijar ψ = 0. Esto equivale a escoger la dirección del eje x1 paralela a la linea nodal. Figura 5.21: Rotación de un trompo libre. Sea θ el ángulo entre la dirección de l y el eje x3 . Las componentes de l son entonces l1 = 0, (5.104) l2 = l sin θ, (5.105) l3 = l cos θ. (5.106) En términos de los ángulos de Euler, las componentes de l (con ψ = 0) se pueden expresar como l1 = I11 Ω1 = I11 θ̇, (5.107) l2 = I22 Ω2 = I11 φ̇ sin θ, (5.108) l3 = I33 Ω3 = I33 (ψ̇ + φ̇ cos θ). (5.109) Luego, 0 = I11 θ̇ ⇒ θ = cte , (5.110) es decir, no hay movimiento de nutación en un trompo libre. Por otro lado, l sin θ = I11 φ̇ sin θ ⇒ φ̇ = l = cte , I11 (5.111) es decir, el eje axial x3 del trompo precesa con velocidad angular constante φ̇ alrededor de la dirección fija de l, describiendo un cono con vértice en el centro de masa del trompo y cuyo ángulo de vértice es θ. Entonces, todo el plano (x2 , x3 ) rota con velocidad angular φ̇ = cte alrededor de l. 5.5. ECUACIONES DE MOVIMIENTO PARA CUERPOS RÍGIDOS 203 La velocidad angular de rotación del trompo sobre su eje de simetrı́a x3 se obtiene de l cos θ = I33 (ψ̇ + φ̇ cos θ) l cos θ (I11 − I33 ) ⇒ ψ̇ = = cte . I11 I33 (5.112) (5.113) Las componentes de la velocidad angular Ω son Ω1 = Ω2 = Ω3 = θ̇ = 0, l sin θ = cte, I11 l cos θ = cte; I33 (5.114) (5.115) (5.116) por lo tanto, el vector Ω yace siempre sobre el plano (x2 , x3 ). Como el plano (x2 , x3 ) rota alrededor de l, entonces Ω también precesa alrededor de la dirección fija de l con velocidad angular φ̇ = cte. 5.5. Ecuaciones de movimiento para cuerpos rı́gidos Las ecuaciones de Lagrange para cuerpos rı́gidos pueden plantearse en términos de los ángulos de Euler, que describen los grados de libertad correspondientes al movimiento de rotación del cuerpo. La energı́a cinética de rotación de un cuerpo rı́gido está dada por la Ec. (5.38), 1X Trot = Iik Ωi Ωk , (5.117) 2 i,k Las componentes Ωi de la velocidad angular pueden expresarse en función de los ángulos de Euler (θ, φ, ψ) y de sus correspondientes velocidades, Ω1 = φ̇ sin θ sin ψ + θ̇ cos ψ, (5.118) Ω2 = φ̇ sin θ cos ψ − θ̇ sin ψ, (5.119) Ω3 = ψ̇ + φ̇ cos θ. (5.120) La energı́a potencial del cuerpo corresponde a la energı́a potencial de su centro de masa, y en general también puede expresarse en términos de los ángulos de Euler. Luego, el Lagrangiano de un cuerpo rı́gido puede expresarse como L = T − V = L(θ, φ, ψ, θ̇, φ̇, ψ̇, t). (5.121) En general, las ecuaciones de Lagrange para cuerpos rı́gidos pueden ser complicadas. Los casos mas simples son los que presentan simetrı́as, como los cuerpos con simetrı́a axial (trompos) o con simetrı́a esférica. 204 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Ejemplos. 1. Trompo de Lagrange. Consideremos un trompo de masa m en el campo gravitacional terrestre, y cuyo punto inferior O está fijo. Sea d la distancia, sobre el eje de simetrı́a del trompo, desde su centro de masa al punto fijo O. cm cm cm En este problema, denotamos como I11 = I22 6= I33 a los momentos de inercia del trompo con respecto a un sistema de coordenadas fijo en su centro de masa. Es conveniente tomar el sistema del laboratorio (x, y, z) y un sistema de coordenadas (x1 , x2 , x3 ) fijo en el cuerpo, ambos con origen en el punto O. Denotamos por d = (0, 0, d) el vector de posición del centro de masa del trompo con respecto a O en el sistema de coordenadas (x1 , x2 , x3 ). Figura 5.22: Trompo con punto inferior fijo. Consideremos los momentos de inercia con respecto al sistema de coordenadas (x1 , x2 , x3 ) fijo en el cuerpo con origen en O, el cual está ubicado en a = −d con respecto al centro de masa. De acuerdo al teorema de ejes paralelos, los momentos de inercia con respecto a los ejes (x1 , x2 , x3 ) del sistema centrado en O son cm Iik = Iik + m(a2 δik − ai ak ). (5.122) Luego, = cm I11 + md2 , (5.123) I22 = 2 + md , (5.124) I33 = cm I22 cm I33 6= I11 = I22 . (5.125) I11 La energı́a potencial del trompo, con respecto a O, es V = mgz = mgd cos θ. (5.126) 5.5. ECUACIONES DE MOVIMIENTO PARA CUERPOS RÍGIDOS 205 La energı́a cinética de traslación del centro de masa puede ser considerada constante (el trompo no se traslada con respecto al punto fijo O; la magnitud del vector d es constante). La energı́a cinética de rotación es Trot = 1 (I11 Ω21 + I22 Ω22 + I33 Ω23 ), 2 (5.127) donde las componentes de la velocidad angular Ω se pueden expresar en función de los ángulos de Euler, Ec. (5.118). Sustitución da Trot = 1 1 I11 (θ̇2 + φ̇2 sin2 θ) + I33 (ψ̇ + φ̇ cos θ)2 . 2 2 (5.128) También hubiéramos podido tomar ψ = 0 (eje x1 igual a la linea nodal) en las componentes de la velocidad angular, debido a la simetrı́a axial del trompo alrededor del eje x3 . El Lagrangiano del sistema es L=T −V = 1 1 I11 (θ̇2 + φ̇2 sin2 θ) + I33 (ψ̇ + φ̇ cos θ)2 − mgd cos θ. 2 2 (5.129) El sistema posee tres grados de libertad, dados por los ángulos de Euler θ, φ y ψ. La ecuación de Lagrange para ψ es d ∂L ∂L = 0. − dt ∂ ψ̇ ∂ψ (5.130) La coordenada ψ es cı́clica, ∂L ∂ψ ∂L ⇒ ∂ ψ̇ = 0 = I33 (ψ̇ + φ̇ cos θ) = I33 Ω3 = l3 = cte. La ecuación de Lagrange para φ es d ∂L ∂L − = 0. dt ∂ φ̇ ∂φ (5.131) (5.132) (5.133) La coordenada φ también es cı́clica, ∂L ∂φ ∂L ⇒ ∂ φ̇ = 0 (5.134) = (I11 sin2 θ + I33 cos2 θ)φ̇ + I33 ψ̇ cos θ = lz = cte. (5.135) 206 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Para interpretar las cantidades conservadas relacionadas con las coordenas cı́clicas ψ y φ, notamos que el torque ejercido por el peso del trompo (fuerza externa) es τ = −mgẑ×d = mgd(ẑ× x̂3 ), el cual tiene dirección perpendicular al plano (x3 , z), al igual que el vector dl del cambio de momento angular del trompo. Luego, no hay componentes del torque en las direcciones x̂3 ni ẑ, como tampoco hay cambios del vector momento angular en esas direcciones, por lo que l3 = cte y lz = cte. Figura 5.23: La dirección del torque τ es igual a la dirección del cambio de momento angular dl. La energı́a constituye una tercera cantidad conservada en este sistema, ∂L =0 ∂t ⇒ E = T + V = cte. (5.136) Luego, 1 1 I11 (θ̇2 + φ̇2 sin2 θ) + I33 (ψ̇ + φ̇ cos θ)2 + mgd cos θ = cte. (5.137) 2 2 Las tres cantidades conservadas, l3 , lz y E, hacen que este sistema sea integrable. E= Despejando ψ̇ y φ̇ de la Ecs. (5.132) y (5.135) en términos de θ, tenemos φ̇ = (lz − l3 cos θ) 0 sin2 θ I11 (5.138) ψ̇ = l3 − I33 φ̇ cos θ l3 (lz − l3 cos θ) cos θ = − . 0 sin2 θ I33 I33 I11 (5.139) Sustituyendo estas expresiones para ψ̇ y φ̇ en la ecuación Ec. (5.137), obtenemos E= 1 (lz − l3 cos θ)2 l32 I11 θ̇2 + + + mgd cos θ, 0 sin2 θ 2 2I33 2I11 (5.140) lo cual se puede escribir como E0 = 1 I11 θ̇2 + Vef (θ) = cte, 2 (5.141) donde E0 = Vef (θ) = l32 = cte, 2I33 (lz − l3 cos θ)2 + mgd cos θ. 2I11 sin2 θ E− (5.142) (5.143) 5.5. ECUACIONES DE MOVIMIENTO PARA CUERPOS RÍGIDOS 207 Figura 5.24: Esquema del potencial efectivo Vef (θ). La Ec. (5.141) constituye un problema unidimensional equivalente para la coordenada θ, con un potencial efectivo Vef (θ) dado por la Ec. (5.143). Notemos que Vef (θ = 0) → ∞, Vef (θ = π) → ∞. (5.144) El potencial efectivo Vef (θ) posee un valor mı́nimo para un ángulo θ0 tal que ∂Vef = 0. (5.145) ∂θ θ0 El movimiento posible del ángulo θ ocurre para valores tales que E 0 ≥ Vef (θ). Los puntos de retorno θ1 y θ2 están dados por las soluciones de la ecuación E 0 = Vef (θ) = (lz − l3 cos θ)2 + mgd cos θ; 2I11 sin2 θ (5.146) luego, el movimiento ocurre en el intervalo θ ∈ [θ1 , θ2 ]. De la Ec. (5.141) obtenemos dθ θ̇ = = dt s 2(E 0 − Vef (θ)) I11 (5.147) y t(θ) = p Z p I11 dθ 2 (E 0 − Vef (θ)) . (5.148) La integral en la Ec. (5.148) corresponde a una integral de funciones elı́pticas. En principio, t(θ) permite obtener θ(t) por inversión. Sustitución de θ(t) en las Ecs. (5.138) y (5.139) permite calcular ψ(t) y φ(t) por integración directa. Luego, el trompo de Lagrange es un sistema integrable: existen tres grados de libertad ψ, φ y θ, y tres cantidades conservadas, l3 , lz y E, asociadas a simetrı́as del sistema. El perı́odo de nutación es Tnut p Z = 2 I11 θ2 θ1 dθ p 2 (E 0 − Vef (θ)) . (5.149) 208 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS La velocidad angular de precesión φ̇, dada por la Ec. (5.138), cambia su dirección instantánea en los puntos de retorno θ1 y θ2 , dependiendo del signo de (lz − l3 cos θ) en esos puntos, según los siguientes casos: a) φ̇ > 0 siempre (lz > l3 cos θ, ∀ θ). b) φ̇ cambia de signo en θ1 ó en θ2 (el sentido del movimiento depende de condiciones iniciales). c) φ̇ = 0 en θ1 ó en θ2 (lz = l3 cos θ1,2 ). Figura 5.25: Movimiento de nutación en θ y de precesión en φ. Izquierda: φ̇ > 0, no cambia de signo. Centro: φ̇ cambia de signo en θ = θ1 . Derecha: φ̇ = 0 en θ = θ1 . Puesto que el trompo tiene simetrı́a axial, se puede tomar ψ = 0 en las componentes de la velocidad angular; luego Ω1 = θ̇. La velocidad angular de nutación θ̇ es una función periódica (con un perı́odo largo) en el tiempo. Figura 5.26: Velocidad angular de nutación θ̇ = Ω1 en función del tiempo para un trompo simétrico, I11 = I22 6= I33 con su punto inferior fijo. 2. Trompo de Kovalevskaya. Además del trompo de Lagrange, se conoce otro caso integrable de un trompo simétrico en un campo gravitacional con un punto fijo a una distancia d de su centro de masa. 5.5. ECUACIONES DE MOVIMIENTO PARA CUERPOS RÍGIDOS 209 Supongamos que el vector de posición d del centro de masa con respecto al punto fijo O es perpendicular al eje de simetrı́a del trompo, y supongamos que los momentos principales de inercia con respecto al sistema fijo en el cuerpo satisfacen la condición I11 = I22 = 2I33 . (5.150) Este sistema se conoce como el trompo de Kovalevskaya, y es un problema famoso de la Mecánica. Figura 5.27: Trompo de Kovalevskaya. Izquierda: Posición d del centro de masa con respecto al punto fijo O. Derecha: Proyección del vector d en la dirección z corresponde a la altura del centro de masa. Escogemos el punto fijo O como origen, tanto para el sistema del laboratorio (x, y, z) como para el sistema de coordenadas (x1 , x2 , x3 ) fijo en el cuerpo, tal que x3 corresponde al eje de simetrı́a del trompo. Entonces, el vector de posición d del centro de masa del trompo con respecto a O se encuentra sobre el plano (x1 , x2 ). Podemos escoger el vector d = (d, 0, 0) en la dirección x1 . Note que si d = (0, 0, d), en la dirección x3 , tenemos el caso de un trompo de Lagrange con momentos de inercia dados por la Ec. (5.150). Definimos el vector unitario en la dirección del eje z, ẑ = (z1 , z2 , z3 ), (5.151) cuyas componentes en el sistema de coordenadas (x1 , x2 , x3 ) fijo en el cuerpo son z1 = sin θ sin ψ, (5.152) z2 = sin θ cos ψ, (5.153) z3 = cos θ. (5.154) La energı́a cinética del trompo se debe a su rotación, y está dada por T = Trot = 1 (I11 Ω21 + I22 Ω22 + I33 Ω23 ). 2 (5.155) 210 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS La energı́a potencial del trompo corresponde a la energı́a potencial de su centro de masa en el campo gravitacional terrestre, V = mgz = mg ẑ · d = mgd sin θ sin ψ. (5.156) El Lagrangiano del sistema, en términos de los ángulos de Euler, es 2 2 L = I33 φ̇ sin θ sin ψ + θ̇ cos ψ + I33 φ̇ sin θ cos ψ − θ̇ sin ψ 2 0 I33 ψ̇ + φ̇ cos θ − mgd sin θ sin ψ + 2 2 I33 = I33 (θ̇2 + φ̇2 sin2 θ) + ψ̇ + φ̇ cos θ − mgd sin θ sin ψ. (5.157) 2 La coordenada φ es cı́clica, por lo que su momento conjugado es constante, ∂L = 2I33 φ̇ sin2 θ + I33 ψ̇ + φ̇ cos θ cos θ ∂ φ̇ h i = I33 φ̇(1 + sin2 θ) + ψ̇ cos θ ≡ lz = cte. (5.158) La cantidad conservada es la componente z del momento angular, puesto que el torque ejercido por la fuerza gravitacional es perpendicular a la dirección z. El Lagrangiano no depende explicitamente del tiempo, lo que implica que la energı́a mecánica total se conserva, E = T + V = cte. = I33 (θ̇2 + φ̇2 sin2 θ) + 2 I33 ψ̇ + φ̇ cos θ + mgd sin θ sin ψ. (5.159) 2 El sistema posee tres grados de libertad (los ángulos de Euler) y dos cantidades conservadas E y lz , relacionadas con las simetrı́as explı́citas del Lagrangiano del sistema. Sofı́a Kovalevskaya encontró una tercera cantidad conservada no trivial, 2 2 mgd mgd K ≡ Ω21 − Ω22 − z1 + 2Ω1 Ω2 − z2 = cte. I33 I33 (5.160) Sustitución de Ω1 , Ω2 , z1 y z2 en términos de los ángulos de Euler, conduce a la expresión i 2 mgd h 2 θ − φ̇2 sin2 θ sin ψ − 2θ̇φ̇ sin θ cos ψ sin θ K = θ̇2 − φ̇2 sin2 θ + 2 I33 2 mgd + sin2 θ = cte. (5.161) 0 I33 La existencia de la constante de Kovalevskaya K, junto con E y lz , permite que este sistema sea integrable, aunque el procedimiento matemático para resolver las 5.5. ECUACIONES DE MOVIMIENTO PARA CUERPOS RÍGIDOS 211 ecuaciones de movimiento es bastante laborioso. La constante K no tiene una interpretación fı́sica directa, como E, lz o l3 . La simetrı́a asociada con la cantidad conservada K no es en absoluto evidente. El método desarrollado por Kovalevskaya para encontrar esta cantidad conservada no trivial sigue siendo un tema abierto de investigación. Se han descubierto unos pocos sistemas dinámicos que poseen cantidades conservadas no triviales para ciertos valores de sus parámetros, y que están relacionadas con simetrı́as no evidentes (también llamadas ocultas) del sistema. Figura 5.28: Izquierda: Sofı́a Kovalevskaya (1850 -1891). Derecha: Movimiento del eje del trompo de Kovalevskaya en el espacio. A pesar de su apariencia, el movimiento no es caótico. 3. Consideremos un trompo asimétrico, I11 6= I22 6= I33 , con un punto fijo sobre su eje x3 . En ese caso, no existen suficientes simetrı́as en el sistema, por lo que éste no es integrable. Bajo estas condiciones, el movimiento del cuerpo es caótico para ciertos valores de parámetros. Figura 5.29: Movimiento caótico de un trompo asimétrico con su punto inferior fijo sobre su eje x3 . (a) Ω1 vs. t. (b) Diferencia ∆Ω1 vs. t para dos trayectorias correspondientes a dos condiciones iniciales separadas en ∆Ω1 (0) = 10−6 . (c) Movimiento caótico del eje del trompo en el espacio. 212 5.6. CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Ecuaciones de Euler para cuerpos rı́gidos En el ejemplo de un trompo simétrico con su punto inferior fijo, vimos como las ecuaciones de movimiento de un cuerpo rı́gido se pueden derivar a partir del Lagrangiano del sistema expresado en términos de los ángulos de Euler. Alternativamente, es posible derivar las ecuaciones de movimiento a partir de las relaciones de tranformación de cantidades vectoriales, desde el sistema de coordenadas del laboratorio (x, y, z) al sistema (x1 , x2 , x3 ) con origen en el centro de masa y que se mueve con el cuerpo. Para hacer esto, consideremos que los orı́genes de ambos sistemas de coordenadas coinciden y observemos un vector A en ambos sistemas. El sistema (x1 , x2 , x3 ) puede rotar con una velocidad angular intantánea Ω. Un cambio infinitesimal en el vector A observado en ambos sistemas de coordenadas solamente puede diferir debido al efecto causado por la rotación de los ejes (x1 , x2 , x3 ), es decir, dA(x,y,z) = dA(x1 ,x2 ,x3 ) + dArot . (5.162) El cambio dArot causado por la rotación de (x1 , x2 , x3 ) no modifica la magnitud del vector A, sino su dirección, al igual que un vector posición r de una partı́cula del cuerpo rı́gido mantiene su magnitud en el sistema de coordenadas fijo en el cuerpo. En ese caso, vimos que un cambio dr es el resultado de una rotación infinitesimal dΦ alrededor de un eje instantáneo que pasa por el origen del sistema (x1 , x2 , x3 ), y está dado por la Ec. (5.5), dr = dΦ × r. Luego, dArot = dΦ × A, (5.163) donde dΦ = Ω dt. La variaciones temporales del vector A, vistas por dos observadores en los sistemas de coordenadas (x, y, z) y (x1 , x2 , x3 ), están relacionadas por dA dA = + Ω × A. (5.164) dt (x,y,z) dt (x1 ,x2 ,x3 ) Esta relación es general para cualquier vector A. En particular, si A = l, dl dl = + Ω × l. (5.165) dt (x,y,z) dt (x1 ,x2 ,x3 ) dl Pero el torque en el sistema (x, y, z) es τ = . Luego, podemos escribir dt (x,y,z) dl τ = + Ω × l. (5.166) dt (x1 ,x2 ,x3 ) P Las componentes de l en el sistema (x1 , x2 , x3 ) están dadas por li = k Iik Ωk . Luego, la componente i de la Ec. (5.166) es X τi = Iik Ω̇k + (Ω × l)i , i = 1, 2, 3. (5.167) k Las Ecs. (5.166) constituyen las ecuaciones de Euler para cuerpos rı́gidos. 5.6. ECUACIONES DE EULER PARA CUERPOS RÍGIDOS 213 Si Iik es diagonal, podemos escribir las ecuaciones de Euler como τ1 = I11 Ω̇1 + Ω2 Ω3 (I33 − I22 ), τ2 = I22 Ω̇2 + Ω1 Ω3 (I11 − I33 ), τ3 = I33 Ω̇3 + Ω1 Ω2 (I22 − I11 ). (5.168) Las ecuaciones de Euler representan una alternativa útil para analizar el movimiento de cuerpos rı́gidos en muchas situaciones. Las ecuaciones de Euler son ecuaciones diferenciales de primer orden para las componentes Ωi de la velocidad angular, mientras que las ecuaciones de Lagrange corresponden a ecuaciones diferenciales de segundo orden para los ángulos de Euler, que son las coordenadas generalizadas para un cuerpo rı́gido. Puesto que las componentes Ωi se pueden expresar en términos de ángulos de Euler, ambas descripciones son equivalentes. Ejemplos. 1. Trompo de Euler. Consiste en cuerpo rı́gido asimétrico, I11 6= I22 6= I33 , y libre de torque, τ = 0. Puesto que no hay torque, l = cte, i.e., la dirección y la magnitud del vector momento angular son constantes. Por otro lado, el Lagrangiano de este sistema es independiente del tiempo; luego la energı́a E se conserva. Existen tres grados de libertad (los tres ángulos de Euler) y tres cantidades conservadas (dirección de l, magnitud l y E); por lo tanto, este sistema es integrable. Este sistema puede considerarse como un trompo asimétrico con su centro de masa fijo en el campo gravitacional terrestre; esto es; la distancia desde un punto fijo a su centro de masa es d = 0. El trompo de Lagrange (d = (0, 0, d)), el trompo de Kovasvkaya (d = (d, 0, 0)) y el trompo de Euler (d = (0, 0, 0)) constituyen los casos conocidos de cuerpos rı́gidos en un campo gravitacional que son sistemas integrables. Supongamos los momentos de inercia tales que I33 > I22 > I11 . El movimiento se analiza más fácilmente en términos de las componentes Ωi de la velocidad angular en el sistema de coordenadas (x1 , x2 , x3 ), usando las ecuaciones de Euler para cuerpos rı́gidos, Ecs. (5.168). La dirección del vector l, vista en el sistema de coordenadas (x1 , x2 , x3 ) fijo en el cuerpo, no es constante; pero la magnitud l y la energı́a, que son cantidades escalares, sı́ lo son. La magnitud de la velocidad angular en el sistema de coordenadas (x1 , x2 , x3 ) es 2 2 2 l2 = l12 + l22 + l32 = I11 Ω21 + I22 Ω22 + I33 Ω23 = cte, donde hemos utilizado li = Iii Ωi . (5.169) 214 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS La energı́a es E= 1 I11 Ω21 + I22 Ω22 + I33 Ω23 = cte. 2 (5.170) Luego, las componentes de l satisfacen el par de ecuaciones l22 l32 l12 + + = 1, 2EI11 2EI22 2EI33 l12 + l22 + l32 = l2 . (5.171) (5.172) La un elipsoide √ecuación describe √ √ en las componentes (l1 , l2 , l3 )√con semiejes √ primera 2EI11 , 2EI22 y 2EI33 , donde 2EI33 es el semieje mayor y 2EI11 es el semieje menor. La segunda ecuación corresponde a una esfera de radio igual a l en el sistema (x1 , x2 , x3 ). Ambas ecuaciones deben satisfacerse simultáneamente. Luego, el movimiento relativo del vector l descrito en el sistema de coordenadas (x1 , x2 , x3 ) debe ocurrir sobre una trayectoria de intersección de las dos superficies, el elipsoide y la esfera, vistas en ese sistema. La condición para que exista tal intersección es que el radio de la esfera se encuentre entre el semieje menor y el semieje mayor del elipsoide, es decir, 2EI11 < l2 < 2EI33 . (5.173) Figura 5.30: Movimiento de l en (x1 , x2 , x3 ) para un cuerpo rı́gido asimétrico libre. Las intersecciones de la esfera con el elipsoide corresponden a curvas cerradas alrededor de los ejes x1 y x3 . Luego, el movimiento del vector l relativo al sistema (x1 , x2 , x3 ) fijo en el cuerpo debe ser periódico; durante un perı́odo de oscilación el vector l describe una especie de superficie cónica alrededor de x1 o de x3 , y regresa a su posición original. Las ecuaciones de Euler (5.168) para un cuerpo asimétrico libre, con τ1 = τ2 = τ3 = 0, son I11 Ω̇1 + Ω2 Ω3 (I33 − I22 ) = 0, (5.174) I22 Ω̇2 + Ω1 Ω3 (I11 − I33 ) = 0, I33 Ω̇3 + Ω1 Ω2 (I22 − I11 ) = 0. 5.6. ECUACIONES DE EULER PARA CUERPOS RÍGIDOS 215 Estas tres ecuaciones, junto con las dos cantidades conservadas l (Ec. (5.169)) y E (Ec. (5.170)), son integrables. En efecto, multiplicando la Ec. (5.170) por 2I33 y restando la Ec. (5.169), obtenemos 2EI33 − l2 = I11 (I33 − I11 )Ω21 + I22 (I33 − I22 )Ω22 . (5.175) Despejamos Ω1 en función de Ω2 , Ω21 = (2EI33 − l2 ) − I22 (I33 − I22 )Ω22 . I11 (I33 − I11 ) (5.176) Por otro lado, multiplicando la Ec. (5.170) por 2I11 y restando ésta de la Ec. (5.169), tenemos l2 − 2EI11 = I22 (I22 − I11 )Ω22 + I33 (I33 − I11 )Ω23 . (5.177) Despejando Ω3 en función de Ω2 , Ω23 = (l2 − 2EI11 ) − I22 (I22 − I11 )Ω22 . I33 (I33 − I11 ) (5.178) Sustituyendo las expresiones de Ω1 y de Ω2 en la segunda de las ecuaciones Ec. (5.174), Ω̇2 = Ω1 Ω2 (I33 − I11 ) , I22 (5.179) obtenemos una ecuación diferencial que depende solamente de Ω2 , Ω̇2 = 1/2 dΩ2 1 = (2EI33 − l2 ) − I22 (I33 − I22 )Ω22 1/2 dt I22 [I11 I33 ] 1/2 × (l2 − 2EI11 ) − I22 (I22 − I11 )Ω22 . (5.180) De la Ec. (5.180), podemos calcular t = t(Ω2 ) mediante integración explı́cita en términos de funciones elı́pticas y, por inversión, obtenemos Ω2 (t). Sustitución de Ω2 (t) en Ec. (6.323) y en la Ec. (5.178) permite obtener Ω1 (t) y Ω3 (t), respectivamente. La dependencia temporal de los ángulos de Euler (θ, φ, ψ) para el cuerpo rı́gido ası́metrico puede obtenerse sustituyendo las soluciones Ωi (t) en las Ecs. (5.22); sin embargo, el procedimiento es laborioso. Este ejemplo ilustra las dificultades matemáticas generadas por la presencia de no linealidades en las ecuaciones de evolución de sistemas dinámicos, aunque éstos sean integrables. Puesto que el movimiento del vector l relativo al sistema (x1 , x2 , x3 ) es periódico, podemos simplificar las ecuaciones Ecs. (5.174) considerando el movimiento de pequeñas oscilaciones de l alrededor de los ejes x1 , x2 y x3 . 216 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS i) Pequeñas oscilaciones de l alrededor de x1 . Supongamos que las componentes l2 y l3 son pequeñas. Entonces, las relaciones l2 = I22 Ω2 , l3 = I33 Ω3 , (5.181) implican que también las componentes Ω2 y Ω3 son pequeñas. Luego, el producto Ω2 Ω3 es muy pequeño y puede ser despreciado en la ecuación de Euler para Ω̇1 en las Ecs. (5.174), lo cual da Ω̇1 ≈ 0 ⇒ Ω1 ≈ cte. (5.182) Entonces, la segunda y la tercera de las ecuaciones de Euler Ecs. (5.174) dan Ω̇2 = Ω̇3 = (I33 − I11 ) Ω1 Ω3 , I22 (I22 − I11 ) − Ω1 Ω 2 . I33 (5.183) (5.184) Derivando respecto al tiempo la Ec. (5.183) o la Ec. (5.184), y sustituyendo el resultado en la otra ecuación, tenemos Ω̈2,3 = − (I33 − I11 )(I22 − I11 ) 2 Ω1 Ω2,3 , I22 I33 (5.185) la cual se puede escribir como la ecuación de un oscilador armónico, Ω̈2,3 = −ωx21 Ω2,3 , (5.186) con ωx21 > 0, donde s ωx1 = Ω1 (I33 − I11 )(I22 − I11 ) , I22 I33 (5.187) es la frecuencia de pequeñas oscilaciones estables del vector l alrededor del eje x1 . ii) Pequeñas oscilaciones de l alrededor del eje x3 . En este caso, asumimos que las componentes l1 y l2 son pequeñas y, por lo tanto, Ω1 y Ω2 también son pequeñas. Despreciando el producto Ω1 Ω2 en la ecuación de Euler para Ω̇3 en las Ecs. (5.174), obtenemos I33 Ω̇3 ≈ 0 ⇒ Ω3 ≈ cte. (5.188) La primera y la segunda de las ecuaciones Ecs. (5.174) dan Ω̇1 = Ω̇2 = (I33 − I22 ) Ω3 Ω2 , I11 (I33 − I11 ) Ω3 Ω 1 , I22 − (5.189) (5.190) 5.6. ECUACIONES DE EULER PARA CUERPOS RÍGIDOS 217 las cuales conducen a Ω̈1,2 Ω̈1,2 (I33 − I22 )(I33 − I11 ) 2 Ω3 Ω1,2 I11 I22 = −ωx23 Ω1,2 , = − (5.191) (5.192) con ωx23 > 0, donde s ωx3 = Ω3 (I33 − I22 )(I33 − I11 ) . I11 I22 (5.193) es la frecuencia de pequeñas oscilaciones estables del vector l alrededor del eje x3 . iii) Pequeñas oscilaciones de l alrededor del eje x2 . Entonces, tomamos las componentes l1 y l3 pequeñas y también Ω1 y Ω3 . Entonces el producto Ω1 Ω3 puede despreciarse en la ecuación de Euler para Ω̇3 en las Ecs. (5.174), lo cual da I22 Ω̇2 ≈ 0 ⇒ Ω2 ≈ cte. (5.194) La primera y la tercera de las ecuaciones Ecs. (5.174) dan Ω̇1 Ω̇3 (I33 − I22 ) Ω 3 Ω2 , I11 (I22 − I11 ) = − Ω 2 Ω1 . I33 = − (5.195) (5.196) las cuales llevan a Ω̈1,3 Ω̈1,3 (I33 − I22 )(I22 − I11 ) 2 Ω2 Ω1,3 I11 I33 = ωx22 Ω1,3 , = (5.197) (5.198) con ωx22 > 0, donde s ωx2 = Ω2 (I33 − I22 )(I22 − I11 ) . I11 I33 (5.199) En este caso, las soluciones Ω1,3 = Keωx2 t crecen con el tiempo y, por lo tanto, las componentes l1 y l3 aumentan. Luego, el vector l se aleja del eje x2 y el movimiento de pequeñas oscilaciones de l alrededor de x2 es inestable. 2. Movimiento libre de un trompo simétrico (I11 = I22 6= I33 ). Este sistema fue analizado en la Sec. (5.4) considerando la conservación de su momento angular. También puede verse como un caso especial del trompo de Euler. Las ecuaciones de Euler (5.168) se reducen a I11 Ω̇1 = −Ω2 Ω3 (I33 − I11 ) I11 Ω̇2 = Ω1 Ω3 (I33 − I11 ) I33 Ω̇3 = 0. (5.200) 218 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS La tercera equación da Ω3 = cte. Puesto que l3 = l cos θ, tenemos l3 = I33 Ω3 = l cos θ ⇒ Ω3 = l cos θ = cte I33 ⇒ θ = cte. (5.201) La primera y la segunda ecuación se pueden entonces escribir como Ω̇1 = −ωΩ2 , (5.202) Ω̇2 = −ωΩ1 , (5.203) donde definimos ω= (I33 − I11 ) (I33 − I11 ) Ω3 = l cos θ = cte. I11 I11 I33 (5.204) Luego, Ω̈1 = −ω Ω̇2 ⇒ Ω̈1 = −ω 2 Ω1 . (5.205) Las soluciones para Ω1 y Ω2 son Ω1 = A cos ωt, Ω2 = A sin ωt, (5.206) donde A = (Ω21 + Ω22 )1/2 es constante. Si tomamos la dirección constante de l en la dirección z, entonces Ω rota con respecto a la dirección de l, manteniendo su proyección Ω3 sobre el eje x3 constante, mientras que su proyección sobre el plano (x1 , x2 ) rota con velocidad angular constante ω. Figura 5.31: Movimiento libre de un trompo. La velocidad angular de precesión φ̇, tanto del eje x3 como del vector Ω, alrededor de l (eje z) se puede calcular a partir de l2 = I22 Ω2 = l sin θ. (5.207) 5.6. ECUACIONES DE EULER PARA CUERPOS RÍGIDOS 219 Sustituyendo la expresión de Ω2 en términos de los ángulos de Euler, y tomando ψ = 0 (usando la simetrı́a axial del trompo), tenemos I22 φ̇ sin θ = l sin θ ⇒ φ̇ = l . I11 (5.208) La velocidad angular de rotación ψ̇ del trompo sobre su eje x3 se puede calcular usando Ω3 = ⇒ ψ̇ = ψ̇ + φ̇ cos θ Ω3 − φ̇ cos θ l l cos θ − cos θ = I33 I11 (I33 − I11 ) = l cos θ = ω. I11 I33 (5.209) (5.210) (5.211) (5.212) El vector Ω ejecuta dos rotaciones, vistas desde los dos sistemas de referencia: una rotación en el sistema (x, y, z) describiendo un cono alrededor de la dirección z = l, con velocidad angular de precesión φ̇; y una rotación en el sistema (x1 , x2 , x3 ) describiendo otro cono alrededor del eje x3 del trompo, con velocidad angular ω = ψ̇. El vector l también rota con velocidad angular ψ̇ alrededor de x3 , visto desde el sistema (x1 , x2 , x3 ). Figura 5.32: Rotación del vector Ω en los sistemas de referencia (x, y, z) y (x1 , x2 , x3 ). 3. El girocompás. Es un instrumento usado en la navegación que permite indicar el Norte geográfico sin referencia al campo magnético terrestre. Consiste en un disco con momentos principales de inercia I11 = I22 6= I33 , el cual gira con velocidad angular constante ω alrededor del eje perpendicular a su plano, que llamamos x3 . Simultáneamente, el disco puede rotar libremente un ángulo θ alrededor de un eje perpendicular a x3 , como se muestra en la Fig. (5.33). 220 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Figura 5.33: Girocompás. Sea ν la magnitud de la velocidad angular de la Tierra alrededor de su eje NorteSur, y supongamos que ω ν. Llamemos α al ángulo de latitud sobre el Ecuador del instrumento. Consideremos el sistema de coordenadas (x, y, z) fijo en la Tierra y el sistema (x1 , x2 , x3 ) con origen en el centro de masa del disco, como se indica en la Fig. (5.34). Figura 5.34: Sistemas de referencia (x, y.z) y (x1 , x2 , x3 ) para el girocompás. Izquierda: velocidad angular de la Tierra y latitud α del instrumento. Derecha: vista instantánea del girocompás desde el eje x2 , paralelo al eje y y a la dirección de θ̇. La dirección Norte-Sur local, NS, corresponde al eje z. Las componentes de la velocidad angular de la Tierra en (x, y.z) son νx = 0, (5.213) νy = ν sin α, (5.214) νz = ν cos α. (5.215) Supongamos que la dirección de θ̇ en un instante dado está sobre el eje x2 (simetrı́a del disco permite esta simplificación). Entonces, las componentes de la velocidad 5.6. ECUACIONES DE EULER PARA CUERPOS RÍGIDOS 221 angular instantánea Ω del disco en (x1 , x2 , x3 ) se pueden expresar como (Fig. (5.34)) Ω1 = −νz sin θ = −ν cos α sin θ, (5.216) Ω2 = νy + θ̇ = ν sin α + θ̇, (5.217) Ω3 = νz cos θ + ω = ν cos α cos θ + ω. (5.218) Puesto que el instrumento es libre de rotar sobre el eje y, no hay componente del torque en dirección de y, que corresponde en este instante al eje x2 . Entonces, consideremos la ecuación de Euler Ec. (5.168) correspondiente a τ2 = 0, τ2 = I22 Ω̇2 + Ω1 Ω3 (I11 − I33 ) = 0. (5.219) Sustitución de las componentes de Ω da I11 θ̈ + (I33 − I11 )ν cos α sin θ (ν cos α cos θ + ω) = 0, (5.220) donde hemos usado I11 = I22 . Pero ω ν, lo cual implica que ω ν cos α cos θ. Luego, podemos escribir I11 θ̈ + (I33 − I11 )νω cos α sin θ ≈ 0. (5.221) La Ec. (5.221) tiene la misma forma que la ecuación de movimiento de un péndulo simple. En el lı́mite de pequeñas oscilaciones en θ, tenemos sin θ ≈ θ. Luego, θ̈ + (I33 − I11 ) νω cos α θ ≈ 0. I11 (5.222) La Ec. (5.222) es similar a la ecuación de un oscilador armónico, θ̈ + ωc2 θ ≈ 0, (5.223) donde (I33 − I11 ) νω cos α, (5.224) I11 es la frecuencia para pequeñas oscilaciones del eje x3 del disco alrededor del eje z, que apunta hacia el Norte. Luego, el punto de equilibrio θ = 0 de la oscilación del eje x3 señala la dirección del Norte geográfico. ωc2 = Notemos que la medida directa de la frecuencia de oscilación ωc en la Ec. (5.223) permite a su vez calcular la latitud α sin ninguna referencia externa. Por ejemplo, ωc = 0 ⇒ ωc = máxima ⇒ α= π 2, α = 0, Polo Norte. (5.225) Ecuador. (5.226) 4. Efecto Coriolis. Una aplicación importante de la Ec. (5.164) es la descripción del movimiento de una partı́cula en un sistema en rotación, y por tanto, no inercial. 222 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Figura 5.35: Gaspard-Gustave de Coriolis (1792-1843). Sean (x, y, z, ) un sistema inercial (por ejemplo, con respecto a las estrellas fijas) y (x1 , x2 , x3 ) un sistema de coordenadas en rotación (por ejemplo, la Tierra) con velocidad angular constante Ω relativa al sistema inercial. Entonces, la Ec. (5.164) aplicada al vector de posición r de la partı́cula desde el origen común de ambos sistemas da v = vrot + Ω × r, (5.227) donde suprimimos el subı́ndice (x, y, z) en las cantidades referidas al sistema inercial y usamos el subı́ndice “rot” en lugar de (x1 , x2 , x3 ) para las cantidades medidas en el sistema en rotación. La derivada temporal del vector v vista por dos observadores en los sistemas de coordenadas (x, y, z) y (x1 , x2 , x3 ) está dada a su vez por la Ec. (5.164), dv dv = + Ω × v. (5.228) dt dt rot Sustituyendo Ec. (5.227) en la Ec. (5.228), tenemos dvrot dv + Ω × vrot + Ω × (vrot + Ω × r) = dt dt rot dvrot = + 2Ω × vrot + Ω × (Ω × r). dt rot Multiplicando por la masa de la partı́cula m, la Ec. (5.229) queda dv dvrot m =m + 2mΩ × vrot + mΩ × (Ω × r). dt dt rot (5.229) (5.230) La ecuación de movimiento en el sistema inercial (x, y, z) es simplemente F=m dv . dt (5.231) 5.6. ECUACIONES DE EULER PARA CUERPOS RÍGIDOS 223 Entonces, la Ec. (5.230) puede expresarse como F − 2mΩ × vrot − mΩ × (Ω × r) = m dvrot dt . (5.232) rot Luego, para un observador en el sistema en rotación, el movimiento de la partı́cula se describe como si ésta estuviera sujeta a una fuerza efectiva dvrot , (5.233) Fef = m dt rot donde Fef = F + Fco + Fc , (5.234) e identificamos Fc = −mΩ × (Ω × r) (5.235) 2 como la fuerza centrı́fuga, cuya magnitud es la expresión familiar Fc = mΩ r sin θ, donde θ es el ángulo entre Ω y r, mientras que el término Fco = 2m vrot × Ω (5.236) se denomina fuerza de Coriolis. Tanto la fuerza de Coriolis como la fuerza centrı́fuga son fuerzas ficticias, introducidas por un observador en el sistema no inercial en rotación para describir el movimiento de una partı́cula. En particular, la fuerza de Coriolis es un ejemplo de una fuerza dependiente de la velocidad. Figura 5.36: Desviación de la trayectoria de un proyectil en la Tierra debida al efecto Coriolis. Izquierda: hemisferio Norte. Derecha: hemisferio Sur. 224 5.7. CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS Problemas 1. Una moneda de masa m y radio a está rodando sin deslizar por el suelo con velocidad de magnitud constante v, describiendo una circunferencia de radio R y manteniendo un ángulo constante θ con respecto al suelo. Determine θ. 2. Un placa uniforme, formada por un triángulo con dos lados iguales de longitud a, rota con velocidad angular ω alrededor de un eje que pasa por uno de esos lados. a) Calcule el vector de momento angular de la placa. b) Calcule la energı́a cinética de la placa. 3. Un trompo uniforme de masa M con su extremo inferior fijo en el suelo está girando sobre su eje de simetrı́a con velocidad angular Ω, inicialmente en posición vertical (θ = 0, θ̇ = 0). Los momentos principales de inercia son I3 , I1 = I2 . El centro de masa se ubica a una distancia a del punto inferior del trompo. a) Encuentre las cantidades conservadas en el sistema en función de las condiciones iniciales. b) Calcule el ángulo máximo que se puede inclinar el trompo. 4. Un disco uniforme de masa m y radio a está girando con velocidad angular constante Ω alrededor de un eje que pasa por su centro y que forma un ángulo θ con la normal a la superficie del disco. a) Calcule el valor de θ para que el ángulo entre la velocidad angular y el momento angular del disco sea de 15o . b) Encuentre la energı́a cinética del disco. 5. Calcule los momentos principales de inercia de un cono uniforme de masa M , altura h y base circular de radio R. 6. Una placa semicircular uniforme de masa m y radio a se encuentra sobre una superficie plana. Calcule la frecuencia de pequeñas oscilaciones de la placa alrededor de su posición de equilibrio. 7. Un aro de masa M y radio R está girando con velocidad angular constante Ω alrededor de un eje que pasa por su centro y que forma un ángulo α con la normal al plano del aro. Calcule la magnitud y dirección del momento angular del aro. 8. Un cilindro de densidad uniforme ρ, radio R y altura h gira con velocidad angular constante ω alrededor de su eje longitudinal. El cilindro tiene una cavidad esférica de radio R/2 tangente a su eje. Calcule la energı́a cinética del cilindro. 5.7. PROBLEMAS 225 9. Una varilla uniforme de longitud 2l posee sus extremos en contacto sin fricción con un aro vertical fijo de radio R > l. Calcule la frecuencia de pequeñas oscilaciones de la varilla. 10. Un hemisferio sólido y uniforme de masa M y radio R se encuentra sobre una superficie plana. Calcule la frecuencia de pequeñas oscilaciones del hemisferio alrededor de su posición de equilibrio. 11. Una varilla de masa m y longitud l tiene un extremo en una pared y el otro en el suelo. Desprecie la fricción. a) Encuentre la ecuación de movimiento de la varilla. b) Si la varilla se suelta desde el reposo, formando un ángulo α con el suelo, calcule la velocidad de su centro de masa cuando la varilla choca contra el suelo. c) Determine el tiempo que tarda en chocar. 226 CAPÍTULO 5. MOVIMIENTO DE CUERPOS RÍGIDOS 12. Una placa rectangular uniforme, de masa m y lados a y 2a, está rotando con velocidad angular constante ω alrededor de una de sus diagonales. a) Encuentre la energı́a cinética de rotación de la placa. b) Determine la magnitud del momento angular de la placa. c) Encuentre el ángulo entre el momento angular y la velocidad angular. 13. Encuentre la frecuencia para pequeñas oscilaciones de un péndulo plano formado por varilla de masa despreciable, con un extremo fijo y el otro extremo unido a una esfera de radio R y masa M . 14. Tres estrellas, con masas m1 , m2 y m3 , se encuentran ubicadas en el espacio formando los vértices de un triángulo equilátero. Determine la velocidad angular del movimiento de rotación tal que esta configuración permanezca invariante. 15. Un cono circular uniforme de altura h, ángulo de vértice α y masa m rueda sobre su lado sin deslizar sobre el plano horizontal (x, y). a) Encuentre la energı́a cinética. c) Calcule el tiempo requerido para retornar a la posición original del cono. b) Calcule las componentes del momento angular del cono. 16. Una bola de densidad uniforme rueda sin deslizar sobre un disco que gira en un plano horizontal con velocidad angular Ω. La bola se mueve en un cı́rculo de radio r centrado en el eje del disco, con velocidad angular ω. Encuentre ω. Capı́tulo 6 Dinámica Hamiltoniana 6.1. Ecuaciones de Hamilton La formulación de la Mecánica a partir del Lagrangiano L(qi , q̇i , t), i = 1, 2, . . . , s, describe el movimiento de un sistema en términos de sus coordenadas y velocidades generalizadas, lo cual se denomina el espacio de configuración (qi , q̇i ). Otra descripción alternativa del movimiento de un sistema es posible en términos de sus coordenadas generalizadas qi y de sus momentos conjugados pi , lo cual se llama el espacio de fase (pi , qi ) del sistema. El espacio de fase es empleado para representar la evolución de sistemas en diversas áreas de la Fı́sica, tales como Mecánica Estadı́stica y Sistemas Dinámicos. Veamos cómo transformar la descripción del movimiento desde el espacio de configuración (q1 , q̇i ) al espacio de fase (pi , qi ). Consideremos un sistema cuyo Lagrangiano es L(qi , q̇i , t). El diferencial total del Lagrangiano como función de sus argumentos es X ∂L X ∂L ∂L dL(qi , q̇i , t) = dqi + dq̇i + dt. (6.1) ∂q ∂ q ˙ ∂t i i i i Los momentos conjugados asociado a las coordenadas generalizadas {qi } son pi = ∂L = pi (qi , q̇i , t) i = 1, 2, . . . , s. ∂ q̇i (6.2) A partir del conjunto de Ecs. (6.2) es posible, en principio, obtener las velocidades generalizadas q̇i como función de los momentos pi , las coordenadas qi y t, q̇i = q̇i (pi , qi , t) i = 1, 2, . . . , s. Las ecuaciones de Lagrange correspondientes se pueden escribir ∂L d ∂L = dt ∂ q̇i ∂qi ∂L ⇒ ṗi = . ∂qi 227 (6.3) (6.4) (6.5) 228 CAPÍTULO 6. DINÁMICA HAMILTONIANA Sustitución en la Ec. (6.1) da dL = X ṗi dqi + X i pi dq̇i + i ∂L dt , ∂t (6.6) lo que se puede expresar como ! dL = X ṗi dqi + i X d(pi q̇i ) − X i q̇i dpi + i ∂L dt ; ∂t (6.7) es decir, ! d X pi q̇i − L = X i q̇i dpi − X i ṗi dqi − i ∂L dt . ∂t (6.8) El lado izquierdo de la Ec. (6.8) corresponde al diferencial total de una función de varias variables. El lado derecho de la Ec. (6.8), que contiene los diferenciales dpi , dqi y dt, indica que los argumentos de esta función son (pi , qi , t). Si expresamos las velocidades generalizadas q̇i = q̇i (pi , qi , t), podemos definir esta función como X X H(pi , qi , t) ≡ pi q̇i − L = pi q̇i (pi , qi , t) − L(qi , q̇i (pi , qi , t), t) . (6.9) i i La función H(pi , qi , t) se llama el Hamiltoniano del sistema. Entonces, la Ec. (6.8) se puede escribir como dH(qi , pi , t) = X q̇i dpi − i X ṗi dqi − i ∂L dt . ∂t (6.10) Por otro lado, como función de sus argumentos (qi , pi , t), el diferencial total del Hamiltoniano es X ∂H X ∂H ∂H dH(qi , pi , t) = dt. (6.11) dqi + dpi + ∂q ∂p ∂t i i i Comparando términos en las Ecs. (6.10) y (6.11), tenemos q̇i ṗi además de ∂H , ∂pi ∂H , = − ∂qi = (6.12) (6.13) ∂H ∂L =− . (6.14) ∂t ∂t Las ecuaciones Ecs. (6.12) y (6.13) se denominan ecuaciones de Hamilton y constituyen un sistema de 2s ecuaciones diferenciales de primer orden con respecto al tiempo para qi 6.1. ECUACIONES DE HAMILTON 229 y pi , i = 1, 2, . . . , s. Las soluciones qi (t) y pi (t) de las ecuaciones de Hamilton requieren 2s constantes de integración relacionadas con las s condiciones iniciales qi (0) para las coordenadas y las pi (0) s condiciones iniciales para los momentos. El estado dinámico del sistema en un tiempo t se puede representar como un punto (qi (t), pi (t)) en el espacio euclideano 2s-dimensional (qi , pi ), denominado espacio de fase, donde cada coordenada qi y cada momento pi corresponde a un eje cartesiano de ese espacio. Las soluciones de las ecuaciones de Hamilton corresponden a una trayectoria (qi (t), pi (t)) en el espacio de fase 2s-dimensional (qi , pi ) que pasan por el punto (qi (0), pi (0)). Figura 6.1: Trayectoria en el espacio de fase. Note que el Hamiltoniano H es equivalente a la función de energı́a (Cap. 1) expresada en variables del espacio de fase, E(qi , q̇i ) X ∂L q̇i − L(qi , q̇i , t) ∂ q̇i i X = pi q̇i − L = H(qi , pi , t) = en coordenadas (qi , pi ). (6.15) i Por otro lado, dH (qi , pi , t) dt = = X ∂H ∂H X ∂H + q̇i + ṗi ∂t ∂qi ∂pi i i ∂H X ∂H ∂H X ∂H ∂H ∂H + − = . ∂t ∂q ∂p ∂p ∂q ∂t i i i i i i Es decir, si el Hamiltoniano no depende explicitamente del tiempo, entonces H(qi , pi ) es constante. Similarmente, si el Lagrangiano L no depende explicitamente de t, la función de energı́a es constante. Si el Hamiltoniano es constante, la ecuación H(qi , pi ) = cte representa una superficie de (2s − 1) dimensiones sobre la cual se mueve la trayectoria (qi (t), pi (t)) en el espacio de fase 2s-dimensional. La trayectoria correspondiente a un sistema oscilatorio debe ser una curva cerrada sobre la superficie H(qi , pi ) = cte, de modo que los valores de las coordenadas y de los momentos del sistema se repiten en el tiempo. 230 CAPÍTULO 6. DINÁMICA HAMILTONIANA Un sistema caracterizado por un Lagrangiano siempre tiene un Hamiltoniano asociado. En la formulación Lagrangiana, el movimiento de un sistema con s grados de libertad se describe en términos de s ecuaciones diferenciales ordinarias de segundo orden en el tiempo para las coordenadas generalizadas qi , (i = 1, 2, . . . , s); mientras que en la formulación Hamiltoniana, la dinámica del sistema se expresa mediante 2s ecuaciones diferenciales de primer orden con respecto al tiempo: s ecuaciones para las coordenadas qi y s ecuaciones para los momentos conjugados pi . Las coordenadas y los momentos conjugados poseen el mismo estatus en la formulación Hamiltoniana. Formalmente, el Hamiltoniano corresponde a una transformación de Legendre del Lagrangiano (Apéndice B). Desde el punto de vista matemático, ambas formulaciones son equivalentes. Sin embargo, la formulación Hamiltoniana permite conectar la Mecánica Clásica con otras áreas de la Fı́sica, tales como Sistemas Dinámicos, Mecánica Estadı́stica y Teorı́as de Campos. Figura 6.2: William Rowan Hamilton (1805-1865). Ejemplos. 1. Encontrar las ecuaciones de movimiento de un oscilador armónico en la formulación Hamiltoniana. El Lagrangiano es 1 2 1 2 mq̇ − kq . 2 2 Puesto que s = 1, hay un momento conjugado: L=T −V = p= ∂L = mq̇ ∂ q̇ ⇒ q̇ = p . m (6.16) (6.17) El Hamiltoniano es 1 1 H(q, p) = pq̇ − L = pq̇ − mq̇ 2 + kq 2 . 2 2 (6.18) 6.1. ECUACIONES DE HAMILTON Sustituyendo q̇ = 231 p , m H(q, p) = p2 1 + kq 2 . 2m 2 (6.19) Las ecuaciones de Hamilton son q̇ ṗ ∂H p = , ∂p m ∂H = − = −kq. ∂q = (6.20) (6.21) Las ecuaciones de Hamilton para el oscilador armónico se pueden resolver, al igual que la correspondiente ecuación de Lagrange. Derivando la Ec. (6.21) obtenemos, p̈ = −k q̇ = − k p, m (6.22) cuya solución es p(t) = A cos(ωt + ϕ), ω2 = k . m (6.23) Sustituyendo en la Ec. (6.20), obtenemos q(t) = A sin(ωt + ϕ). mω El Hamiltoniano es independiente del tiempo, H(q, p) = (6.24) ∂H = 0, lo cual implica que ∂t p2 1 + kq 2 = cte. 2m 2 (6.25) La función H(q, p) = cte describe una elipse (curva unidimensional) en el espacio de fase bidimensional (q, p) y determina los valores posibles de q(t) y p(t) para todo tiempo t. La trayectoria descrita por q(t), p(t) se mueve sobre la elipse H = cte. Figura 6.3: La función H(q, p) = cte para un oscilador armónico en su espacio de fase. 232 CAPÍTULO 6. DINÁMICA HAMILTONIANA 2. Encontrar las ecuaciones de Hamilton para una partı́cula de masa m moviéndose sobre un cono vertical cuyo ángulo en el vértice es α. El Lagrangiano fue calculado en el Cap. 1, L= 1 2 2 1 mṙ csc α + mr2 ϕ̇2 − mgr cot α. 2 2 (6.26) Los momentos conjugados a las coordenadas r y ϕ son ∂L ∂ ṙ ∂L pϕ = ∂ ϕ̇ pr = = mṙ csc2 α, (6.27) = mr2 ϕ̇. (6.28) Luego, ṙ = ϕ̇ = pr , m csc2 α pϕ . mr2 El Hamiltoniano es X 1 1 H= pi q̇i − L = pr ṙ + pϕ ϕ̇ − mṙ2 csc2 α − mr2 ϕ̇2 + mgr cot α. 2 2 i (6.29) (6.30) (6.31) Sustituyendo ṙ y ϕ̇, obtenemos H(r, ϕ, pr , pϕ ) = p2ϕ p2r + + mgr cot α. 2 2m csc α 2mr2 (6.32) Las ecuaciones de Hamilton son ϕ̇ = ṙ = ṗϕ = ṗr = ∂H pϕ = ∂pϕ mr2 ∂H pr = ∂pr m csc2 α ∂H − = 0 ⇒ pϕ = mr2 ϕ̇ = cte ∂ϕ p2ϕ ∂H − = − mg cot α. ∂r mr3 (6.33) (6.34) (6.35) (6.36) Adicionalmente, ∂H = 0 ⇒ H(r, ϕ, pr , pϕ ) = cte. (6.37) ∂t La función H(r, ϕ, pr , pϕ ) = cte describe una hipersuperficie 3-dimensional en el espacio de fase 4-dimensional correspondiente a las coordenadas y momentos (r, ϕ, pr , pϕ ). 6.1. ECUACIONES DE HAMILTON 233 3. Hamiltoniano de una partı́cula de masa m y carga q, moviéndose con velocidad v, en un campo electromagnético E(r, t) y B(r, t). El Lagrangiano de una partı́cula en un campo electromagnético es (Cap. 2) 1 q mv 2 − qφ + A · v, (6.38) 2 c donde el potencial escalar φ(r, t) y el potencial vector A(r, t) están relacionados con los campos E(r, t) y B(r, t) mediante L(r, ṙ, t) = 1 ∂A , B = ∇ × A. c ∂t En coordenadas cartesianas, L se puede expresar como E = −∇φ − L= 3 3 1 X 2 qX m ẋi − qφ + Ai ẋi . 2 i=1 c i=1 (6.39) (6.40) Los momentos conjugados son pj = q ∂L = mẋj + Aj ; ∂ ẋj c (6.41) 1 q pj − Aj . m c (6.42) luego, ẋj = El Hamiltoniano de la partı́cula es H= X pj ẋj − L. (6.43) j Sustituyendo la velocidad ẋj de la Ec. (6.42), obtenemos el Hamiltoniano para una partı́cula en un campo electromagnético, 1 X q 1 X q 2 H(r, p, t) = pj pj − Aj − p j − Aj m j c 2m j c 1 qX q + qφ − Aj pj − Aj mc j c 1 q 1 q 2 1 q q = p· p− A − p − A + qφ − A· p− A m c 2m c mc c 1 q q 1 q 2 = p− A · p− A − p − A + qφ m c c 2m c 1 q 2 = p − A + qφ . (6.44) 2m c Cabe destacar que el Hamiltoniano para una partı́cula en un campo electromagnético en Mecánica Cuántica tiene la misma forma que en la Mecánica Clásica, Ec. (6.44). 234 CAPÍTULO 6. DINÁMICA HAMILTONIANA 6.2. Sistemas dinámicos y espacio de fase El estado de un sistema general (fı́sico, quı́mico, biológico, económico, etc) puede describirse mediante un conjunto de variables que corresponden a cantidades observables (presión, temperatura, velocidad, posición, densidad, etc). El estado de un sistema dinámico descrito por n variables xi (t), i = 1, . . . , n, en un instante t se puede representar por un vector definido en un espacio euclideano n-dimensional (x1 , x2 , . . . , xn ), donde cada dimensión representa una variable, denominado espacio de fase del sistema, tal que x(t) = (x1 (t), x2 (t), . . . , xn (t)) . (6.45) Un sistema cuyo estado (conjunto de variables) evoluciona de acuerdo a reglas determinadas constituye un sistema dinámico. Las reglas especifican cómo cambia el estado del sistema a partir de un estado dado. Estas reglas pueden consistir en ecuaciones diferenciales, funciones iterativas, o en un algoritmo (conjunto de instrucciones). La evolución del estado x(t) en un subespacio U ⊆ <n en muchos sistemas se puede describir mediante ecuaciones diferenciales de la forma dx(t) = f (x(t)) , dt (6.46) f (x) = (f1 (x), f2 (x), . . . , fn (x)) . (6.47) donde La Ec. (6.46) equivale al sistema de n ecuaciones diferenciales de primer orden ẋ1 = .. . f1 (x1 , x2 , . . . , xn ) .. . (6.48) ẋn = fn (x1 , x2 , . . . , xn ). En general, una ecuación diferencial ordinaria de orden n para una variable se puede expresar como un sistema de n ecuaciones diferenciales ordinarias de primer orden para n variables. La solución del sistema de n ecuaciones diferenciales de primer orden Ec. (6.46) para x(t) ∈ U ⊆ <n requiere el conocimiento de n condiciones iniciales x(0) = (x1 (0), x2 (0), . . . , xn (0)). La evolución del estado de un sistema en su espacio de fase es análogo al movimiento de una partı́cula en un espacio euclideano n-dimensional, cuya posición instantánea es x(t) y su velocidad está dada por dx(t) dt = f (x(t)). Los puntos fijos o soluciones estacionarias x∗ del sistema Ec. (6.46) están dados por dx(t) = f (x∗ ) = 0. (6.49) dt x∗ Si el tiempo no aparece explı́citamente en la Ec. (6.46), se dice que el sistema dinámico es autónomo. 6.2. SISTEMAS DINÁMICOS Y ESPACIO DE FASE 235 Ejemplos. 1. Las ecuaciones de Hamilton de un sistema mecánico con s grados de libertad constituyen un sistema dinámico 2s-dimensional, i = 1, . . . , s, q̇i = ṗi = ∂H = fi (qj , pj ), ∂pi ∂H − = fi (qj , pj ), ∂qi i = 1, . . . , s i = s + 1, . . . , 2s (6.50) (6.51) 2. El modelo de Lotka-Volterra describe la evolución de dos poblaciones, predadores y presas, en un sistema ecológico, mediante las ecuaciones ċ = αc − βcz = f1 (c, z) ż = −γz + δcz = f2 (c, z), (6.52) donde c representa el número de presas (por ejemplo conejos), y z corresponde al número de sus depredadores (por ejemplo zorros). Las derivadas ċ, ż representan la tasa de crecimiento de cada población, respectivamente. Los parámetros son: α: tasa de nacimiento de las presas; β: tasa de presas comidas por los depredadores; γ: tasa de muerte de los depredadores; δ: tasa de crecimiento de los depredadores alimentándose de las presas. Las variables c(t) y z(t) describen una trayectoria cerrada (periódica) en el espacio de fase del sistema, descrita por una función h(c, z) = cte. El sistema posee un punto fijo, c∗ = γδ , z ∗ = α β. Figura 6.4: Espacio de fase bidimensional (c, z) en el modelo de Lotka-Volterra para valores dados de los parámetros α, β, γ y δ. 3. Las ecuaciones de Lorenz, propuestas originalmente como un modelo simplificado de variables climáticas, forman un sistema dinámico no lineal, tridimensional, ẋ = −ax + ay = f1 (x, y, z), ẏ = −xz + rx − y = f2 (x, y, z), ż = xy − bz = f3 (x, y, z). (6.53) 236 CAPÍTULO 6. DINÁMICA HAMILTONIANA El fenómeno de caos fue descubierto por primera vez en estas ecuaciones. Para cierto rango de valores de los parámetros a, b, y r, este sistema es caótico; es decir, la trayectoria en su espacio de fase presenta sensibilidad extrema ante pequeños cambios de las condiciones iniciales. En ese caso, la trayectoria del vector x(t) = (x, y, z) no se cierra (es aperiódica) y describe una intrincada estructura geométrica en el espacio de fase del sistema, denominada atractor de Lorenz. Figura 6.5: Atractor de Lorenz. Teorema de existencia y unicidad. Dado un sistema dinámico descrito por la ecuación dx(t) = f (x(t)), dt definido en un subespacio U ⊆ <n , tal que f (x) satisface la propiedad |f (y) − f (x)| ≤ k |y − x| , 1/2 denominada propiedad de Lipschitz, para algún k < ∞, donde |x| ≡ x21 + · · · + x2n , y dado un punto x(0) ∈ U , existe una solución única x(t) que satisface esta ecuación para t ∈ (0, τ ) con condición inicial x(0). Figura 6.6: Teorema de unicidad en un espacio de fase tridimensional. 6.2. SISTEMAS DINÁMICOS Y ESPACIO DE FASE 237 La propiedad de Lipschitz (no singularidad) es, en general, satisfecha por las funciones que describen sistemas fı́sicos. El vector de estado del sistema x(t) en el espacio de fase se asemeja a un vector de posición de una partı́cula en un sistema de coordenadas espaciales cartesianas. El vector f (x) describe la velocidad dx/dt y es siempre tangente a la trayectoria x(t) en el espacio de fase. El teorema de unicidad constituye el fundamento matemático del principio del determinismo y de la predicción en la Fı́sica: el estado de un sistema en un instante dado está determinado unı́vocamente por su estado en un instante anterior. Figura 6.7: Situaciones prohibidas por el Teorema de Unicidad en el espacio de fase: dos trayectorias no pueden surgir del mismo punto (izquierda); dos trayectorias no pueden intersectarse (centro); una trayectoria no puede cruzarse a sı́ misma (derecha). El teorema de unicidad tiene importantes implicaciones. En particular, en un espacio de fase bidimensional se cumple el siguiente teorema: Teorema de Poincaré-Bendixson. Los únicos estados asintóticos posibles en el espacio de fase de un sistema dinámico bidimensional son puntos fijos o trayectorias cerradas (también llamadas ciclos lı́mites). Figura 6.8: Teorema de Poincaré-Bendixson. Puesto que una trayectoria cerrada en el espacio de fase es periódica y un punto fijo es estacionario, el teorema de Poincaré-Bendixson implica que un comportamiento caótico solamente puede surgir en sistemas dinámicos continuos cuyo espacio de fase posee al menos tres dimensiones. En particular, un sistema con un grado de libertad posee un espacio de fase bidimensional y, por lo tanto, solamente puede exhibir soluciones asintóticamente periódicas (por ejemplo, un oscilador armónico) o de punto fijo (por ejemplo, un oscilador armónico con fricción). 238 6.3. CAPÍTULO 6. DINÁMICA HAMILTONIANA Teorema de Liouville Un conjunto de condiciones iniciales en el espacio de fase de un sistema se denomina un ensemble. Un ensemble puede interpretarse como un conjunto de sistemas idénticos o réplicas con diferentes condiciones iniciales, o como diferentes realizaciones de un mismo sistema en un instante inicial. Figura 6.9: Evolución de un ensemble en el espacio de fase. Cada punto en el ensemble evoluciona de acuerdo con la ecuación dinámica del sistema, Ec. (6.46), dando lugar a un estado x(t) en un tiempo t. Denotamos por Γ(t) el volumen ocupado por el conjunto de puntos x(t) en el espacio de fase n-dimensional en el tiempo t. Debido a la evolución del sistema, Γ cambia en el tiempo. El teorema de unicidad establece que no puede surgir más de una trayectoria a partir de una condición inicial. Como consecuencia, Γ no puede aumentar en el tiempo. Es decir, el teorema de unicidad implica que en un sistema dinámico siempre debe ocurrir dΓ ≤ 0. dt (6.54) Supongamos que el volumen n-dimensional Γ(t) esta encerrado por una superficie S (n − 1)-dimensional en el espacio de fase. El cambio de Γ en el tiempo está dado por el número total de trayectorias que atraviesan (entran o salen) S por unidad de tiempo. Las trayectorias se comportan como un flujo de “partı́culas” o un campo de velocidades a través de la superficie S. El flujo a través de un diferencial de area da por unidad de tiempo es igual a v · da, donde v = dx dt es la velocidad de la partı́cula incidente y da es el vector normal al diferencial de area. Figura 6.10: Flujo de trayectorias a través de una superficie S que encierra un volumen Γ en el espacio de fase. 6.3. TEOREMA DE LIOUVILLE 239 Entonces, el cambio de Γ en el tiempo es igual al flujo total por unidad de tiempo a través de S, dΓ = dt I S dx · da dt I (flujo total a través de S por unidad de tiempo) Z f · da = = S ∇ · f dΓ0 (teorema de la divergencia en n dimensiones), (6.55) Γ donde 0 dΓ = dx1 dx2 · · · dxn = n Y dxi , (6.56) i=1 es el diferencial de volumen en el espacio de fase n-dimensional, y ∇·f =∇· dx dt = n X ∂ ẋi i=1 ∂xi . (6.57) Luego, la condición Ec. (6.54) que satisface todo sistema dinámico, equivale a dΓ = 0, si dt dΓ < 0, si dt ∇ · f = 0, (6.58) ∇ · f < 0. (6.59) Un sistema de ecuaciones tal que ∇·f > 0 viola el teorema de unicidad y no representa a un sistema dinámico. Teorema de Liouville. El volumen representado por un ensemble de un sistema mecánico (que obedece las ecuaciones de Hamilton) en su espacio de fase es constante, Γ = cte, i.e., dΓ = 0. dt Demostración: La dinámica del sistema está descrita por las ecuaciones de Hamilton, q̇i = ∂H , ∂pi ṗi = − ∂H , ∂qi donde f= ∂H ∂H ,− ∂pi ∂qi = ∂H ∂H ∂H ∂H ,..., ,− ,...,− ∂p1 ∂ps ∂q1 ∂qs . (6.60) 240 CAPÍTULO 6. DINÁMICA HAMILTONIANA Luego, ∇·f = X ∂ q̇i i ∂ ṗi + ∂qi ∂pi (6.61) = X ∂2H ∂2H − =0 ∂qi ∂pi ∂pi ∂qi i (6.62) ⇒ dΓ = 0. dt (6.63) Figura 6.11: Joseph Liouville (1809-1882). Los sistemas dinámicos que satisfacen ∇ · f = 0 ( dΓ dt = 0) se llaman conservativos, mientras que los sistemas tales que ∇ · f < 0 ( dΓ < 0) se denominan disipativos. dt Los sistemas Hamiltonianos son conservativos; el volumen de un ensemble puede cambiar su forma en el tiempo, pero no su tamaño, mientras se mueve en el espacio de fase. La evolución de un ensemble en el espacio de fase de un sistema Hamiltoniano es similar al movimiento de un fluido incompresible en el espacio real. En los sistemas disipativos, las trayectorias en el espacio de fase convergen asintóticamente a un objeto geométrico que tiene un volumen (o dimensión) menor que el espacio de fase que lo contiene, y que se denomina atractor del sistema. Esta situación es tı́pica de los sistemas con fricción y de los sistemas fuera de equilibrio. Figura 6.12: Evolución esquemática de un ensemble en el espacio de fase de un sistema disipativo (izquierda), y de un sistema conservativo (derecha). 6.3. TEOREMA DE LIOUVILLE 241 El Teorema de Liuoville tiene importantes implicaciones. Una consecuencia de este teorema es que las trayectorias en el espacio de fase de un sistema Hamiltoniano eventualmente retornan arbitrariamente cerca de sus condiciones iniciales. Teorema de recurrencia de Poincaré. Consideremos alguna condición inicial x(0) = (qi (0), pi (0)) en un espacio de fase finito D de un sistema Hamiltoniano. Entonces, para cualquier vecindad finita U de x(0), existen trayectorias originadas en puntos de U que eventualmente retornan a U . Demostración: Consideremos imágenes sucesivas de la evolución de U bajo las ecuaciones de Hamilton, en intervalos de tiempo ∆t. Denotamos por C(U ) la imagen de U después de un intervalo ∆t. Sucesivas imágenes corresponden a C n (U ), donde C n indica la composición o iteración n-ésima de C. Existen dos posibilidades: las imágenes sucesivas de U se intersectan, o no lo hacen. Si éstas imágenes no se intersectan, entonces en cada iteración, un volumen de D igual al volumen de U se ocupa y, por tanto, no puede pertenecer a ninguna imagen subsiguiente. Puesto que el volumen D es finito, no es posible acomodar un número infinito de volúmenes finitos dentro de D. Luego, las imágenes sucesivas de U se deben intersectar después de un número finito de iteraciones. Supongamos que C i (U ) se intersecta con C j (U ), con i > j. Entonces, las pre-imágenes C i−1 (U ) y C j−1 (U ) de estos subconjuntos también deben intersectarse, puesto que la pre-imagen de un punto en la intersección pertenece a ambos subconjuntos. Esto puede ser continuado hasta que finalmente C i−j (U ) intersecta a U . Luego, después de i − j iteraciones de la evolución C, existe un conjunto de puntos inicialmente en U que retornan a U . Figura 6.13: Henri Poincaré (1854 - 1912). El Teorema de recurrencia de Poincaré no establece el tiempo requerido para el retorno cercano a las condiciones iniciales de un sistema dinámico Hamiltoniano; este tiempo puede ser extremadamente largo, especialmente si el espacio de fase posee alta dimensión. 242 CAPÍTULO 6. DINÁMICA HAMILTONIANA Ejemplos. 1. Las ecuaciones de Hamilton para el oscilador armónico q̇ = ṗ = conducen a ∇·f = p = f1 (q, p), m −kq = f2 (q, p), ∂f1 ∂f2 + = 0. ∂q ∂p (6.64) (6.65) (6.66) Este sistema es conservativo. 2. Las ecuaciones de Lorenz Ecs. (6.53) dan ∇·f = ∂f2 ∂f3 ∂f1 + + = −(a + b + 1). ∂x ∂y ∂z (6.67) Luego, el sistema de Lorenz es disipativo si a + b + 1 > 0. Estas son las condiciones que producen el atractor de Lorenz en la Fig. (6.5). 6.4. Paréntesis de Poisson Consideremos una función general f (qi , pi , t) definida en el espacio de fase (qi , pi ), i = 1, . . . , s, de un sistema mecánico. La derivada total con respecto al tiempo de esta función es X ∂f ∂f df ∂f = q̇i + ṗi + . (6.68) dt ∂q ∂p ∂t i i i Las ecuaciones de Hamilton para este sistema son q̇i = ∂H , ∂pi ṗi = − ∂H . ∂qi Sustituyendo las ecuaciones de Hamilton en la Ec. (6.68), tenemos X ∂f ∂H ∂f ∂H ∂f df = − + . dt ∂qi ∂pi ∂pi ∂qi ∂t i Definimos el paréntesis de Poisson de H con f como la operación X ∂f ∂H ∂f ∂H [f, H] ≡ − . ∂qi ∂pi ∂pi ∂qi i (6.69) (6.70) (6.71) 6.4. PARÉNTESIS DE POISSON 243 Luego, podemos escribir df ∂f = [f, H] + . (6.72) dt ∂t Si f es una cantidad conservada en el espacio de fase, o una primera integral del movimiento, entonces df dt = 0, y f satisface ∂f + [f, H] = 0. ∂t (6.73) Si, adicionalmente, la integral del movimiento f no depende explı́citamente del tiempo, tenemos [f, H] = 0. (6.74) En general, dadas dos funciones f (qi , pi , t) y g(qi , pi , t) en el espacio de fase, podemos definir el paréntesis de Poisson de f y g como la operación X ∂f ∂g ∂f ∂g [f, g] ≡ − . (6.75) ∂qi ∂pi ∂pi ∂qi i El paréntesis de Poisson puede ser considerado como una operación entre dos funciones definidas en un espacio algebraico que asigna otra función en ese espacio. Figura 6.14: Siméon Denis Poisson (1781-1840). El paréntesis de Poisson es una operación que posee las siguientes propiedades (caracterı́sticas de lo que se denomina álgebra de Lie): 1. [f, g] = −[g, f ] , 2. [f, c] = 0 , [f, f ] = 0 (antisimetrı́a). si c = cte. 3. [af1 + bf2 , g] = a[f1 , g] + b[f2 , g], 4. [f1 f2 , g] = f1 [f2 , g] + f2 [f1 , g], a, b = ctes. (operador lineal). (no asociativo). 5. [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0 (suma de permutaciones cı́clicas es cero). Esta propiedad se conoce como la identidad de Jacobi. Estas propiedades pueden demostrarse directamente a partir de la definición en la Ec. (6.71). 244 CAPÍTULO 6. DINÁMICA HAMILTONIANA Adicionalmente, puesto que los pi y qi representan coordenadas independientes en el espacio de fase, tenemos ∀f , 0 X ∂qi ∂f 7 ∂f X ∂f ∂qi ∂f δik [qi , f ] = − = , (6.76) = ∂qk ∂pk ∂pk ∂qk ∂pk ∂pi k k 0 X ∂pi X 7 ∂f ∂f ∂pi ∂f ∂f [pi , f ] = δik − =− . =− ∂q ∂p ∂p ∂q ∂q ∂q k k k i k k k k (6.77) Note que si f = pj , ó f = qj , [qi , qj ] = 0, [pi , pj ] = 0, [qi , pj ] = δij . (6.78) Utilizando paréntesis de Poisson, las ecuaciones de Hamilton pueden escribirse q̇i = ṗi = ∂H = ∂pi ∂H − = ∂qi [qi , H] (6.79) [pi , H]. (6.80) En Mecánica Cuántica, la operación [A, B] = AB − BA se denomina el conmutador de los operadores u observables A y B. La estructura algebraica de la Mecánica Clásica se preserva en la Mecánica Cuántica. En particular, [qi , pj ] = i~δij . Ejemplos. 1. Calcular [r, p], donde r = (x2 + y 2 + z 2 )1/2 . [r, p] = [r, px ] î + [r, py ] ĵ + [r, pz ] k̂. (6.81) Calculamos la componente [r, px ] = X ∂r ∂px ∂r ∂px − ∂qi ∂pi ∂pi ∂qi i = ∂r ∂px x = . ∂x ∂px r Similarmente, [r, py ] = Luego, [r, p] = y , r [r, pz ] = (6.82) z . r x y z r î + ĵ + k̂ = = r̂ . r r r r (6.83) (6.84) 6.4. PARÉNTESIS DE POISSON 245 2. Las componentes del momento angular l = r × p son lx = ypz − zpy , ly = zpx − xpz , lz = xpy − ypx . (6.85) Calcular los siguientes paréntesis de Poisson para las componentes de p y l: a) [py , lx ] = b) [px , lx ] = c) [pz , ly ] = d) [px , ly ] = e) [lx , ly ] ∂lx = −pz ∂y ∂lx − =0 ∂x ∂ly − = −px ∂z ∂ly = pz − ∂x X ∂lx ∂ly − (6.86) (6.87) (6.88) (6.89) ∂lx ∂ly ∂p i ∂qi i ∂lx ∂ly ∂lx ∂ly ∂lx ∂ly ∂lx ∂ly ∂lx ∂ly ∂lx ∂ly = − + − + − ∂x ∂px ∂px ∂x ∂y ∂py ∂py ∂y ∂z ∂pz ∂pz ∂z = (−py )(−x) − ypx = ∂qi ∂pi − = xpy − ypx = lz . (6.90) f) [ly , lz ] = lx . (6.91) g) [lz , lx ] = ly . En general, [li , lj ] = ijk lk . En Mecánica Cuántica, estas relaciones corresponden a [li , lj ] = ijk i~lk . Teorema de Poisson. Si f y g son ambas constantes de movimiento, entonces, [f, g] = cte. Demostración: Si f y g son constantes de movimiento, entonces satisfacen df = 0, dt Calculemos dg = 0. dt d ∂ [f, g] = [f, g] + [[f, g], H]. dt ∂t (6.92) (6.93) 246 CAPÍTULO 6. DINÁMICA HAMILTONIANA Calculemos la derivada parcial X ∂ 2 f ∂g ∂ ∂f ∂ 2 g ∂ 2 f ∂g ∂f ∂ 2 g [f, g] = + − − ∂t ∂t∂qi ∂pi ∂qi ∂t∂pi ∂t∂pi ∂qi ∂pi ∂t∂qi i X X ∂ ∂f ∂g ∂ ∂f ∂g ∂f ∂ ∂g ∂f ∂ ∂g = − + − ∂qi ∂t ∂pi ∂pi ∂t ∂qi ∂qi ∂pi ∂t ∂pi ∂qi ∂t i i ∂f ∂g = , g + f, . (6.94) ∂t ∂t Usando la identidad de Jacobi, tenemos [[f, g], H] = − [[g, H] , f ] − [[H, f ] , g] . Sustituyendo Ec. (6.94) y Ec. (6.95) en Ec. (6.93), tenemos ∂f ∂g d [f, g] = , g + f, − [[g, H] , f ] − [[H, f ] , g] dt ∂t ∂t ∂f ∂g , g + f, = + [f, [g, H]] + [[f, H] , g] ∂t ∂t ∂f ∂g = + [f, H] , g + f, + [g, H] ∂t ∂t df dg = , g + f, =0 dt dt ⇒ [f, g] = cte. (6.95) (6.96) (6.97) El Teorema de Poisson puede ser útil para encontrar una nueva constante de movimiento en un sistema, si se conocen dos de ellas. La condición de integrabilidad de un sistema en la formulación Hamiltoniana puede expresarse en el lenguaje de los paréntesis de Poisson, de la siguiente manera, denominada integrabilidad de Liouville: Un sistema con s grados de libertad es integrable si existen s funciones independientes Ik (q1 , . . . , qs , p1 , . . . , ps ), k = 1, . . . , s, denominadas constantes del movimiento, cuyos paréntesis de Poisson mutuos son cero, [Ik , Ij ] = 0. ∀k, j = 1, . . . , s. (6.98) En ese caso, se dice que las s funciones Ik (qi , pi ) están en involución. Luego, Ik (qi , pi ) = Ck , donde cada Ck es una constante, debido a la propiedad 2 de los paréntesis de Poisson. En sistemas conservativos, el Hamiltoniano H(qi , pi ) explı́citamente independiente del tiempo es una de las constantes del movimiento. 6.5. TRANSFORMACIONES CANÓNICAS 247 La trayectoria qi (t), pi (t) de un sistema integrable con s grados de libertad debe satisfacer simultáneamente las s condiciones Ik (q1 , . . . , qs , p1 , . . . , ps ) = Ck en su espacio de fase 2s-dimensional. Cada relación Ik (qi , pi ) = Ck representa una superficie (2s − 1)dimensional sobre la cual se encuentra la trayectoria qi (t), pi (t). La trayectoria debe estar en la intersección de las s superficies (2s − 1)-dimensionales. Cada intersección de dos superficies representa un subespacio que posee una dimensión menor que la dimensión de las superficies. Luego, la trayectoria yace sobre un subespacio o superficie s-dimensional que corresponde a la intersección de las s superficies Ik (qi , pi ) = Ck . Por ejemplo, una partı́cula moviéndose sobre un cono vertical invertido (Sec. 6.1) posee s = 2 grados de libertad y dos constantes de movimiento, el Hamiltoniano H y el momento angular pφ . Cada constante de movimiento representa una superficie 3dimensional en el espacio de fase de 4 dimensiones (r, φ, pr , pφ ). La trayectoria del sistema en su espacio de fase ocurre sobre una superficie bidimensional resultante de la intersección de las dos superficies H = cte y pφ = cte, la cual puede representarse como un toroide, como veremos en este Capı́tulo. 6.5. Transformaciones canónicas La escogencia del conjunto especı́fico de coordenadas generalizadas {qi } es arbitraria. Por ejemplo, las posiciones de un sistema de partı́culas en el espacio pueden ser descritas por diferentes sistemas de coordenadas {qi }: cartesianas, esféricas, cilı́ndricas, etc. Las ecuaciones de Lagrange en términos de un conjunto dado {qi } tienen la forma ∂L d ∂L − = 0. (6.99) dt ∂ q̇i ∂qi En la Sec. 1.6, vimos que la derivación de las ecuaciones de Lagrange no depende del conjunto de coordenadas generalizadas especı́ficas; por lo tanto, la forma de las ecuaciones de Lagrange no depende de un conjunto particular de coordenadas {qi }. Se puede escoger otro conjunto de s coordenadas independientes {Qi = Qi (qj , t)}, y las ecuaciones de Lagrange también se cumplen en esas coordenadas, ∂L d ∂L − = 0. (6.100) dt ∂ Q̇i ∂Qi En la formulación Hamiltoniana, las coordenadas qi y los momentos conjugados pi son considerados como un conjunto de 2s variables independientes en un espacio de fase 2s-dimensional. En términos de estas variables, el Hamiltoniano es H(qi , pi , t). Las ecuaciones de Hamilton correspondientes son ∂H , ∂pi ∂H ṗi = − . ∂qi q̇i = (6.101) (6.102) 248 CAPÍTULO 6. DINÁMICA HAMILTONIANA Consideremos un cambio de variables en el espacio de fase que incluya tanto las coordenadas como momentos, Qi = Qi (qj , pj , t), Pi = Pi (qj , pj , t). (6.103) Este tipo de transformaciones se denomina transformaciones puntuales en el espacio de fase y, en principio, son invertibles, i.e., qi = qi (Qj , Pj , t), pi = pi (Qj , Pj , t). Denotamos por H 0 (Qi , Pi , t) al Hamiltoniano en términos de las nuevas variables {Qi , Pi }. En contraste con la formulación Lagrangiana, la forma de las ecuaciones de Hamilton, en general, no se preserva en las nuevas coordenadas y momentos {Qi , Pi }. Por ejemplo, supongamos un sistema con Hamiltoniano H(qi , pi ) en el cual se cumplen las ecuaciones de Hamilton (6.101)-(6.102), y consideremos la siguiente transformacion puntual {qi , pi } → {Qi , Pi } en el espacio de fase, Qi = −pi , Pi = qi . (6.104) El Hamiltoniano en la nuevas variables será H 0 (Qi , Pi ). Las ecuaciones de Hamilton en las variables {Qi , Pi } se transforman de acuerdo a X ∂H 0 ∂Qk ∂H 0 ∂H 0 ∂Pk ∂H =⇒ Ṗi = = + q̇i = ∂pi ∂pi ∂Qk ∂pi ∂Pk ∂pi k X ∂H 0 ∂H 0 =− δik = − . (6.105) ∂Qk ∂Qi k X ∂H 0 ∂Qk ∂H ∂H 0 ∂H 0 ∂Pk ṗi = − =⇒ −Q̇i = − =− + ∂qi ∂qi ∂Qk ∂qi ∂Pk ∂qi k 0 X ∂H ∂H 0 =− δik = − . (6.106) ∂Pk ∂Pi k Luego, en las variables {Qi , Pi } también se satisfacen las ecuaciones de Hamilton. Sin embargo, es fácil notar que la transformación puntual Qi = pi , Pi = qi , (6.107) no preserva la forma de las ecuaciones de Hamilton en las variables {Pi , Qi }. Una transformación puntual de variables del espacio de fase que mantiene invariante la forma de las ecuaciones de Hamilton, se denomina transformación canónica. H(qi , pi , t) → Transformación canónica → ∂H q̇i = Qi = Qi (qj , pj , t) ∂pi ∂H ṗi = − Pi = Pi (qj , pj , t) ∂qi H 0 (Qi , Pi , t) Q̇i = ∂H 0 ∂Pi Ṗi = − ∂H 0 ∂Qi (6.108) 6.5. TRANSFORMACIONES CANÓNICAS 249 Las transformaciones canónicas son particularmente útiles cuando aparecen coordenadas cı́clicas en las nuevas variables {Qi , Pi }, es decir, cuando el Hamiltoniano transformado H 0 (Qi , Pi , t) no depende explı́citamente de alguna coordenada Qj o momento conjugado Pj . En ese caso, la derivada de H 0 con respecto a esa coordenada o momento se hace cero en la correspondiente ecuación de Hamilton y, por lo tanto, existe una cantidad conservada asociada a la variable cı́clica. La condición para que una transformación {qi , pi } → {Qi , Pi } sea canónica puede derivarse a partir de la equivalencia del Principio de Mı́nima Acción en ambos conjuntos de variables del espacio de fase. Consideremos el Principio de Mı́nima Acción para las variables {qi , pi }, Z t2 S = L dt t1 Z t2 δS = 0 ⇒ δ L dt = 0, (6.109) t1 el cual implica que se cumplen las ecuaciones de Lagrange y, por lo tanto, las ecuaciones de Hamilton en las variables {qi , pi }. En términos del Hamiltoniano X H(qi , pi , t) = pi q̇i − L, (6.110) i tenemos Z t2 δS = δ t1 ! X pi q̇i − H dt = 0. En las variables {Qi , Pi } se debe cumplir el Principio de Mı́mina Acción, ! Z t2 X 0 0 Pi Q̇i − H dt = 0, δS = δ t1 (6.111) i (6.112) i para que también se cumplan las ecuaciones de Hamilton en {Qi , Pi }. Ambas formulaciones del Principio de Mı́nima Acción conducen a ecuaciones equivalentes si los integrandos en la Ec. (6.109) y la Ec. (6.112) difieren, a lo sumo, en una derivada total con respecto al tiempo de una función arbitraria F de las variables {Qi , Pi }, {qi , pi } y t; esto es, X X dF , (6.113) pi q̇i − H = Pi Q̇i − H 0 + dt i i pues, en este caso, 0 Z t2 δS = δS + δ t1 dF dt = δS 0 + δ[F (t2 ) − F (t1 )] = δS 0 . dt (6.114) Por lo tanto, las ecuaciones de Hamilton que se derivan de la condición δS = 0 en las variables {qi , pi } tienen la misma forma que las ecuaciones de Hamilton que se deducen de la condición δS 0 = 0 en las variables {Qi , Pi }. 250 CAPÍTULO 6. DINÁMICA HAMILTONIANA Luego, la condición para que una transformación {qi , pi } → {Qi , Pi } sea canónica puede escribirse como X X dF = pi q̇i − Pi Q̇i + (H 0 − H). dt i i (6.115) La función F se llama función generadora de la transformación canónica {qi , pi } → {Qi , Pi }. Dada una F (qi , pi , Qi , Pi , t), su derivada total dF dt debe satisfacer la condición Ec. (6.115) para que la transformación {qi , pi } → {Qi , Pi } sea canónica. Entonces, las derivadas parciales de F con respecto a sus argumentos, contenidas en la expresión de dF dt , permiten establecer la relación entre las variables {Qi , Pi } y {qi , pi }. Luego, la función F genera una conexión entre ambos conjuntos de coordenadas y momentos que garantiza que las ecuaciones de Hamilton preserven su forma bajo esta transformación. Las funciones generadores pueden no depender de todas las variables (qi , pi , Qi , Pi , t) y tener forma arbitraria. Para ver cómo una transformación canónica surge de una función generadora, consideremos las siguientes formas de funciones generadoras básicas: 1. F1 = F1 (qi , Qi , t). Calculemos la derivada total con respecto al tiempo, X ∂F1 dF1 ∂F1 ∂F1 = q̇i + Q̇i + . dt ∂qi ∂Qi ∂t i (6.116) Compararando con la condición Ec. (6.115) para funciones generadoras, tenemos ∂F1 = pi (q, Q, t) ∂qi ∂F1 Pi = − = Pi (q, Q, t) ∂Qi ∂F1 H0 = H + ∂t pi = (6.117) (6.118) (6.119) La función F1 genera la transformación canónica pi = pi (q, Q, t), Pi = Pi (q, Q, t), a través de sus derivadas parciales. 2. F2 = F2 (qi , Pi , t). X dF2 = dt i ∂F2 ∂F2 q̇i + Ṗi ∂qi ∂Pi + ∂F2 ∂t (6.120) Para comparar con la condición Ec. (6.115), X X dF = pi q̇i − Pi Q̇i + (H 0 − H), dt i i sustituimos d d (Pi Qi ) = Pi Q̇i + Qi Ṗi → Pi Q̇i = (Pi Qi ) − Qi Ṗi , dt dt (6.121) 6.5. TRANSFORMACIONES CANÓNICAS 251 de modo que la concición Ec. (6.115) se puede expresar como ! X X d F+ Pi Qi = pi q̇i + Qi Ṗi + (H 0 − H), dt i i (6.122) donde el lado izquierdo es la derivada total de una función arbitraria de (Qi , Pi , qi , pi ). Comparando con la Ec. (6.120), obtenemos ∂F2 = pi (q, P, t) ∂qi ∂F2 = = Qi (q, P, t) ∂Pi X = F+ Pi Qi pi (6.123) = Qi F2 (6.124) (6.125) i H0 = H+ ∂F2 . ∂t (6.126) 3. F3 = F3 (pi , Qi , t) X dF3 = dt i ∂F3 ∂F3 Q̇i ṗi + ∂pi ∂Qi + ∂F3 ∂t La condición Ec. (6.115) puede expresarse como ! X X d F− pi qi = −qi ṗi − Pi Q̇i + H 0 − H dt i i donde hemos sustituido pi q̇i = d (pi qi ) − qi ṗi dt (6.127) (6.128) (6.129) Comparando con la Ec. (6.127), tenemos qi Pi F3 ∂F3 = qi (p, Q, t) ∂pi ∂F3 = − = Pi (p, Q, t) ∂Qi X = F− pi qi = − (6.130) (6.131) (6.132) i H0 = H+ ∂F3 . ∂t (6.133) 4. F4 = F4 (p, P, t). X dF4 = dt i ∂F4 ∂F4 p˙i + Ṗi ∂pi ∂Pi + ∂F4 ∂t (6.134) 252 CAPÍTULO 6. DINÁMICA HAMILTONIANA La condición Ec. (6.115) puede expresarse como ! X X X d F− pi qi + Qi Pi = −qi ṗi + Qi Ṗi + H 0 − H dt i i i donde hemos sustituido d d pi q̇i = (pi qi ) − qi ṗi , Pi Q̇i = (Pi Qi ) − Qi Ṗi dt dt Comparando con la Ec. (6.134), tenemos qi Qi F4 ∂F4 = qi (p, P, t) ∂pi ∂F4 = Qi (p, P, t) = ∂Pi X X = F+ Pi Qi − pi qi = − i H0 = H+ (6.135) (6.136) (6.137) (6.138) (6.139) i ∂F4 . ∂t (6.140) La transformación canónica asociada a una función generadora F es una propiedad caracterı́stica de la función F ; no depende del Hamiltoniano de un sistema especı́fico. Por lo tanto, una transformación canónica dada {qi , pi , t} → {Qi , Pi , t} puede emplearse para transformar diversos Hamiltonianos; su utilidad en cada caso dependerá del problema especı́fico. La relación entre el Hamiltoniano H(qi , pi , t) y el Hamiltoniano transformado H 0 (Qi , Pi , t) resultante de la transformación canónica {qi , pi , t} → {Qi , Pi , t} generada por una F siempre es ∂F H0 = H + . (6.141) ∂t Luego, si F es independiente del tiempo, entonces H = H 0 . Dada una función generadora F , es posible encontrar una transformación canónica asociada a F . El problema inverso tambien se puede plantear en algunos casos: dada una transformación canónica, en principio es posible obtener la función generadora que produce esa transformación. Por ejemplo, consideremos una transformación pi = pi (q, Q, t), (6.142) Pi = Pi (q, Q, t), (6.143) la cual posee la forma de la transformación canónica asociada a una función generadora de tipo F1 (qi , Qi , t). Luego, podemos escribir las siguientes ecuaciones en derivadas parciales para F1 , ∂F1 = pi (q, Q, t), ∂qi ∂F1 = Pi (q, Q, t), ∂Qi las cuales, en principio, pueden integrarse para encontrar la función F1 . (6.144) (6.145) 6.5. TRANSFORMACIONES CANÓNICAS 253 Ejemplos. 1. Encontrar la transformación canónica generada por la función F2 (qi , Pi ) = P i qi Pi . Las transformaciones entre las coordenadas (qi , pi ) y (Qi , Pi ) producidas por una función generadora de tipo F2 (qi , Pi , t) conducen a pi = Qi = ∂F2 = Pi ∂qi ∂F2 = qi . ∂Pi (6.146) (6.147) Luego, la transformación canónica {qi , pi } → {Qi , Pi } generada por esta F2 corresponde a la transformación identidad. 2. Encontrar la transformación canónica {qi , pi } → {Qi , Pi }, i = 1, 2, generada por la función G = q1 (P1 + 2p2 ) + p2 P2 . La función es de la forma G(q1 , P1 , p2 , P2 ). Calculamos la derivada dG dt = ∂G ∂G ∂G ∂G Ṗ1 + Ṗ2 q̇1 + ṗ2 + ∂q1 ∂P1 ∂p2 ∂P2 = (P1 + 2p2 )q̇1 + q1 Ṗ1 + (2q1 + P2 )ṗ2 + p2 Ṗ2 . (6.148) Debemos comparar con la condición general Ec. (6.115) que debe cumplir una transformación canónica, dF dt = 2 X pi q̇i − i=1 2 X Pi Q̇i + (H 0 − H) i=1 = p1 q̇1 + p2 q̇2 − P1 Q̇1 − P2 Q̇2 + (H 0 − H). (6.149) Para llevar la Ec. (6.149) a la forma de la Ec. (6.148), expresamos p2 q̇2 = P1 Q̇1 = P2 Q̇2 = d (p2 q2 ) − q2 ṗ2 dt d (P1 Q1 ) − Q1 Ṗ1 dt d (P2 Q2 ) − Q2 Ṗ2 dt y sustituimos en la Ec. (6.149), dF d = p1 q̇1 − q2 ṗ2 + Q1 Ṗ1 + Q2 Ṗ2 + (p2 q2 − P1 Q1 − P2 Q2 ) + (H 0 − H) (6.150) dt dt d (F + P1 Q1 + P2 Q2 − p2 q2 ) = p1 q̇1 − q2 ṗ2 + Q1 Ṗ1 + Q2 Ṗ2 + (H 0 − H). (6.151) dt 254 CAPÍTULO 6. DINÁMICA HAMILTONIANA El lado izquierdo es la derivada total de una función que depende de las variables (qi , pi , Qi , Pi ), i = 1, 2, por lo tanto, la Ec. (6.151) sigue correspondiendo a la condición general para una transformación canónica, Ec. (6.115). Comparando Ec. (6.148) y Ec. (6.151), tenemos G = F + P1 Q1 + P2 Q2 − p2 q2 p1 = P1 + 2p2 , Q1 = q1 −q2 = 2q1 + P2 , Q2 = p2 Luego, la transformación canónica {qi , pi } → {Qi , Pi } generada por G es 6.6. P1 = p1 − 2p2 , Q1 = q1 P2 = −2q1 − q2 Q2 = p2 . Transformaciones canónicas infinitesimales En el Capı́tulo 2 vimos que una transformación infinitesimal de coordenadas, qi0 = qi + δqi , en el espacio de configuración de un sistema, que deja invariante las ecuaciones de Lagrange, constituye una simetrı́a del sistema e implica la existencia de una cantidad conservada asociada a esa simetrı́a. Denominamos corriente de Noether a la cantidad conservada. Podemos extender el concepto de transformaciones infinitesimales al espacio de fase {qi , pi }, mediante una transformación de las coordenadas y momentos conjugados. Consideremos una transformación infinitesimal de la forma Qi = qi + fi (qj , pj ), (6.152) Pi = pi + gi (qj , pj ), (6.153) donde fi (qj , pj ), gi (qj , pj ) son funciones dadas y → 0. Para que la transformación Ecs. (6.152)-(6.153) sea canónica, debe existir una función generadora para ella. Podemos considerar las Ecs. (6.152)-(6.153) como una desviación infinitesimal de una transformación identidad, P la cual, como vimos en un ejemplo anterior, posee la función generadora F2 (qi , Pi ) = i qi Pi . Entonces, podemos asumir que la función generadora de la transformación infinitesimal Ecs. (6.152)-(6.153) corresponde a una pequeña desviación de la función generadora de la transformación identidad; esto es, X F2 (qi , Pi ) = qi Pi + G(qi , Pi ), (6.154) i donde G(qi , Pi ) es una función a ser determinada. 6.6. TRANSFORMACIONES CANÓNICAS INFINITESIMALES 255 La transformación canónica generada por esta función de tipo F2 (qi , Pi ) es pi = Qi = ∂F2 ∂G = Pi + ∂qi ∂qi ∂F2 ∂G = qi + . ∂Pi ∂Pi (6.155) (6.156) Comparando las Ecs. (6.152)-(6.153) y Ecs. (6.155)-(6.156), obtenemos las condiciones para G(qi , Pi ), fi (qj , pj ) gi (qj , pj ) ∂G , ∂Pi ∂G = − . ∂qi = (6.157) (6.158) Si existe tal función G(qi , Pi ), entonces la transformación infinitesimal Ecs. (6.152)(6.153) es canónica. La función G(qi , Pi ) es la función generadora de esa transformación canónica infinitesimal. Por otro lado, si la función F2 (qi , Pi ) y, por tanto G(qi , Pi ), está dada, entonces la correspondiente transformación infinitesimal puede determinarse mediante las Ecs. (6.155)-(6.156). Podemos expresar la función fi , hasta primer orden en , como X ∂G ∂pj ∂G ∂G ∂qj fi (qj , pj ) = = + ∂Pi ∂pj ∂Pi ∂qj ∂Pi j X ∂G ∂G = δij + O() = + O(). (6.159) ∂pj ∂pi j Consideremos el comportamiento del Hamiltoniano bajo una transformación canónica infinitesimal generada por una función G. Supongamos una función general K(qi , pi ) definida en el espacio de fase. El cambio en la función K debido a una transformación canónica infinitesimal, Ecs. (6.152)-(6.153), hasta primer orden en , es δK = K(Qi , Pi ) − K(qi , pi ) = K(qi + fi , pi + gi ) − K(qi , pi ) X ∂K ∂K fi + gi ∂qi ∂pi i X ∂K ∂G ∂K ∂G − ∂qi ∂pi ∂pi ∂qi i = = = [K, G]. (6.160) Supongamos ahora que K = H; entonces el cambio en el Hamiltoniano bajo una transformación canónica infinitesimal está dado por δH = [H, G]. (6.161) 256 CAPÍTULO 6. DINÁMICA HAMILTONIANA Si el Hamiltoniano es invariante ante la transformación canónica infinitesimal, debemos tener δH = 0 y, por lo tanto, [H, G] = 0 ⇒ puesto que ∂G ∂t dG = 0, dt (6.162) = 0. Luego, δH = 0 ⇒ G = cte. Tenemos el siguiente resultado: Si el Hamiltoniano de un sistema es invariante bajo una transformación canónica infinitesimal, la función generadora de esa transformación es una cantidad conservada. Este resultado establece la conexión entre simetrı́as y leyes de conservación para un sistema, y es equivalente al Teorema de Noether en el formalismo Hamiltoniano. En comparación con la descripción Lagrangiana, la relación entre invariancia y constantes de movimiento se expresa de manera más simple en la formulación Hamiltoniana. Como una importante aplicación de una función generadora de una transformación canónica infinitesimal, supongamos que G(q, P ) = H(q, p) y = dt en F2 (qi , Pi ), Ec. (6.154), Entonces, hasta primer orden en dt, podemos escribir las Ecs. (6.155)-(6.156) como Pi Qi ∂H dt, ∂qi ∂H ∂H = qi + dt ' qi + dt. ∂Pi ∂pi = pi − (6.163) (6.164) Usando las ecuaciones de Hamilton q̇i = ∂H , ∂pi ṗi = − ∂H , ∂qi (6.165) podemos expresar Pi = pi + ṗi dt ' pi (t + dt), (6.166) Qi ' qi + q̇i dt ' qi (t + dt). (6.167) Entonces, el Hamiltoniano es la función generadora de la transformación canónica infinitesimal que corresponde a la evolución temporal de las coordenadas y momentos de un sistema en su espacio de fase. 6.7. Propiedades de las transformaciones canónicas Consideremos una transformación canónica Qi = Qi (qj , pj , t), (6.168) Pi = Pi (qj , pj , t). (6.169) Entonces se cumplen las siguientes propiedades: 6.7. PROPIEDADES DE LAS TRANSFORMACIONES CANÓNICAS 257 1. Los paréntesis de Poisson entre ambos conjuntos de variables satisfacen [Qi , Pj ](p,q) = δij = [qi , pj ](p,q) = [Qi , Pj ](P,Q) . (6.170) Igualmente, [Pi , Pj ](p,q) = [Pi , Pj ](P,Q) = 0, (6.171) [Qi , Qj ](p,q) = [Qi , Qj ](P,Q) = 0. (6.172) 2. El paréntesis de Poisson de dos funciones es invariante bajo una transformación canónica, [f, g](p,q) = [f, g](P,Q) , (6.173) donde [f, g](p,q) = [f, g](P,Q) = X ∂f ∂g ∂f ∂g − , ∂qk ∂pk ∂pk ∂qk k X ∂f ∂g ∂f ∂g − . ∂Qk ∂Pk ∂Pk ∂Qk (6.174) (6.175) k Demostración de la Propiedad 1: Supongamos que en las variables (p, q) se cumplen las ecuaciones de Hamilton para un H(q, p), q̇k = ∂H (q, p) , ∂pk ṗk = − ∂H (q, p) ∂qk (6.176) Si la transformación (p, q) → (P, Q) es canónica, entonces existe un Hamiltoniano transformado H 0 (P, Q) tal que Q̇i = ∂H 0 (Q, P ) , ∂Pj Ṗi = − ∂H 0 (Q, P ) , ∂Qj (6.177) y existe una función generadora F de la transformación canónica, tal que H = H0 − ∂F . ∂t (6.178) Por otro lado, Q̇i (pj , qj , t) = X ∂Qi k ∂qk q̇k + ∂Qi ṗk ∂pk + ∂Qi . ∂t (6.179) 258 CAPÍTULO 6. DINÁMICA HAMILTONIANA Sustituyendo las Ecs. (6.176), tenemos X ∂Qi ∂H ∂Qi ∂H ∂Qi Q̇i = − + ∂qk ∂pk ∂pk ∂qk ∂t k X ∂Qi ∂H 0 ∂Qi ∂ 2 F ∂Qi ∂H 0 ∂Qi ∂ 2 F ∂Qi + = − − + ∂qk ∂pk ∂qk ∂pk ∂t ∂pk ∂qk ∂pk ∂qk ∂t ∂t k X ∂Qi X ∂H 0 ∂Qj ∂H 0 ∂Pj = + ∂qk ∂Qj ∂pk ∂Pj ∂pk j k 0 X ∂Qi X ∂H 0 ∂Qj ∂H ∂P j − + ∂pk ∂Q ∂q ∂P ∂q j k j k j k X ∂ ∂F ∂Qi ∂ ∂F ∂Qi ∂Qi − . (6.180) + + ∂qk ∂t ∂pk ∂pk ∂t ∂qk ∂t k Reagrupando terminos y cambiando el orden de las sumas, tenemos " # X ∂H 0 X ∂Qi ∂Pj ∂Qi ∂Pj Q̇i = − ∂Pj ∂qk ∂pk ∂pk ∂qk j k " # X ∂H 0 X ∂Qi ∂Qj ∂Qi ∂Qj + − ∂Qj ∂qk ∂pk ∂pk ∂qk j k ∂Qi ∂F , Qi ; (6.181) + + ∂t ∂t (p,q) es decir, Q̇i = X ∂H 0 ∂Pj j [Qi , Pj ](p,q) + ∂F + , Qi ∂t Para que se satisfaga Q̇i = mente, X ∂H 0 j + (p,q) ∂Qj [Qi , Qj ](p,q) ∂Qi . ∂t (6.182) ∂H 0 en la Ec. (6.182), debemos tener necesaria∂Pi i) [Qi , Pj ](p,q) = δij . El primer término en la Ec. (6.182) entonces da X ∂H 0 ∂H 0 δij = . ∂Pj ∂Pi j ii) [Qi , Qj ](p,q) = 0. El segundo término en la Ec. (6.182) entonces se anula. (6.183) 6.7. PROPIEDADES DE LAS TRANSFORMACIONES CANÓNICAS 259 ∂F ∂Qi iii) , Qi + = 0. ∂t ∂t Si calculamos Ṗi (p, q, t) y comparamos con Ṗi = − ∂H 0 , obtenemos adicio∂Qi nalmente [Pi , Pj ](p,q) = 0. (6.184) Demostración de la propiedad 2: X ∂f ∂g ∂f ∂g [f, q](p.q) = − (6.185) ∂qk ∂pk ∂pk ∂qk k X X X ∂f ∂Qj ∂f ∂Pj ∂g ∂Qj ∂g ∂Pj = + + ∂Q ∂q ∂P ∂q ∂Q ∂p ∂P j k j k j k j ∂pk j j k X X X ∂f ∂Qj ∂f ∂Pj ∂g ∂Qj ∂g ∂Pj − . + + ∂Q ∂p ∂P ∂p ∂Q ∂q ∂P j k j k j k j ∂qk j j k Reagrupando términos y cambiando el orden de las sumas, tenemos " # X ∂f ∂g X ∂Qj ∂Pj ∂Qj ∂Pj [f, q](p.q) = − ∂Qj ∂Pj ∂qk ∂pk ∂pk ∂qk j k " # X ∂f ∂g X ∂Qj ∂Pj ∂Qj ∂Pj − − ∂Pj ∂Qj ∂qk ∂pk ∂pk ∂qk j k X X ∂f ∂Qj ∂g ∂Qj ∂f ∂Pj ∂g ∂Pj + + ∂Q ∂q ∂Q ∂p ∂P j k j k j ∂qk ∂Pj ∂pk j k ∂f ∂Qj ∂g ∂Qj ∂f ∂Pj ∂g ∂Pj − − . (6.186) ∂Qj ∂pk ∂Qj ∂qk ∂Pj ∂pk ∂Pj ∂qk El tercer término (doble suma) es igual a cero; luego podemos reagrupar los dos primeros términos X X ∂f ∂g ∂f ∂g ∂Qj ∂Pj ∂Qj ∂Pj [f, g](p,q) = − − ∂Qj ∂Pj ∂Pj ∂Qj ∂qk ∂pk ∂pk ∂qk j k = [f, g](P,Q) [Qj , Pj ](p,q) , (6.187) pero [Qj , Pj ](p,q) = 1; luego, [f, g](p,q) = [f, g](P,Q) . 260 CAPÍTULO 6. DINÁMICA HAMILTONIANA Ejemplos. 1. Demostrar que la evolución temporal de una condición inicial en el espacio de fase es una transformación canónica. Figura 6.15: Evolución infinitesimal en el espacio de fase. Consideremos la evolución de una condición inicial en el espacio de fase en un intervalo de tiempo infinitesimal, (qi (t0 ), pi (t0 )) → (qi (t0 + dt), pi (t0 + dt)). (6.188) Sean qi = qi (t0 ) y pi = pi (t0 ), y definamos las nuevas coordenadas y momentos como Pj ≡ pj (t0 + dt) = pj (t0 ) + ṗj dt + · · · = pj + ṗj dt + · · · (6.189) Qj ≡ qj (t0 + dt) = qj (t0 ) + q̇j dt + · · · = qj + q̇j dt + · · · Luego, manteniendo solamente términos de primer orden en dt, obtenemos X ∂Qi ∂Pj ∂Qi ∂Pj − [Qi , Pj ](p,q) = ∂qk ∂pk ∂pk ∂qk k X ∂Qi ∂Pj = ∂qk ∂pk k X ∂qi ∂ q̇i ∂pj ∂ ṗj = + dt + dt ∂qk ∂qk ∂pk ∂pk k X ∂ q̇i ∂ ṗj = δik + dt δjk + dt ∂qk ∂pk k X ∂ ṗj ∂ q̇i + δik dt = δik δjk + δjk ∂qk ∂pk k ∂ q̇i ∂ ṗj = δij + + dt . (6.190) ∂qj ∂pi 6.7. PROPIEDADES DE LAS TRANSFORMACIONES CANÓNICAS 261 Usamos las ecuaciones de Hamilton en la Ec. (6.190), q̇i = ∂H , ∂pi ṗj = − ∂H , ∂qj (6.191) y tenemos, ∂2H ∂2H − δt = δij . (6.192) ∂qj ∂pi ∂pi ∂qj Por lo tanto, la transformación infinitesimal Ec. (6.189) es canónica. Esta transformación puede escribirse en la forma [Qi , Pj ](p,q) = δij + Pj = Qj = ∂H (qi (t0 ), pi (t0 )) dt + · · · ∂qi ∂H qj (t0 ) + (qi (t0 ), pi (t0 )) dt + · · · . ∂pj pj (t0 ) − (6.193) (6.194) Comparando las Ecs. (6.193)-(6.194) con las Ecs. (6.155)-(6.156), vemos que el Hamiltoniano actúa como la función generadora de la transformación canónica infinitesimal {qi (t0 ), pi (t0 )} → {qi (t0 +dt), pi (t0 +dt)}. Puesto que la condición inicial puede tomarse en cualquier punto de la trayectoria, concluimos que la evolución temporal de un sistema en su espacio de fase es una transformación canónica inducida por el Hamiltoniano del sistema. 2. Demostrar que la siguiente transformación es canónica: P1 = p1 − 2p2 , P2 = −2q1 − q2 , Q1 = q1 Q2 = p2 . (6.195) Las transformaciones canónicas deben satisfacer la propiedad [Qi , Pj ](p,q) = δij , ∀i, j. Calculamos, para la transformación Ec. (6.195), los siguientes paréntesis de Poisson, X ∂Q1 ∂P1 ∂Q1 ∂P1 [Q1 , P1 ](p,q) = − ∂qi ∂pi ∂pi ∂qi i ∂Q1 ∂P1 ∂Q1 ∂P1 ∂Q1 ∂P1 ∂Q1 ∂P1 = − + − = 1. ∂q1 ∂p1 ∂p1 ∂q1 ∂q2 ∂p2 ∂p2 ∂q2 [Q2 , P2 ](p,q) = [Q2 , P1 ](p,q) = [Q1 , P2 ](p,q) = ∂Q2 ∂P2 ∂Q2 ∂P2 − ∂q1 ∂p1 ∂p1 ∂q1 ∂Q2 ∂P1 ∂Q2 ∂P1 − ∂q1 ∂p1 ∂p1 ∂q1 ∂Q1 ∂P2 ∂Q1 ∂P2 − ∂q1 ∂p1 ∂p1 ∂q1 + + + Luego la transformación Ec. (6.195) es canónica. ∂Q2 ∂P2 ∂Q2 ∂P2 − ∂q2 ∂p2 ∂p2 ∂q2 ∂Q2 ∂P1 ∂Q2 ∂P1 − ∂q2 ∂p2 ∂p2 ∂q2 ∂Q1 ∂P2 ∂Q1 ∂P2 − ∂q2 ∂p2 ∂p2 ∂q2 = 1. = 0. = 0. 262 6.8. CAPÍTULO 6. DINÁMICA HAMILTONIANA Aplicaciones de transformaciones canónicas Una transformación canónica {qi , pi , t} → {Pi , Qi , t} es particularmente conveniente cuando el cambio de variables es tal que alguna coordenada Qj o momento Pk no aparece explı́citamente en el Hamiltoniano transformado H 0 (Qi , Pi , t). Se dice que esa coordenada o momento es cı́clica para H 0 . Por ejemplo, si ∂H 0 = 0, ∂Qj (6.196) entonces, la ecuación de Hamilton para el momento Pj es 0 ∂H P˙j = − =0 ∂Qj ⇒ Pj = cte. (6.197) Es decir, el momento Pj es una cantidad conservada. En este caso, las ecuaciones de Hamilton resultan más fáciles de integrar en las nuevas variables (Pi , Qi ) que en las variables originales (qi , pi ). Una vez encontradas las soluciones Pi (t) y Qi (t), la transformación canónica puede ser empleada para expresar la solución en las variables originales qi = qi (Qi (t), Pi (t), t) y pi = pi (Qi (t), Pi (t), t). Como una aplicación de este procedimiento, consideremos un oscilador armónico simple cuyo Hamiltoniano es p2 1 1 2 + kq 2 = (p + m2 ω 2 q 2 ), ω 2 = k/m. (6.198) 2m 2 2m Busquemos una transformación canónica {p, q} → {P, Q} donde Q sea cı́clica en el nuevo Hamiltoniano H 0 (Q, P ). La forma de H (suma de dos términos cuadráticos) en la Ec. (6.198) sugiere una transformación canónica del tipo H(q, p) = p= f (P ) cos Q, (6.199) f (P ) sin Q, q= mω donde f (P ) es una función de P a ser determinada. Sustituyendo la transformación Ecs. (6.199) en H(q, p), tenemos el Hamiltoniano transformado en las nuevas variables 1 1 2 (p(Q, P ))2 + m2 ω 2 (q(Q, P ))2 = H 0 (Q, P ) = [f (P )] , (6.200) 2m 2m el cual es independiente de Q. Para encontrar la función f (P ), busquemos la función generadora que produce la transformación Ecs. (6.199). De estas ecuaciones obtenemos p = mωq cot Q ⇒ p = p(q, Q), (6.201) lo cual corresponde a una transformación asociada a una función generadora del tipo F1 (q, Q), pues recordemos que ∂F1 = p(q, Q), ∂q ∂F1 P =− = P (q, Q). ∂Q p= (6.202) (6.203) 6.8. APLICACIONES DE TRANSFORMACIONES CANÓNICAS 263 Sustituyendo la Ec. (6.201) en la Ec. (6.202), tenemos ∂F1 = mωq cot Q, ∂q (6.204) lo cual implica que F1 (q, Q) = mωq 2 cot Q, 2 (6.205) mientras que P =− ∂F1 mωq 2 = csc2 Q . ∂Q 2 (6.206) 2P sin Q = q(Q, P ). mω (6.207) Despejando q, r q= Sustituyendo q en la Ec. (6.201), obtenemos √ p= 2mωP cos Q = p(Q, P ). (6.208) Comparando con la forma de la transformación propuesta, Ecs. (6.199), vemos que 1/2 f (P ) = (2mωP ) . (6.209) Luego, H 0 (Q, P ) = ωP. (6.210) ∂F1 = 0, tenemos ∂t Por otro lado, puesto que H(q, p) = H 0 (Q, P ). (6.211) Adicionalmente, tenemos ∂H =0 ∂t ⇒ H = E = cte, (6.212) donde E es la energı́a total del sistema. Entonces, H 0 = ωP = E. Las ecuaciones de Hamilton para Q y P dan Ṗ ∂H 0 E = 0 ⇒ P = cte ⇒ P = . ∂Q ω ∂H 0 = ω ⇒ Q(t) = ωt + ϕ . ∂P = − Q̇ = (6.213) 264 CAPÍTULO 6. DINÁMICA HAMILTONIANA Sustituyendo en q(P, Q) y p(P, Q) en las Ecs. (6.207)-(6.208), obtenemos las soluciones para las coordenadas y momentos originales, r 2E q(t) = sin(ωt + ϕ), (6.214) mω 2 √ p(t) = 2Em cos(ωt + ϕ), (6.215) 1/2 2E es la amplitud de la oscilación y ϕ es la fase. donde mω 2 6.9. Ecuación de Hamilton-Jacobi Hemos visto que una transformación canónica {qi , pi , t} → {Pi , Qi , t}, i = 1, . . . , s, puede ser usada para encontrar las soluciones de las ecuaciones de Hamilton para un sistema con un Hamiltoniano H(qi , pi , t), mediante las soluciones de esas ecuaciones para un Hamiltoniano transformado en nuevas variables H 0 (Qi , Pi , t), tal que alguna (o varias) coordenada Qj sea cı́clica en H 0 . Una vez encontrada la solución en las nuevas variables (Qi (t), Pi (t)), donde el momento conjugado Pj = cte, las relaciones de la transformación canónica pueden ser empleadas para expresar la solución en las variables originales, qi = qi (Qi (t), Pi (t), t) , pi = pi (Qi (t), Pi (t), t). (6.216) Este procedimiento puede ser generalizado. Supongamos que encontramos una transformación canónica {qi , pi , t} → {Pi , Qi , t} tal que las 2s nuevas coordenadas y momentos (Pi , Qi ) correspondan a constantes. En este caso, el nuevo Hamiltoniano H 0 (Qi , Pi ) es constante y todas las Qi y Pi son cı́clicas en H 0 . A su vez, las 2s cantidades constantes Qi y Pi pueden expresarse en función de las 2s condiciones iniciales (qi (0), pi (0)); es decir, Qi = q(qj (0), pj (0)), Pi = p(qj (0), pj (0)). Entonces, las ecuaciones de la transformación canónica que relacionan las nuevas y viejas variables proporcionan directamente la solución del problema del movimiento, qi = q(qj (0), pj (0), t) , pi = p(qj (0), pj (0), t). (6.217) En particular, si requerimos que la transformación canónica que conduce a nuevos momentos y coordenadas constantes, Pi ≡ αi = cte, Qi ≡ βi = cte, sea tal que H 0 (Qi , Pi ) = 0, entonces debe existir una función generadora F tal que ∂F + H = 0. ∂t (6.218) La condición que debe cumplirse para que tal transformación canónica exista, es la ecuación de Hamilton-Jacobi, y corresponde a la Ec. (6.218) para una F apropiada. Para derivar la ecuación de Hamilton-Jacobi y encontrar la función generadora apropiada, consideremos la acción de un sistema, Z t2 S= L(qi , q̇i , t) dt . (6.219) t1 6.9. ECUACIÓN DE HAMILTON-JACOBI 265 El valor de la acción S, como integral definida, depende del conjunto de trayectorias {qi (t)}. En particular, para las trayectorias que satisfacen la ecuaciones de Lagrange correspondientes, el valor de S es mı́mino (extremo). Figura 6.16: Trayectoria qi (t) que pasa por los puntos qi (t1 ) y qi (t2 ). Supongamos que el tiempo t2 es variable, i.e, t2 = t. Entonces, la acción dependerá de las trayectorias y del tiempo, S = S(qi , t). Luego, como función de sus argumentos qi y t, la derivada temporal de la acción es X ∂S dS ∂S = q̇i + . dt ∂q ∂t i i (6.220) Por otro lado, si t2 = t, la definición de la acción Ec. (6.219) implica que X dS =L= pi q̇i − H(pi , qi , t). dt i (6.221) Comparando la Ec. (6.220) con la Ec. (6.221), obtenemos las relaciones ∂S (qi , t) , ∂qi (6.222) ∂S (qi , t) + H(pi , qi , t) = 0 , ∂t (6.223) pi = las cuales se pueden expresar mediante la ecuación ∂S ∂S (qi , t) + H , qi , t = 0 . ∂t ∂qi (6.224) La Ec. (6.224) es la ecuación de Hamilton-Jacobi. Comparando la Ec. (6.218) con la ecuación de Hamilton-Jacobi Ec. (6.224), vemos que la acción S puede interpretarse como una función generadora capaz de producir la transformación canónica buscada. Más aún, la acción S puede interpretarse como una función generadora de tipo F2 (qi , Pi , t), Ec. (6.120), que satisface la Ec. (6.218) y tal que Pi = αi = cte, Qi = βi = cte. 266 CAPÍTULO 6. DINÁMICA HAMILTONIANA Figura 6.17: Carl Gustav Jacobi (1804-1851). Calculamos la derivada total de F2 (qi , Pi , t), X ∂F2 dF2 ∂F2 ∂F2 = Ṗi + . q̇i + dt ∂qi ∂Pi ∂t i Usando la relación pi = ∂F2 ∂qi (6.225) satisfecha por las funciones generadoras de tipo F2 , la condición Ec. (6.218) que debe cumplir F = F2 , y el hecho que Ṗi = 0, tenemos X dF2 = pi q̇i − H, dt i (6.226) que es análoga a la Ec. (6.221) satisfecha por S. Luego, la acción debe poseer la forma S(qi , Pi , t), donde Pi = αi = cte. Si comparamos las relaciones satisfechas por una función F2 (qi , Pi , t) y por S(qi , Pi , t), tenemos ∂F2 ∂S pi = pi = (qi , Pi , t) (qi , Pi , t) = pi (qi , Pi , t) ∂qi ∂q i ∂F2 ∂S (6.227) Qi = (qi , Pi , t) Qi = (qi , Pi , t) = Qi (qi , Pi , t) ∂Pi ∂Pi ∂F2 ∂S H+ = H0 H+ =0 ∂t ∂t donde Pi = cte = αi y Qi = cte = βi . Entonces H 0 (Pi , Qi ) = cte. Luego, para que exista una transformación canónica {pi , qi } → {Pi , Qi } = {αi , βi }, Ec. (6.227), generada por F2 = S, tal que H 0 (Pi , Qi ) = 0, debe cumplirse la ecuación de Hamilton-Jacobi, ∂S + H = 0. ∂t (6.228) Note que la solución S(qi , Pi , t) de la ecuación de Hamilton-Jacobi, o más bien, las derivadas parciales de S, proporcionan la transformación {pi , qi , t} → {Pi , Qi , t}. Por otro lado, las constantes Pi y Qi se pueden expresar, en principio, en términos de las 6.9. ECUACIÓN DE HAMILTON-JACOBI 267 2s condiciones iniciales (qi (0), pi (0)). Luego, el proceso de solución de la ecuación de Hamilton-Jacobi para un sistema suministra la trayectoria qi (t) = qi (qi (0), pi (0), t) y pi (t) = pi (qi (0), pi (0), t) como resultado adicional. Consequentemente, la ecuación de Hamilton-Jacobi constituye el método más poderoso para encontrar la integración general de las ecuaciones de movimiento de un sistema. Matemáticamente, la ecuación de Hamilton-Jabobi corresponde a una ecuación en derivadas parciales de primer orden para S(qi , t) en s + 1 variables, ∂S ∂S ∂S ∂S (q1 , . . . , qs , t) + H q1 , . . . , qs , , ..., , t = 0. ∂t ∂q1 ∂q2 ∂qs (6.229) La solución de la ecuación de Hamilton-Jacobi, Ec. (6.229), para la acción S(qi , t) requiere de s+1 constantes de integración. Pero S no figura explı́citamente como incógnita en la Ec. (6.229), sólo aparecen sus derivadas con respecto a las qi y t. Luego, si S es solución de la Ec. (6.229), entonces S + cte, también es una solución. Por lo tanto, una de las (s + 1) constantes de integración es irrelevante para la solución. Las s constantes deben ser las Pi = αi , para que la acción tenga la forma S(qi , Pi , t). Luego, la solución de la ecuación de Hamilton-Jacobi puede expresarse en la forma S = S(q1 , . . . , qs , P1 , . . . , Ps , t) = S(qi , αi , t), i = 1, . . . , s. (6.230) Si el Hamiltoniano H es independiente del tiempo, entonces H es constante e igual a la energı́a total del sistema, H(qi , pi ) = cte = E. En ese caso, se puede buscar una solución de la ecuación de Hamilton-Jacobi, Ec. (6.229), por separación de variables; esto es, suponemos que la solución S tiene la forma S(qi , Pi , t) = S(qi , αi , t) = W (qi , Pi ) − E t = W (qi , αi ) − E t, (6.231) donde una de las s constantes αi es E. La función W (qi , Pi ) = W (qi , αi ) se llama función caracterı́stica o principal de Hamilton. En ese caso, sustitución de S en la Ec. (6.229) resulta en una ecuación para la función W (qi , Pi ), de la forma H ∂W (qi , E, Pj ), qi ∂qi = E, (6.232) donde escogemos P1 = α1 = E, Pj = αj , j = 2, . . . , s. La Ec. (6.232) se denomina ecuación de Hamilton-Jacobi independiente del tiempo. En particular, si el Hamiltoniano es independiente del tiempo, la coordenada constante Q1 = β1 asociada a P1 = E satisface Q1 = = ∂S ∂S = ∂P1 ∂E ∂W − t = β1 . ∂E (6.233) 268 CAPÍTULO 6. DINÁMICA HAMILTONIANA Las relaciones de la transformacion canónica en términos de la función caracterı́stica W (qi , Pi ) corresponden a pi = Qi = ∂S ∂W = , ∀i, ∂qi ∂qi ∂S ∂W = , i 6= 1. ∂Pi ∂Pi (6.234) (6.235) Entonces, la condición H(qi , pi ) = E se puede expresar como ∂W H (qi , Pi ), qi = E , ∂qi (6.236) que es la ecuación de Hamilton-Jacobi independiente del tiempo satisfecha por la función caracterı́stica W (qi , Pi ). El método de separación de variables para buscar una solución de la ecuación de Hamilton-Jacobi también puede emplearse cuando una coordenada es cı́clica. Una coordenada qk cı́clica no aparece explı́citamente en el Hamiltoniano y, por lo tanto, tampoco aparece en la correspondiente ecuación de Hamilton-Jacobi. Si el Hamiltoniano es constante, entonces se puede buscar una solución de esta ecuación en la forma S(qi , Pi , t) = W (qj , Pi ) + Pk qk − Et, j 6= k. (6.237) Entonces, ∂S = Pk = αk = cte. (6.238) ∂qk La constante Pk = αk es justamente el valor constante del momento conjugado pk asociado a la variable cı́clica qk . La presencia del término −Et en la expresión Ec. (6.237) para un sistema conservativo corresponde a la separación de la variable t, que no aparece explı́citamente en el Hamiltoniano. En ciertos sistemas, es posible encontrar una solución por separación de variables en forma aditiva; esto es, suponemos la acción de la forma pk = S(qi , Pi , t) = W (qi , Pi ) − Et = s X Wk (qk , Pi ) − Et, (6.239) k=1 donde cada función Wk depende solamente de una coordenada qk . Si una coordenada qk es cı́clica, tomamos Wk = Pk qk . Las relaciones de la transformacion canónica se convierten en pk = Qk = ∂Wk (qk , P1 , . . . , Ps ) , ∂qk s X ∂Wi (qk , P1 , . . . , Ps ) − δ1i t . ∂Pk i=1 En este caso, se dice que el sistema es completamente separable. (6.240) (6.241) 6.9. ECUACIÓN DE HAMILTON-JACOBI 269 Para sistemas completamente separables es posible reducir el problema de la ecuación de Hamilton-Jacobi a un conjunto de s ecuaciones diferenciales de primer orden, Ecs. (6.240); una ecuación para cada función Wk que depende de qk y de constantes Pi = αi . Cada ecuación permite encontrar la correspondiente Wk mediante una integración explı́cita sobre la coordenada qk . Adicionalmente, las s Ecs. (6.241) permiten obtener, por inversión, las coordenadas qk = qk (Qi , Pi , t). Aunque la ecuación de Hamilton-Jacobi para un sistema dinámico dado puede ser completamente separable en un sistema de coordenadas, puede no serlo en otro. En general, no existen condiciones de separabilidad a priori; aunque consideraciones de simetrı́a pueden ayudar. Por ejemplo, un problema con simetrı́a esférica usualmente puede ser separable en coordenadas esféricas. La ecuación de Hamilton-Jacobi, cuando es separable, es el método más poderoso para encontrar la solución general de las ecuaciones de movimiento para un sistema. Ejemplos. 1. Ecuación de Hamilton-Jacobi para un oscilador armónico simple y obtención de la trayectoria (q(t), p(t)) y de la acción asociada a este sistema. El Hamiltoniano es H(q, p) = 1 p2 + m2 ω 2 q 2 . 2m (6.242) La acción para este sistema con s = 1 tiene la forma S(q, t). La ecuación de Hamilton-Jacobi es ∂S (q, t) + H(p, q) = 0. (6.243) ∂t Hay una sóla relación para el momento, p= ∂S (q, t) ∂q (6.244) y, sustituyendo en la Ec. (6.243), obtenemos la ecuación de Hamilton-Jacobi para el oscilador armónico, 1 ∂S + ∂t 2m " ∂S ∂q 2 # 2 2 2 +m ω q = 0. (6.245) Puesto que ∂H ∂t = 0, el Hamitoniano es constante e igual a la energı́a total del sistema, H = E. Luego, podemos buscar una solución de la Ec. (6.245) mediante separación de variables, S(q, E, t) = W (q, E) − E t, (6.246) 270 CAPÍTULO 6. DINÁMICA HAMILTONIANA donde P = E = α es la única constante de integración para la Ec. (6.245). Sustitución en la Ec. (6.245) da " # 2 1 ∂W 2 2 2 (6.247) +m ω q =E. 2m ∂q Calculamos W (q, E), ∂W = (2mE − m2 ω 2 q 2 )1/2 , ∂q Z W (q, E) = (2mE − m2 ω 2 q 2 )1/2 dq. (6.248) (6.249) Luego, Z S(q, E, t) = (2mE − m2 ω 2 q 2 )1/2 dq − Et. (6.250) La función S(q, E, t) permite encontrar las relaciones de la transformación canónica generada por S a partir de sus derivadas parciales, ∂W ∂S = , ∂q ∂q (6.251) ∂S ∂S = = β = cte. ∂P ∂E (6.252) p= Q= Derivando S con respecto a E en la Ec. (6.250), la relación Ec. (6.252) da r Z ∂S m dq r − t. (6.253) Q= = ∂E 2E mω 2 q 2 1− 2E Integrando la Ec. (6.253), obtenemos r 1 m −1 Q+t= sin ωq , ω 2E (6.254) y despejando q, r q(Q, E, t) = 2E sin(ωt + β 0 ), mω 2 β 0 = Qω = cte. (6.255) La relación Ec. (6.251) da p= p ∂W = 2mE − m2 ω 2 q 2 , ∂q y sustituyendo q de la Ec. (6.255), tenemos √ p(Q, E, t) = 2mE cos(ωt + β 0 ). (6.256) (6.257) 6.9. ECUACIÓN DE HAMILTON-JACOBI 271 Las constantes Q = β y P = E se pueden expresar en términos de las condiciones iniciales q(0) = q0 y p(0) = p0 . Evaluando las Ecs. (6.255) y (6.257) en t = 0, tenemos r 2E sin(ωQ), (6.258) q0 = mω 2 √ p0 = 2mE cos(ωQ). (6.259) Luego, q0 tan(ωQ) = mω p0 ⇒ 1 q0 −1 Q = tan mω . ω p0 (6.260) Evaluando la Ec. (6.256) en t = 0, E= 1 p20 + m2 ω 2 q02 = P. 2m (6.261) Las Ecs. (6.255) y (6.257), junto con las relaciones (6.260) y (6.261), expresan la solución de las ecuaciones de Hamilton para el oscilador armónico en términos de las condiciones iniciales, p = p(q0 , p0 , t) y q = q(q0 , p0 , t). Aunque la solución explı́cita para la acción S no es necesaria para la obtención de la trayectoria p(q0 , p0 , t) y q(q0 , p0 , t), la cantidad S puede encontrarse a partir de la integración de la Ec. (6.250), Z r mω 2 q 2 2mE 1− dq − Et 2E Z r √ q2 2mE 1 − 2 dq − Et a " # 1/2 √ 1 q2 −1 q 2mE q 1 − 2 + a sin − Et, 2 a a √ S(q, E, t) = = = (6.262) r 2E . Sustituyendo q de la Ec. (6.255) en la Ec. (6.262), podemos mω 2 obtener S como función de t, donde a ≡ S(t) = = = 1 √ a 2mE sin(ωt + β 0 ) cos(ωt + β 0 ) + sin−1 (sin(ωt + β 0 )) − Et 2 E 1 0 0 sin[2(ωt + β )] + (ωt + β ) − Et ω 2 E sin[2(ωt + β 0 )], (6.263) 2ω donde las constantes han sido suprimidas en la Ec. (6.263). 272 CAPÍTULO 6. DINÁMICA HAMILTONIANA 2. Relación entre la ecuación de onda de Schrödinger de la Mecánica Cuántica y la ecuación de Hamilton-Jacobi de la Mecánica Clásica. Consideremos, por simplicidad, la ecuación de Schrödinger unidimensional para la función de onda Ψ(x, t) de una partı́cula de masa m en el potencial V (x, t), i~ ∂Ψ ~2 ∂ 2 Ψ + V (x, t)Ψ . =− ∂t 2m ∂x2 (6.264) Figura 6.18: Erwin Schrödinger (1887-1961). Suspongamos una solución de la forma i Ψ(x, t) = R(x, t)e ~ S(x,t) , (6.265) donde R(x, t) es la parte real que da la amplitud de la función de onda y S(x, t) es la fase correspondiente. Calculamos las derivadas parciales i i i ∂Ψ i i = Ψ̇ = Ṙe ~ S + RṠe ~ S = Ṙ + RṠ e ~ S . (6.266) ∂t ~ ~ Ψ0 = Ψ00 = ∂2Ψ ∂x2 ∂Ψ = ∂x i i R0 + RS 0 e ~ S . ~ (6.267) = = i i i i 0 iS R00 + (R0 S 0 + RS 00 ) e ~ S + R0 + RS 0 S e~ ~ ~ ~ i i i 1 R00 + 2 R0 S 0 + RS 00 − 2 RS 02 e ~ S . (6.268) ~ ~ ~ Sustituyendo las derivadas de Ψ en la Ec. (6.264), tenemos i ~2 i i 1 i~ Ṙ + RṠ = − R00 + 2 R0 S 0 + RS 00 − 2 RS 02 + V R. ~ 2m ~ ~ ~ (6.269) En el lı́mite clásico ~ → 0, la Ec. (6.269) queda −RṠ = 1 RS 02 + V R, 2m (6.270) 6.9. ECUACIÓN DE HAMILTON-JACOBI 273 la cual se puede escribir como ∂S 1 + ∂t 2m ∂S ∂x 2 + V = 0. (6.271) Pero el Hamiltoniano de la partı́cula es p2 + V, 2m y el momento, en términos de la acción clásica S, es H= (6.272) ∂S . (6.273) ∂x Luego, la Ec. (6.271) es la ecuación de Hamilton-Jacobi para la fase S(x, t). ∂S ∂S +H , x = 0. (6.274) ∂t ∂x p= En el lı́mite clásico, la fase S(x, t) de la función de onda Ψ(x, t) corresponde a la acción y satisface la ecuación de Hamilton-Jacobi. 3. Separación de variables en la ecuación de Hamilton-Jacobi en coordenadas esféricas en un sistema cuyo potencial posee simetrı́a azimutal. Consideremos una partı́cula en un potencial con simetrı́a azimutal alrededor del eje z (independiente del ángulo φ) en coordenadas esféricas de la forma, b(θ) . (6.275) r2 donde a(r) y b(θ) son funciones dadas. Por ejemplo, el potencial de un campo gravitacional uniforme o el potencial eléctrico de un dipolo, ambos expresados en coordenadas esféricas, poseen simetrı́a azimutal. En particular, el problema de Kepler corresponde a a(r) = −k/r y b(θ) = 0. V (r, θ) = a(r) + El Lagrangiano para este sistema, en coordenadas esféricas, es 1 b(θ) 2 2 2 2 2 2 L = m(ṙ + r θ̇ + r ϕ̇ sin θ) − a(r) + 2 . 2 r Para este sistema, se obtiene el siguiente Hamiltoniano ! 2 2 p 1 p b(θ) φ 2 θ H(r, θ, φ, pr , pθ , pφ ) = pr + 2 + 2 2 + a(r) + 2 . 2m r r r sin θ (6.276) (6.277) La acción para este sistema es una función S(r, θ, φ, t). Los momentos conjugados satisfacen ∂S pr = , (6.278) ∂r ∂S pθ = , (6.279) ∂θ ∂S pφ = . (6.280) ∂φ 274 CAPÍTULO 6. DINÁMICA HAMILTONIANA La ecuación de Hamilton-Jacobi es ∂S + H = 0. ∂t (6.281) Sustituyendo H y los momentos en la Ec. (6.281), obtenemos la ecuación de HamiltonJacobi para este sistema, " 2 2 # 2 1 ∂S 1 ∂S 1 ∂S ∂S b(θ) + + 2 + 2 2 + a(r) + 2 = 0. ∂t 2m ∂r r ∂θ r r sin θ ∂φ (6.282) Puesto que el Hamiltoniano es independiente del tiempo y la coordenada φ es cı́clica, podemos buscar una solución en la forma separable S(r, θ, φ, P1 , P2 , P3 , t) = Wr (r, E, Pφ , P3 ) + Wθ (θ, E, Pφ , P3 ) + Pφ φ − Et, (6.283) donde hemos tomado Wφ = Pφ φ, y P1 = E, P2 = Pφ y P3 son constantes. Las Ecs. (6.280) y (6.283) implican que pφ = Pφ = cte. La cantidad constante pφ es el valor de la componente lz del momento angular. Sustituyendo S en la Ec. (6.282), obtenemos " # 2 2 p2φ 1 ∂Wθ ∂Wr 1 + a(r) + + 2m b(θ) + = E, (6.284) 2 2m ∂r 2mr ∂θ 2mr2 sin2 θ lo cual se puede expresar como " # 2 2 p2φ ∂Wr ∂Wθ 2 2 2 r . (6.285) + 2mr a(r) − 2mr E = − + 2m b(θ) − ∂r ∂θ sin2 θ En términos de las coordenadas, el lado izquierdo del la Ec. (6.285) corresponde a una función que depende solamente de r, mientras que el lado derecho representa a una función dependiente solamente de θ. Entonces, para que ambos lados sean iguales en la Ec. (6.285), ambas funciones deben ser iguales a una misma constante, 2 p2φ ∂Wθ + 2m b(θ) + = P3 , (6.286) ∂θ sin2 θ 2 ∂Wr 2 r + 2mr2 a(r) − 2mr2 E = −P3 , (6.287) ∂r donde hemos fijado la constante como −P3 , puesto que las funciones Wr y Wθ deben depender de las tres constantes E, pφ , P3 . Despejando, tenemos " #1/2 p2φ ∂Wθ = P3 − 2m b(θ) − , (6.288) ∂θ sin2 θ 1/2 ∂Wr P3 = 2m E − − a(r) . (6.289) ∂r 2mr2 6.9. ECUACIÓN DE HAMILTON-JACOBI 275 Mediante integración obtenemos #1/2 Z " p2φ Wθ (θ, pφ , P3 ) = P3 − 2m b(θ) − dθ, sin2 θ 1/2 Z P3 dr, Wr (r, E, P3 ) = 2m (E − a(r)) − 2 r (6.290) (6.291) y ya teniamos Wφ = pφ φ. Luego, el sistema es completamente separable. La acción correspondiente es s Z r Z p2φ P3 S= 2m (E − a(r)) − 2 dr + P3 − 2m b(θ) − dθ + pφ φ − E t. r sin2 θ (6.292) Las coordenadas constantes Q1 , Q2 y Q3 de la transformación canónica generada por S satisfacen las relaciones Q1 = Q2 = Q3 = ∂S = ∂E ∂S = ∂pφ ∂S = ∂P3 ∂Wr (r, E, P3 ) − t = Q1 (r, E, P3 , t), ∂E ∂Wθ (θ, pφ , P3 ) + φ = Q2 (θ, φ, pφ , P3 ), ∂pφ ∂Wr ∂Wθ + = Q3 (r, θ, E, φ, P3 ). ∂P3 ∂P3 (6.293) (6.294) (6.295) La Ec. (6.293) permite encontrar la solución r = r(E, P3 , Q1 , t). Esta solución para r se puede sustituir en la Ec. (6.295), y entonces las Ecs. (6.294) y (6.295) constituyen un sistema de dos ecuaciones para θ y φ, las cuales pueden resolverse dando como resultado θ = θ(E, pφ , P3 , Q1 , Q2 , Q3 , t) y φ = φ(E, pφ , P3 , Q1 , Q2 , Q3 , t). Por otro lado, consideremos las Ecs. (6.278)-(6.279) para los momentos pr = pθ = ∂S ∂Wr = = pr (r, E, P3 ), ∂r ∂r ∂S ∂Wθ = = pθ (θ, P3 , pφ ). ∂θ ∂θ (6.296) (6.297) Sustitución de las soluciones para las coordenadas r y θ en estas ecuaciones conduce a las soluciones para los momentos pr y pθ (pφ es una constante) en función del tiempo y de las constantes E, pφ , P3 , Q1 , Q2 , Q3 . Luego, el método de la ecuación de Hamilton-Jacobi permite obtener la solución completa de las ecuaciones de movimiento (coordenadas y momentos) en términos de seis constantes (E, pφ , P3 , Q1 , Q2 , Q3 ). 276 CAPÍTULO 6. DINÁMICA HAMILTONIANA 6.10. Variables de acción-ángulo Supongamos que tenemos un sistema dinámico con las siguientes condiciones: (1) su Hamiltoniano H(qi , pi ) es constante, (2) el sistema es completamente separable, (3) sus movimientos son finitos. La condición (1) implica que podemos escribir la ecuación Hamilton-Jacobi independiente del tiempo para el sistema, ∂W H (qi , Pi ), qi = E , (6.298) ∂qi donde Pi = αi = cte. La función caracterı́stica de Hamilton W (qi , Pi ), que satisface la Ec. (6.298), puede interpretarse como una función generadora de tipo F2 (qi , Pi ), independiente del tiempo, que produce una transformación canónica (qi , pi ) → (Qi , Pi ) tal que las coordenadas Qi son cı́clicas en el nuevo Hamiltoniano; es decir, H 0 (Pi ). En efecto, con esta condición sobre H 0 , los nuevos momentos Pi son constantes, pues Ṗi = − ∂H 0 (Pi ) = 0 ⇒ Pi = αi = cte. ∂Qi (6.299) Entonces, H 0 (Pi ) = H 0 (αi ) = cte. La función generadora F2 (qi , Pi ) = W (qi , Pi ) = W (qi , αi ) satisface la relación H0 = H + ∂F2 ∂t ⇒ H 0 = H. (6.300) Puesto que H(qi , pi ) = E, tenemos H(qi , pi ) = E = H 0 (Pi ). (6.301) Las relaciones de la transformacion canónica generada por W (qi , Pi ) corresponden a pi = Qi = ∂W , ∂qi ∂W . ∂Pi Luego, la relación H(qi , pi ) = E se puede expresar como ∂W (qi , Pi ), qi = E , H ∂qi (6.302) (6.303) (6.304) que es la ecuación de Hamilton-Jacobi independiente del tiempo satisfecha por la función caracterı́stica W (qi , Pi ). 6.10. VARIABLES DE ACCIÓN-ÁNGULO 277 Debido a la condición (2), podemos expresar la función caracterı́stica de Hamilton como s X W (q1 , . . . , qs , α1 , . . . , αs ) = Wi (qi , α1 , . . . , αs ). (6.305) i=1 Entonces, las relaciones de la transformación canónica (qi , pi ) → (Qi , αi ) generada por W (qi , Pi ) = W (qi , αi ) están dadas por pi = Qi = ∂Wi (qi , α1 , . . . , αs ) , ∂qi ∂Wi (qi , α1 , . . . , αs ) . ∂αi (6.306) (6.307) El nuevo Hamiltoniano entonces tiene la forma H 0 (α1 , . . . , αs ) = E. La Ec. (6.306) implica la relación funcional pi = pi (qi , α1 , . . . , αs ), (6.308) la cual define una curva o trayectoria sobre el plano (qi , pi ) que depende de los parámetros α1 , . . . , αs . Esta curva es una proyección sobre el plano (qi , pi ) de la trayectoria del sistema en su espacio de fase 2s-dimensional. Adicionalmente, la condición (3) implica que esta curva debe ser una órbita cerrada o periódica en el plano (qi , pi ), que denotamos por Ci . Existe una tal órbita Ci en cada uno de los planos (qi , pi ) del espacio de fase. Figura 6.19: (a) Libración. (b) Rotación. (c) Libración y rotación en el espacio de fase de un péndulo simple. La órbita Ci en un plano (qi , pi ) refleja la periodicidad de las variables conjugadas pi y qi , y puede ser de dos tipos: 278 CAPÍTULO 6. DINÁMICA HAMILTONIANA 1. Libración: ocurre cuando los valores de ambos, qi y pi , se repiten, trazando una órbita cerrada. En este caso, tanto qi como pi , son funciones periódicas en el tiempo. El oscilador armónico y el problema de Kepler con E < 0 son ejemplos de este tipo de órbitas. Las órbitas de libración son curvas cerradas que no siempre son elipses. 2. Rotación: corresponde a una órbita tal que pi es una función periódica de qi , con perı́odo qi0 . Los valores de pi están acotados, pero los de qi pueden incrementarse indefinidamente. Ejemplos son los movimientos de un cuerpo rı́gido libre y de un trompo simétrico con un punto fijo, donde la coordenada qi es un ángulo que puede incrementarse en 2π sin cambio en la configuración del sistema. En general, la coordenada qi asociada a este tipo de órbita corresponde a un ángulo de rotación. Ambos tipos de órbitas periódicas pueden aparecer en un sistema dinámico, dependiendo de los valores de sus parámetros. Ejemplo. 1. El péndulo simple es un ejemplo clásico, donde la coordenada q es el ángulo θ con respecto a la vertical. La energı́a del sistema es E= p2 − mgl cos q , 2ml2 (6.309) de donde obtenemos la órbita en el plano (q, p), p p(q, E) = ± 2ml2 (E + mgl cos q) . Si E < mgl, entonces q oscila entre los puntos de retorno q1,2 = ± cos−1 (6.310) E − mgl , para los cuales p = 0. Bajo estas condiciones, la trayectoria en el plano (q, p) es una órbita cerrada y corresponde a un movimiento periódico de libración. Por otro lado, si E > mgl, todos los valores del ángulo q son fı́sicamente posibles, y q se incrementa indefinidamente para producir un movimiento periódico del tipo de rotación. En este caso, el péndulo posee suficiente energı́a para dar la vuelta en una dirección por encima de la posición vertical invertida q = π y, por lo tanto, continúa rotando en esa dirección. Cada órbita Ci tiene un perı́odo asociado; es decir, las variables qi y pi en el plano (qi , pi ) se repiten en el tiempo. En general, los perı́odos de las órbitas Ci pueden ser distintos entre sı́; como consequencia la trayectoria de todo el sistema en su espacio de fase puede no ser periódica, en el sentido de que todas las 2s variables qi y pi se repitan al cabo de un determinado intervalo de tiempo. Recordemos que las órbitas Ci son proyecciones en los distintos planos (qi , pi ) de la trayectoria del sistema en su espacio de fase; todas las proyecciones no tienen que cerrarse necesariamente después de un perı́odo de tiempo dado. 6.10. VARIABLES DE ACCIÓN-ÁNGULO 279 Las variables de acción-ángulo son un conjunto de coordenadas y momentos que resultan convenientes para describir la coexistencia de múltiples movimientos periódicos en la dinámica de sistemas completamente separables con movimientos finitos, i. e., que satisfacen las condiciones (1), (2) y (3). Para esta clase de sistemas, podemos introducir una transformación canónica {qi , pi } → {ϕi , Ji } tal que las nuevas coordenadas ϕi , denominadas variables de ángulo, sean cı́clicas en el nuevo Hamiltoniano, i. e., H 0 (J1 , . . . , Js ). Definimos los nuevos momentos Ji como las variables de acción I 1 pi dqi , (6.311) Ji ≡ 2π Ci donde la integral se realiza sobre un ciclo completo de la coordenada qi a lo largo de la órbita Ci que yace en el plano (qi , pi ), ya sea retornando al valor inicial de qi (libración) o sobre un intervalo qi0 (rotación). Puesto que el sistema es completamente separable, podemos usar la Ec. (6.306) para escribir I 1 ∂Wi Ji = (qi , α1 , . . . , αs ) dqi 2π Ci ∂qi = Ji (α1 , . . . , αs ) = cte, (6.312) debido a que las αi son constantes. La Ec. (6.312) constituye un sistema de s ecuaciones para las s variables de acción Ji en función de las αi , las cuales puede ser invertidas para obtener αi = αi (J1 , . . . , Js ). Luego, las variables Ji son un conjunto de funciones independientes que pueden ser usadas como los nuevos momentos constantes. Entonces, el nuevo Hamiltoniano se puede expresar como H 0 (J1 , . . . , Js ) = E = cte. La función caracterı́stica de Hamilton, que es generadora P de la transformación canónica {qi , pi } → {ϕi , Ji }, debe tener la forma W (qi , Ji ) = i Wi (qi , J1 , . . . , Js ). Entonces, las relaciones de la transformación canónica son ∂Wi pi = (qi , J1 , . . . , Js ) , (6.313) ∂qi ∂Wi (qi , J1 , . . . , Js ) . (6.314) ϕi = ∂Ji Para entender el significado de las variables de ángulo, calculemos el cambio de una variable ϕi en un ciclo completo de la coordenada qi sobre una órbita Ci , dado por I I I ∂ ∂Wi ∂ ∂Wi ∆ϕi = dϕi = dqi = dqi ∂q ∂J ∂J i i i Ci ∂qi Ci Ci I ∂ ∂Ji = pi dqi = 2π = 2π. (6.315) ∂Ji Ci ∂Ji Luego, un ciclo completo de qi corresponde a un cambio de ϕi en 2π; la variable ϕi se puede interpretar como un ángulo de rotación tal que el perı́odo de la órbita Ci equivale a una rotación completa de ϕi manteniendo Ji constante. Puesto que no todas las órbitas tienen el mismo perı́odo, no todas las variables de ángulo ϕi realizan una rotación completa al mismo tiempo, aunque todas las variables de acción correspondientes se mantienen constantes. 280 CAPÍTULO 6. DINÁMICA HAMILTONIANA Las ecuaciones de Hamilton en las nuevas variables son ∂H 0 (Jj ) J˙i = − = 0, ∂ϕi ∂H 0 (Jj ) ≡ ωi (Jj ) = cte. ϕ̇i = ∂Ji (6.316) (6.317) Las Ecs. (6.316) confirman que las Ji son constantes, mientras las Ecs. (6.317) definen s funciones constantes ωi (Jj ). Adicionalmente, las Ecs. (6.317) conducen a ϕi = ωi t + θi , (6.318) donde θi equivale a una fase inicial para cada variable ϕi . Cada nueva coordenada ϕi se comporta efectivamente como un ángulo que se incrementa con una correspondiente velocidad angular constante ωi ; de alli su nombre variables de ángulo. El perı́odo correspondiente de ϕi es 2π , (6.319) Ti = ωi (Jj ) el cual es igual al perı́odo de la órbita Ci . Entonces, las Ecs. (6.317) permiten obtener directamente las frecuencias de las órbitas periódicas del sistema, sin hacer aproximaciones de pequeños desplazamientos y sin necesidad de resolver explı́citamente las ecuaciones de movimiento. En resumen, el empleo de las variables de acción-ángulo permite encontrar las múltiples frecuencias del movimiento de un sistema caracterizado por un Hamiltoniano H(qi , pi ) que satisface las condiciones (1)-(3), mediante el siguiente procedimiento: 1. Escribir la ecuación de Hamilton-Jacobi independiente del tiempo, ∂Wi H (qi , α1 , . . . , αs ), qi = E . ∂qi 2. Separar la Ec. (6.320) en s ecuaciones para las derivadas separación provee las constantes α1 = E, α2 , . . . , αs . (6.320) ∂Wi ∂qi (qi , α1 , . . . , αs ). 3. Calcular las variables de acción, I I 1 1 ∂Wi pi dqi = (qi , α1 , . . . , αs ) dqi Ji = 2π Ci 2π Ci ∂qi = Ji (α1 , . . . , αs ). La (6.321) 4. Invertir las s relaciones Ji = Ji (α1 , . . . , αs ) para obtener αi = αi (J1 , . . . , Js ). i 5. Sustituir αi (J1 , . . . , Js ) en las derivadas ∂W ∂qi (qi , α1 , . . . , αs ) que aparecen en el Hamiltoniano (lado izquierdo) de la Ec. (6.320), para obtener H 0 (J1 , . . . , Js ). 6. Calcular las frecuencias ωi (Jj ) = ∂H 0 (J1 , . . . , Js ). ∂Ji (6.322) 6.10. VARIABLES DE ACCIÓN-ÁNGULO 281 La descripción del movimiento de un sistema finito completamente separable resulta simple en términos de las variables de acción-ángulo: cada órbita Ci trazada sobre el plano (qi , pi ) es equivalente a una rotación sobre una circunferencia de un ángulo ϕi con velocidad ángular constante ωi . El radio de la circunferencia corresponde al valor constante Ji . En lenguaje topológico, cada curva cerrada Ci se distorsiona continuamente en una circunferencia, denotada en topologı́a por el sı́mbolo S1 , debido a la transformación canónica {qi , pi } → {ϕi , Ji }. La trayectoria en el espacio de fase de las variables {ϕi , Ji } yace en todas esas s circunferencias simultáneamente. Si s = 2, hay 2 circunferencias; para cada punto (ϕ1 , J1 ) de la primera circunferencia S1 existe una segunda circunferencia S1 con valores de (ϕ2 , J2 ). Es decir, a cada punto de S1 está asociada otra S1 . Esto describe un toroide, designado por T2 = S1 × S1 . Entonces, la trayectoria transcurre sobre el toroide T2 . Aunque esto se puede visualizar con uno o dos grados de libertad; es más difı́cil de hacerlo para s en general. En ese caso, la trayectoria tiene lugar sobre un toroide s-dimensional Ts = S1 × · · · × S1 descrito por las variables de acción-ángulo {ϕi , Ji }. Las variables de acción-ángulo proveen una representación geométrica elegante del movimiento de un sistema completamente separable. Figura 6.20: Variables de acción-ángulo y una trayectoria sobre un toroide para un sistema con s = 2. La trayectoria sobre un toroide T2 es cerrada si el cociente de las frecuencias ω1 /ω2 es un número racional. En tal caso, se dice que la trayectoria es periódica. Si ω1 /ω2 es igual a un número irracional; entonces la trayectoria se denomina cuasiperiódica, y en su evolución cubre uniformemente toda la superficie del toroide. Del mismo modo, una trayectoria sobre un toroide s-dimensional Ts es cerrada o periódica si el cociente de las frecuencias ωi /ωj es racional ∀i, j, mientras que una trayectoria sobre Ts es cuasiperiódica si ωi /ωj es irracional ∀i, j. Mediante variables de acción-ángulo, diferentes sistemas con el mismo número s de grados de libertad pueden ser mapeados sobre un toroide s-dimensional. Luego, el movimiento sobre un toroide Ts constituye un tipo de sistema dinámico universal que abarca la dinámica de sistemas separables aparentemente diferentes. 282 CAPÍTULO 6. DINÁMICA HAMILTONIANA Ejemplos. 1. Encontrar la frecuencia de un oscilador armónico usando variables de acción-ángulo. El Hamiltoniano es H(q, p) = p2 1 + kq 2 2m 2 = E = cte. (6.323) Las órbitas H(q, p) = cte en el plano (q, p) corresponden a elipses. Figura 6.21: Órbitas en espacio de fase (q, p) para el oscilador armónico y variables de acciónángulo (J, ϕ) correspondientes. El momento es p= ∂W . ∂q Sustituyendo en la Ec. (6.323), tenemos 2 ∂W 1 1 + kq 2 = E, 2m ∂q 2 de donde ∂W = ∂q s 1 2 2m E − kq . 2 (6.324) (6.325) (6.326) La variable de acción es J = 1 2π = 1 2π = 1 2π I I 1 ∂W p dq = dq 2π C ∂q C r I √ k 2 q dq 2mE 1− 2E C Z qmax r √ k 2 2mE 4 1− q dq, 2E 0 (6.327) puesto que un ciclo C equivale a cuatro q veces la variación de la coordenada q desde el valor q = 0 hasta el valor qmax = 2E k , para el cual p = 0. 6.10. VARIABLES DE ACCIÓN-ÁNGULO Con el cambio variables sin x = J = = q k 2E 283 q, obtenemos r Z π/2 1 √ 2E cos2 x dx 4 2mE 2π k 0 r r 4 m π m E = E. π k 4 k (6.328) Luego, el Hamiltoniano en términos de J es r 0 H (J) = E = k J. m (6.329) La frecuencia del movimiento es ∂H 0 = ϕ̇ = ω = ∂J r k . m (6.330) Note que las variables de acción-ángulo (ϕ, J) corresponden a las variables (Q, P ) en la transformación canónica {q, p} → {Q, P } empleada para el oscilador armónico en la Sec. 6.8, tal que la coordenada Q sea cı́clica en el Hamiltoniano transformado H 0 (P ). 2. Encontrar el perı́odo del movimiento de una partı́cula de masa m y velocidad v que choca elásticamente entre dos paredes paralelas separadas por una distancia L. Figura 6.22: Partı́cula chocando elásticamente entre dos paredes paralelas. Izquierda: espacio fı́sico. Derecha: espacio de fase (q, p). La energı́a de la partı́cula es constante, E= 1 mv 2 = cte , 2 (6.331) p2 = E. 2m (6.332) ∂W , ∂q (6.333) y el Hamiltoniano correspondiente es H= Usando p= 284 CAPÍTULO 6. DINÁMICA HAMILTONIANA obtenemos la ecuación de Hamilton-Jacobi independiente del tiempo, 1 2m Luego, p= ∂W ∂q 2 = E. (6.334) √ ∂W = 2mE . ∂q (6.335) La variable de acción da J = = I 1 √ 2mE dq 2π C C Z L 1 √ L√ 2mE 2 dq = 2mE . 2π π 0 1 2π I p dq = (6.336) Luego, p = πJ/L. El Hamiltoniano como función de J es H 0 (J) = π2 J 2, 2mL2 (6.337) y la frecuencia del movimiento está dada por ϕ̇ = ω = = ∂H 0 π2 = J ∂J mL2 π2 L √ π 2mE = v. mL2 π L (6.338) (6.339) Luego, el perı́odo resulta en T = 2L 2π = . ω v (6.340) 3. Una partı́cula se mueve sin fricción sobre un cilindro vertical de radio R en el campo gravitacional terrestre, conservando su energı́a E y alcanzando una altura máxima h despues de cada choque contra el suelo. Encontrar las frecuencias del movimiento usando variables de acción-ángulo. Figura 6.23: Partı́cula moviéndose sobre un cilindro vertical. 6.10. VARIABLES DE ACCIÓN-ÁNGULO 285 Hay dos grados de libertad, θ y z. El Lagrangiano del sistema es 1 m(R2 θ̇2 + ż 2 ) − mgz. 2 (6.341) p2z p2θ + + mgz = E = cte. 2mR2 2m (6.342) L= El Hamiltoniano es H= La ecuación de Hamilton-Jacobi independiente del tiempo tiene la forma ∂W , qi , αi = E. H ∂qi (6.343) Buscamos solución por separación de variables. Asumimos la función caracterı́stica de Hamilton en la forma W = Wθ (θ, α1 , α2 ) + Wz (z, α1 , α2 ), con α1 = E. Los momentos correspondientes son pθ = pz = ∂Wθ , ∂θ ∂Wz . ∂z (6.344) (6.345) Sustituyendo en la Ec. (6.342), tenemos 1 2mR2 ∂Wθ ∂θ 2 + 1 2m ∂Wz ∂z 2 + mgz = E, (6.346) lo cual se puede expresar como 1 2m ∂Wz ∂z 2 1 + mgz = E − 2mR2 ∂Wθ ∂θ 2 (6.347) El lado izquierdo en la Ec. (6.347) es función de z solamente y el lado derecho es una función de θ. Ambos lados deben ser iguales a la misma constante, α2 = cte. Entonces, podemos escribir 1 2m E− ∂Wz ∂z 2 1 2mR2 + mgz ∂Wθ ∂θ = α2 (6.348) = α2 (6.349) 2 Luego, p √ ∂Wθ = R 2m E − α2 = cte , ∂θ (6.350) 286 CAPÍTULO 6. DINÁMICA HAMILTONIANA y la variable de acción Jθ está dada por I 1 Jθ = pθ dθ 2π Cθ I ∂Wθ 1 dθ = 2π Cθ ∂θ I p √ 1 = R 2m E − α2 dθ 2π Cθ p √ = R 2m E − α2 = pθ . (6.351) Por otro lado, p ∂Wz = 2mα2 − 2m2 gz , ∂z y la variable de acción Jz correspondiente es I I p 1 1 pz dz = Jz = 2mα2 − 2m2 gz dz . 2π Cz 2π Cz (6.352) (6.353) Figura 6.24: Izquierda: Órbita Cz en el plano (z, pz ). En z = 0, el momento pz cambia de signo √ de −p∗z a p∗z = m 2gh. Derecha: Órbita Cθ en el plano (θ, pθ ). La integral sobre la órbita Cz corresponde a un ciclo de z = 0 a z = h y viceversa. Z hp 1 Jz = 2 2mα2 − 2m2 gz dz (6.354) 2π 0 Z hr 1p 2 α2 = 2m g − z dz (6.355) π mg 0 3/2 0 1 p 2 2 α2 = 2m g −z (6.356) π 3 mg h 3/2 α2 2 p 2 2m g (6.357) = 3π mg 1 √ (2α2 )3/2 . = (6.358) 3πg m 6.10. VARIABLES DE ACCIÓN-ÁNGULO 287 Para escribir H 0 (Jz , Jθ ), debemos expresar pz y pθ en términos de Jz y Jθ . Obtuvimos Jθ = pθ . De la Ec (6.358) tenemos √ (3πg m Jz )2/3 α2 = , (6.359) 2 luego, p2z = ∂Wz ∂z 2 = 2mα2 − 2m2 gz = (3πgm2 Jz )2/3 − 2m2 gz. (6.360) Sustituyendo en H, obtenemos H 0 (Jz , Jθ ) = 1 1 J2 + (3πm2 gJz )2/3 = E. 2mR2 θ 2m (6.361) Las frecuencias están dadas por ϕ̇θ = ωθ = ∂H 0 ∂Jθ = ϕ̇z = ωz = ∂H 0 ∂Jz = pθ Jθ = , mR2 mR2 1/3 (3πm2 g)2 1 . 3m Jz (6.362) (6.363) Podemos expresar las frecuencia en términos de E y h. Cuando z = h, el momento pz = 0. Entonces, de la Ec (6.360) obtenemos α2 = mgh (6.364) y Jz = 2 mp 2gh3 . 3 π (6.365) De la Ec (6.351), podemos expresar pθ = R √ 2m p E − mgh . (6.366) Luego, ωθ = ωz = √ r 2 E − gh , R m r g π . 2h (6.367) (6.368) El perı́odo del movimiento en z es 2π Tz = =2 ωz s 2h , g (6.369) que es igual al tiempo de vuelo entre dos choques consecutivos contra el suelo. 288 CAPÍTULO 6. DINÁMICA HAMILTONIANA 4. Encontrar las frecuencias del movimiento en el problema de Kepler utilizando variables de acción-angulo. El problema de Kepler se refiere en el potencial central V (r) = − kr . Puesto que el vector momento angular se conserva en un potencial central, el movimiento ocurre en un plano perpendicular a la dirección de ese vector. Usando coordenadas polares (r, θ) sobre el plano del movimiento, el Hamiltoniano de una partı́cula de masa reducida µ en un potencial V (r) se puede expresar como p2θ 1 2 (6.370) pr + 2 + V (r) = E. H(r, θ, pr , pθ ) = 2µ r Asumimos separación de variables; luego escribimos los momentos pr = pθ = ∂Wr , ∂r ∂Wθ . ∂θ (6.371) (6.372) Sustituyendo en H, obtenemos 1 2µ ∂Wr ∂r 2 + 1 2µr2 ∂Wθ ∂θ 2 + V (r) = E, lo cual se puede escribir como " # 2 2 2 ∂W ∂W ∂Wθ r θ 2 r + + 2µ (V − E) = − . ∂r ∂θ ∂θ (6.373) (6.374) El lado izquierdo de la Ec. (6.374) depende solamente de r, mientras que el lado derecho depende de θ. Luego, ambos lados deben ser constantes e iguales. Entonces debemos tener ∂Wθ = αθ = cte, (6.375) ∂θ 2 ∂Wr α2 + 2µ (V − E) = − 2θ . (6.376) ∂r r La Ec. (6.375) implica que pθ = αθ = cte. El valor constante de pθ es la magnitud del momento angular l. Entonces, I I I 1 1 1 ∂Wθ Jθ = pθ dθ = dθ = αθ dθ = αθ . (6.377) 2π Cθ 2π Cθ ∂θ 2π Cθ De las Ecs. (6.376) y (6.377), obtenemos r J2 ∂Wr = 2µ(E − V ) − θ2 . ∂r r (6.378) 6.10. VARIABLES DE ACCIÓN-ÁNGULO 289 La variable de acción Jr está dada por Jr 1 2π = 1 2π = I 1 pr dr = 2π Cr I r I Cr 2µ(E − V ) − Cr ∂Wr ∂r dr Jθ2 dr. r2 (6.379) Puesto que consideramos movimientos finitos, en un ciclo Cr la coordenada radial varı́a dos veces entre los valores r = rmin y r = rmax . Entonces, Jr Z rmax s J2 1 k 2 2µ E + − θ2 dr 2π r r rmin Z rmax q 1 1 2µEr2 + 2µkr − Jθ2 dr. π rmin r = = (6.380) Recordemos del Cap. 3 (Sec. 3.4) que rmin y rmax son las raı́ces de 2µEr2 + 2µkr − l2 = 2µEr2 + 2µkr − Jθ2 = 0 , (6.381) (puesto que Jθ = l) dadas por s k 1− 1+ 2E s 2 2EJθ k 1+ 1+ . =− 2E µk 2 rmin = − rmax 2EJθ2 , µk 2 (6.382) (6.383) Para realizar la integración en la Ec. (6.380) de una manera más simple, usamos el siguiente artilugio. Obtenemos primero la derivada parcial µ ∂Jr = ∂E π Z rmax rmin p 2µEr2 r dr . + 2µkr − Jθ2 (6.384) La integral en la Ec. (6.384) es de la forma Z r √ dr = 2 ar + br + c √ ar2 + br + c b + sin−1 a 2(−a)3/2 b + 2ar b2 − 4ac , (6.385) 290 CAPÍTULO 6. DINÁMICA HAMILTONIANA donde identificamos a = 2µE, b = 2µk y c = −Jθ2 . Evaluamos k , 2 2µ (−E)3/2 s 2EJθ2 2 b − 4ac = 2µk 1 + µk 2 s 2EJθ2 b + 2armax = −2µk 1 + , µk 2 s 2EJθ2 b + 2armin = 2µk 1 + . µk 2 b 2(−a)3/2 = √ (6.386) (6.387) (6.388) (6.389) El primer término en la integración Ec. (6.385) se anula al evaluarlo en ambos lı́mites rmin y rmax . Entonces la integral Ec. (6.384) evaluada en esos lı́mites da ∂Jr ∂E = = µ k √ π π 2 2µ (−E)3/2 r k µ (−E)−3/2 . 2 2 (6.390) En el problema de Kepler tenemos E < 0 para una órbita finita. Ahora integramos la Ec. (6.390) y obtenemos r µ Jr = C + k (−E)−1/2 , 2 (6.391) donde C es una constante de integración. Para determinar C, notamos que la expresión Ec. (6.391) debe ser válida para cualquier órbita con E < 0 en el problema de Kepler. En particular, consideremos una órbita circular con r = cte. Entonces, rmin = rmax y Jr = 0 para esa órbita. La energı́a correspondiente a una órbita circular es µk 2 E=− 2. (6.392) 2Jθ Entonces, la Ec. (6.391) para una órbita circular da r s 2 µ 2Jθ 0=C +k ⇒ C = −Jθ . 2 µk 2 (6.393) Luego, r µ (−E)−1/2 . (6.394) 2 El Hamiltoniano en función de las variables de acción se puede expresar como Jr = −Jθ + k H 0 (Jr , Jθ ) = E = − µk 2 . 2(Jr + Jθ )2 (6.395) 6.10. VARIABLES DE ACCIÓN-ÁNGULO 291 Las frecuencias están dadas por ωθ = ωr = ∂H 0 µk 2 , = ∂Jθ (Jr + Jθ )3 ∂H 0 µk 2 . = ∂Jr (Jr + Jθ )3 (6.396) (6.397) Las frecuencias radial y angular son iguales, lo que implica que la órbita es cerrada, como se espera. Para expresar la frecuencia en función de la energı́a, sustituimos r µ Jr + Jθ = k 2(−E) (6.398) en la Ec. (6.396) y obtenemos 2 ωθ = k r 2 2 (−E)3/2 = µ k r 2 |E|3/2 . µ (6.399) Recordemos del Cap. 3 (Sec. 3.4) que el semieje mayor de una órbita elı́ptica está relacionado con la energı́a por k a= . (6.400) 2|E| Entonces, podemos escribir ωθ en función del semieje mayor como s k −3/2 2π ωθ = a = , (6.401) µ Tθ donde Tθ es el perı́odo de la órbita. Luego, r µ 3/2 a , Tθ = 2π k (6.402) que es la Tercera Ley de Kepler (Cap. 3). 5. La temprana formulación de la Mecánica Cuántica de Bohr y Sommerfeld para el átomo de hidrógeno, incluı́a los siguientes postulados: a) Cuantización de las variables de acción, I 1 Jk ≡ pk dqk = nk ~ , 2π Ck (6.403) donde ni es un número entero y ~ es la constante de Planck dividida por 2π. b) La frecuencia de la radiación emitida cuando un electrón cambia discontinuamente su movimiento, desde una órbita con energı́a Ei a otra órbita con energı́a Ef , es Ei − Ef ν= . (6.404) h 292 CAPÍTULO 6. DINÁMICA HAMILTONIANA El potencial del átomo de hidrógeno corresponde al potencial de Coulomb, V (r) = −e2 /r, que es similar al potencial de Kepler con k = e2 . Luego, en términos de las variables de acción, la energı́a del electrón en una órbita está dada por la Ec. (6.395), E=− mk 2 . 2(Jr + Jθ )2 (6.405) donde hemos tomado µ ≈ m, masa del electrón. Utilizando la hipótesis de cuantización, obtenemos me4 E=− 2 2, (6.406) 2~ n donde n es un número entero, ya que la suma de dos números enteros es otro entero. Entonces, la frecuencia emitida en una transición Ei → Ef satisface ! 1 me4 1 1 ν= − 2 . (6.407) h 2~2 n2f ni Usando ν = c/λ, podemos expresar la longitud de la onda emitida como ! 1 1 1 = R∞ − 2 , λ n2f ni (6.408) donde me4 , (6.409) 4πc~3 es la constante de Rydberg. Esta teorı́a temprana permitió explicar las longitudes de onda de las lı́neas principales observadas en el espectro del hidrógeno. R∞ ≡ 6.11. Integrabilidad En el Cap. 2, establecimos que un sistema con s grados de libertad {q1 , . . . , qs } es integrable si posee s cantidades conservadas o constantes del movimiento. En la formulación Hamiltoniana, la condición de integrabilidad de un sistema puede caracterizarse por la existencia de s funciones independientes y constantes Ik (qi , pi ) = Ck , k = 1, . . . , s, tales que [Ik , Ij ] = 0; ∀k, j, siendo el Hamiltoniano H(qi , pi ) una de esas funciones. Esta es la condición de integrabilidad de Liouville. Cada función Ik (qi , pi ) = Ck representa una superficie (2s − 1)-dimensional Σk sobre la cual evoluciona la trayectoria (qi (t), pi (t)) en el espacio de fase 2s-dimensional del sistema. Puesto que la trayectoria (qi (t), pi (t)) debe satisfacer simultáneamente las s condiciones Ik (q1 , . . . , qs , p1 , . . . , ps ) = Ck , esta trayectoria yace sobre el subespacio de la intersección de las s superficies Σk , el cual corresponde a una superficie s-dimensional definida como Σs ≡ Σ1 ∩ Σ2 ∩ · · · ∩ Σs . 6.11. INTEGRABILIDAD 293 Teorema de Liouville-Arnold. Para sistemas integrables según la condición de Liouville se cumple que: (i) la superficie Σs es difeomórfica (i.e., se puede transformar continuamente) a un toroide sdimensional Ts ; y (ii) existe un conjunto canónico de coordenadas y momentos {ϕi , Ji } tales que las J1 , J2 , . . . , Js definen el toroide Ts y ϕ̇i = 0 sobre Ts (i.e., {ϕi , Ji } son variables de acción-ángulo). Aunque la demostración de este teorema requiere conceptos avanzados de topologı́a, podemos visualizar su plausibilidad para sistemas finitos completamente separables. En este caso, vimos que la trayectoria en el espacio de fase de las variables de acción-ángulo del sistema efectivamente se puede describir sobre un toroide s-dimensional Ts . Recordemos que un sistema es completamente separable si la solución de su correspondiente ecuación de Hamilton-Jacobi puede encontrarse por separación de variables en forma aditiva de s funciones Wk , tal que cada función Wk depende de una sola coordenada qk y de un conjunto de s constantes {P1 , . . . , Ps }. En ese caso, es posible reducir la ecuación de Hamilton-Jacobi a un conjunto de s ecuaciones diferenciales de primer orden para las funciones Wk (qk ); cada ecuación permite encontrar la correspondiente función Wk (qk ) en términos de una integral explı́cita sobre la coordenada qk . Luego, un sistema completamente separable siempre es integrable y posee s constantes del movimiento, i.e., {P1 , . . . , Ps }. Por otro lado, un sistema integrable no siempre es completamente separable. Un ejemplo de este tipo de sistemas de enorme interés en la Fı́sica, es la famosa red de Toda. Morikazu Toda (1917–2010) introdujo un modelo simple para un cristal unidimensional que consiste en una cadena periódica de partı́culas con potenciales de interacción exponenciales entre vecinos mas cercanos. Para una red de Toda con tres partı́culas de igual masa, el Hamiltoniano del sistema se puede expresar como i 1 √ 1 h (2y+2√3x) 1 + e(2y−2 3x) + e−4y − , (6.410) e H = (p2x + p2y ) + 2 24 8 el cual representa un sistema con s = 2 grados de libertad. Puesto que H es independiente del tiempo, H es una constante del movimiento. No existen otras simetrı́as aparentes que sugieran alguna cantidad conservada adicional en este sistema. No obstante, este sistema posee la siguiente cantidad conservada no trivial, √ √ √ √ I = 8px (p2x − 3p2y ) + (px + 3py )e(2y−2 3x) + (px − 3py )e(2y+2 3x) − 2px e−4y . (6.411) La demostración de la conservación de la cantidad I se deja para los problemas de este Capı́tulo. La existencia de las constantes de movimiento H e I hacen que la red de Toda sea un sistema integrable y, por lo tanto, satisface el Teorema de Liouville-Arnold. Una manera de visualizar la topologı́a toroidal del espacio de fase de la red de Toda es dibujar las intersecciones de la trayectoria con una sección de superficie dada en el espacio de fase del sistema. Consideremos la intersección de la trayectoria con la superficie x = 0 para H = E = cte. Fijamos x = 0 y despejamos px = px (py , y, I) de la Ec. (6.411); sustituimos px en la Ec. (6.410) para obtener la función H(py , y, I) = E, con I, E constantes. 294 CAPÍTULO 6. DINÁMICA HAMILTONIANA La Fig. (6.25) muestra las curvas H(py , y, I) = E ası́ obtenidas, proyectadas en el plano (y, py ). Figura 6.25: Proyecciones de las trayectorias sobre el plano (y, py ) con x = 0 para el Hamiltoniano H = E de la red de Toda, Ec. (6.410), con valores de energı́a E = 1 (izquierda) y E = 256 (derecha), para diferentes valores de I. Las flechas indican los valores máximos de y y py . Las curvas mostradas, correspondientes a valores E = 1 y E = 256, son suaves y cerradas. Esto indica que las variables (x, y, px , py ) son susceptibles de ser transformadas a variables canónicas de acción-ángulo (ϕ1 , ϕ2 , J1 , J2 ) que describen un toroide T2 . Se puede verificar que la ecuación de Hamilton-Jacobi asociada al Hamiltoniano Ec. (6.410) no es separable en forma aditiva de 2 funciones Wx (x) y Wy (y), debido a la forma no lineal de H. Esto significa que la red de Toda es un sistema integrable, pero no completamente separable. El trompo de Kovaleskaya constituye otro ejemplo de un sistema integrable no trivial. La red de Toda y el trompo de Kovaleskaya revelan que las cantidades conservadas en un sistema dinámico no siempre están asociadas con simetrı́as conocidas. El estudio de la integrabilidad y de sistemas con simetrı́as ocultas o no triviales tiene mucho interés en la Fı́sica contemporánea. En 1986, Nick Tufillaro encontró un sistema integrable sorprendentemente simple, con una simetrı́a oculta. Se trata de una máquina de Atwood con dos grados de libertad, tal que una masa (m2 ) se mueve verticalmente mientras la otra masa (m1 ) puede oscilar libremente sobre un plano vertical. Podemos escribir el Hamiltoniano de este sistema como 1 p2r p2 H= + θ 2 + gr(m2 − m1 cos θ), (6.412) 2 m1 + m2 m1 r el cual es una cantidad constante. 6.11. INTEGRABILIDAD 295 Figura 6.26: Máquina de Atwood con dos grados de libertad, r y θ. Tufillaro demostró que, para valores m2 /m1 = 3, este sistema posee además la siguiente cantidad conservada, θ pθ θ θ θ 2pθ 2 2 I= sin p cos − + gr sin cos , (6.413) r 4m21 2 r 2 2 2 la cual no es susceptible de ser asociada con ninguna simetrı́a evidente en el sistema. Luego, al menos para estos valores particulares de parámetros, este sistema es integrable. La integrabilidad no es una propiedad genérica; sino que depende de la existencia de suficientes simetrı́as en un sistema, algunas de las cuales pueden no resultar obvias. Esta condición es mas bien restrictiva. En realidad, la lista de sistemas integrables conocidos en Mecánica Clásica es corta; entre ellos se encuentran: - Un sistema con un grado de libertad. - El oscilador armónico con s grados de libertad. - El problema de 2 cuerpos sujetos a una fuerza central. - Los trompos de Lagrange, Euler y Kovaleskaya. - La máquina de Atwood, donde una masa se mueve verticalmente mientras la otra oscila sobre un plano vertical, para ciertos valores de parámetros. - La red de Toda. Los sistemas integrables exhiben trayectorias regulares (periódicas o cuasiperiódicas) en su espacio de fase. Sin embargo, la gran mayorı́a de los sistemas dinámicos son no integrables, como sucede en sistemas disipativos y en muchos sistemas no lineales cuyo espacio de fase posee dimensión mayor que dos. La no integrabilidad es una condición necesaria, pero no suficiente para la ocurrencia del fenómeno de caos en un sistema (trayectoria irregular en el espacio de fase, con sensibilidad extrema en las condiciones iniciales). La insuficiencia de simetrı́as implica la no integrabilidad, y abre las puertas al caos en muchos sistemas dinámicos en una variedad de contextos. 296 6.12. CAPÍTULO 6. DINÁMICA HAMILTONIANA Problemas 1. Considere una varilla de peso despreciable suspendida por un extremo fijo, de modo que puede oscilar en un plano vertical. Una partı́cula de masa m se mueve sin fricción a lo largo de la varilla. a) Obtenga las ecuaciones de movimiento en la formulación Hamiltoniana. b) Indique si hay alguna cantidad conservada. 2. El Lagrangiano de un sistema se puede expresar L = q˙1 2 + q˙2 2 + k1 q12 + k2 q˙1 q˙2 , a + bq1 donde a, b, k1 , k2 son constantes. Encuentre las ecuaciones de movimiento en la formulación Hamiltoniana. 3. El Hamiltoniano de una partı́cula es p2 − a · p − b · r, 2m donde a y b son vectores constantes. a) Encuentre las ecuaciones de movimiento. b) Si inicialmente la partı́cula se encuentra en reposo en la posición ro , encuentre su posición en función del tiempo. c) Determine el Lagrangiano del sistema. H= 4. El Lagrangiano de un sistema es p ẏ + cẋẏ + f y 2 ẋż + g ẏ − k x2 + y 2 , x donde a, b, c, f, g y k son constantes. a) Encuentre el Hamiltoniano del sistema. b) Encuentre las cantidades conservadas en el sistema. L = aẋ2 + b 5. El modelo de Lotka-Volterra para la dinámica de predadores z y presas c se describe mediante las ecuaciones ċ = αc − βcz ż = −γz + δcz, donde α, β, γ, δ son parámetros positivos. a) Encuentre las condiciones para que este sistema sea conservativo. b) Encuentre las transformaciones de variables que permiten expresar estas ecuaciones en la forma adimensional ẋ = x(1 − y) ẏ µy(x − 1). = c) Encuentre una cantidad conservada en términos de las variables adimensionales. 6.12. PROBLEMAS 297 6. Considere un péndulo formado por una varilla de longitud l y masa despreciable de la cual cuelga una partı́cula de masa m1 . El soporte del péndulo consiste en otra partı́cula de masa m2 , libre de moverse en una dirección horizontal. Encuentre las ecuaciones de movimiento para este sistema en la formulación hamiltoniana. 7. El elemento de volumen de un ensemble en el espacio de fase n-dimensional para el dx = f (x) es sistema dinámico dt ∆Γ = n Y dxi . i=1 Demuestre que d(∆Γ) = ∇ · f ∆Γ. dt 8. La ecuación de movimiento unidimensional amortiguado y forzado de una partı́cula de masa m sujeta a un resorte de constante k es ẍ + 2λẋ + ω 2 x = A cos νt, donde ω 2 = k/m, λ > 0 es el coeficiente de fricción del medio, A es la amplitud de la fuerza externa que actúa sobre la partı́cula y ν es la frecuencia de esa fuerza. Demuestre que este sistema es disipativo. 9. El atractor de Rössler se genera con el siguiente sistema: ẋ = −y − z ẏ = x + ay ż = b + xz − cz donde a, b, c son parámetros. a) Encuentre la condición para que este sistema sea disipativo. b) Calcule los puntos fijos de este sistema en función de los parámetros. 10. El Hamiltoniano de un sistema es H = q1 p1 − q2 − p2 − aq12 + bq22 , donde a y b son constantes. a) Obtenga las ecuaciones de Hamilton para este sistema. b) ¿Cuáles de las siguientes funciones son integrales de movimiento para este sistema? f= p1 − aq1 ; q2 g = q1 q2 ; h = p1 p22 . 11. a) Encuentre las ecuaciones de movimiento en la formulación Hamiltoniana de un péndulo de masa m y longitud l, cuyo soporte se mueve sin fricción sobre la parábola y = ax2 en el plano vertical (x, y). b) Determine si existe alguna cantidad conservada en el sistema. 298 CAPÍTULO 6. DINÁMICA HAMILTONIANA 12. a) Encuentre las ecuaciones de movimiento de un péndulo esférico de longitud a y masa m, con coordenadas (θ, φ), en la formulación Hamiltoniana. b) Evalúe el siguiente paréntesis de Poisson para este sistema: [lx , pφ ]. 13. El Hamiltoniano de una partı́cula que se mueve en dos dimensiones es: H = |p|n − a|r|−n , a = cte. a) Encuentre las ecuaciones de Hamilton para el movimiento. b) Determine el Lagrangiano del sistema. c) ¿Cuál de las siguientes funciones es una integral de movimiento para este sistema? f= r·p − Ht , n g = |p|. 14. El siguiente Hamiltoniano bidimensional i 1 √ 1 1 h (2y+2√3x) + e(2y−2 3x) + e−4y − , H = (p2x + p2y ) + e 2 24 8 aparece asociado a una red de Toda, un sistema de gran interés en Fı́sica No Lineal. a) Encuentre las ecuaciones de movimiento para este sistema. b) Demuestre que este sistema posee la siguiente cantidad conservada, √ √ √ √ I = 8px (p2x − 3p2y ) + (px + 3py )e(2y−2 3x) + (px − 3py )e(2y+2 3x) − 2px e−4y . La existencia de las constantes de movimiento H e I hace que este sistema sea integrable. Sin embargo, la cantidad I no está relacionada con ninguna simetrı́a evidente del sistema. c) Calcule I en el lı́mite de x y y pequeños. 15. El Lagrangiano de un trompo con momentos principales de inercia I11 = I22 = 2I33 y un punto fijo, moviéndose en el campo gravitacional terrestre, en términos de los ángulos de Euler es 2 I 33 L = I33 θ̇2 + φ̇2 sin2 θ + ψ̇ + φ̇ cos θ − mgd sin θ sin ψ, 2 donde I33 es el momento de inercia con respecto al eje de simetrı́a axial del trompo, m es su masa, y d es la distancia entre el punto fijo del trompo y su centro de masa. Este sistema se conoce como el trompo de Kovalevskaya. a) Encuentre las ecuaciones de movimiento en la formulación Hamiltoniana. b) ¿Cuáles son las cantidades conservadas para este sistema? c) Demuestre que la siguiente cantidad, denominada la constante de Kovalevskaya y no asociada a ninguna simetrı́a obvia, se conserva en este sistema, 2 i mgd h 2 K = θ̇2 − φ̇2 sin2 θ + 2 θ − φ̇2 sin2 θ sin ψ − 2θ̇φ̇ sin θ cos ψ sin θ I33 2 mgd + sin2 θ. I33 6.12. PROBLEMAS 299 16. El vector de Laplace-Runge-Lenz para el problema de Kepler se define como A = p × l − mkr̂. Calcule [Ai , lj ]. 17. Evalúe los siguientes paréntesis de Poisson: a) [l, (r · p)]; b) [p, rn ]; c) [p, (a · r)n ]; donde a es un vector constante. 18. Considere la transformación de coordenadas q 2m = Q2 + P 2 , P = Q tan np ; donde m y n son constantes. a) Determine los valores de m y n para los cuales esta transformación es canónica. b) Encuentre una función generadora de tipo F3 (p, Q) para esta transformación canónica. 19. Una partı́cula de masa m = 1 se mueve sin fricción a lo largo de una varilla que gira extendida sobre una superficie horizontal con velocidad angular constante ω. a) Demuestre que las soluciones de las ecuaciones de Hamilton para este sistema son q = iλ [P e−ωt + Qeωt ] , p = −iλω [P e−ωt − Qeωt ] ; donde q es la coordenada que describe la posición de la partı́cula sobre la varilla, p es el momento, y P, Q y λ son constantes. b) Calcule el valor de λ para que una transformación de variables (q, p) a (Q, P ) sea canónica. 20. Considere la transformación de coordenadas y momentos Q = q α eβp , P = q α e−βp ; donde α y β son constantes. a) Determine α y β tal que esta transformación sea canónica. b) Demuestre que una función generadora de esta transformación es F =− Q2 2p e . 2 300 CAPÍTULO 6. DINÁMICA HAMILTONIANA 21. a) Demuestre que la siguiente transformación es canónica: 1 p ( 2P1 sin Q1 + P2 ), mω 1 p √ ( 2P1 cos Q1 + Q2 ), mω p 1√ mω( 2P1 cos Q1 − Q2 ), 2 p 1√ mω(− 2P1 sin Q1 + P2 ). 2 √ x = y = px = py = b) Encuentre las ecuaciones de movimiento en la formulación hamiltoniana en términos de las variables (Q1 , Q2 , P1 , P2 ) para una partı́cula de masa m y carga q que se mueve en el plano (x, y), sujeta al potencial vector A = (−yB/2, xB/2, 0), usando ω = qB/mc. 22. Considere la transformación infinitesimal de traslación R = r + a, P = p, donde a es un vector fijo en el espacio y es un parámetro infinitesimal. Encuentre G tal que esta transformación sea generada por la función F2 = r · P + G(r, P). 23. Una partı́cula de masa m se mueve en una dimensión q con una energı́a potencial V (q) y sujeta a una fuerza de fricción −2mγ q̇. a) Demuestre que el Lagrangiano del sistema es 1 L = e2γt mq̇ 2 − V (q) . 2 b) Encuentre las ecuaciones de Hamilton para la partı́cula. c) Si V (q) = 21 mω 2 q 2 , ω = cte, demuestre que la función generadora F2 (q, P, t) = eγt qP permite transformar a un Hamiltoniano constante. 24. Las ecuaciones de transformación entre dos conjuntos de coordenadas son Q= P = √ log(1 + q cos p), √ √ 2(1 + q cos p) q sin p. a) Demuestre que la transformación es canónica. b) Demuestre que la función generadora de esta transformación es F3 (p, Q) = −(eQ − 1)2 tan p. 6.12. PROBLEMAS 301 25. Considere la transformación infinitesimal de rotación R= P= r + (Φ × r) p + (Φ × p) , donde Φ es el vector a lo largo del eje de rotación, |Φ| = φ es el ángulo de rotación y es un parámetro infinitesimal. a) Demuestre que esta transformación es canónica. b) Suponga que esta transformación es generada por la función F2 = r · P + G(r, P). Determine G. 26. Una partı́cula de masa m se suelta en reposo desde una altura h a lo largo de un plano inclinado sin fricción, el cual forma un ángulo α con el suelo. a) Encuentre la posición de la partı́cula sobre el plano en función del tiempo, a partir de la correspondiente ecuación de Hamilton-Jacobi para este sistema. b) Encuentre el momento de la partı́cula en función del tiempo. 27. La energı́a cinética relativista de una partı́cula de masa m es p T = (cp)2 + (mc2 )2 , donde c es la velocidad de la luz. Considere una partı́cula relativista sujeta a la fuerza gravitacional terrestre F = −mgŷ, tal que inicialmente se suelta del reposo en y = 0. Determine la trayectoria de la partı́cula en función del tiempo a partir de la correspondiente ecuación de Hamilton-Jacobi para este sistema. 28. Encuentre la expresión de la acción correspondiente a un péndulo simple a partir de la ecuación de Hamilton-Jacobi para este sistema. 29. a) Empleando la correspondiente ecuación de Hamilton-Jacobi, calcule la posición en función del tiempo para una partı́cula libre con masa m y energı́a E que se encuentra en el origen en t = 0. b) Encuentre la acción en función del tiempo. 30. Una partı́cula de masa m y energı́a E se mueve en el potencial unidimensional V (q) = k/q 2 , donde k es constante. a) Encuentre la acción S(q, t) asociada a esta partı́cula. b) Encuentre la posición de la partı́cula en función del tiempo. 31. Una partı́cula sujeta a un potencial unidimensional posee el siguiente Hamiltoniano, H= p2 − λ tx, 2m λ = cte. a) ¿Es conservativo este sistema dinámico en su espacio de fase? b) Si inicialmente la partı́cula se encuentra en reposo en x = 0, calcule su trayectoria. c) Demuestre que la función f (x, p) = 9λm2 x2 − 2p3 es una integral de movimiento para este sistema. d) ¿Es este sistema completamente separable? 302 CAPÍTULO 6. DINÁMICA HAMILTONIANA 32. Un proyectil de masa m se lanza con velocidad vo desde el suelo, formando un ángulo α con la horizontal. a) Encuentre la trayectoria del proyectil en función del tiempo, usando el formalismo de Hamilton-Jacobi. b) Encuentre la acción para este sistema. 33. Considere un oscilador armónico bidimensional de masa m y cuyas constantes de resorte son kx y ky en las direcciones x y y, respectivamente. a) Encuentre las coordenadas y momentos de la partı́cula en función del tiempo utilizando ecuación de Hamilton-Jacobi para este sistema. b) Encuentre la acción para este sistema. 34. Una partı́cula con carga q y masa m se mueve en un plano sujeta a un potencial central V = 21 kr2 y a un campo magnético perpendicular al plano, tal que A = 12 B × r. a) Determine la ecuación de Hamilton-Jacobi para este sistema, en coordenadas polares. b) Encuentre la solución para la trayectoria de la partı́cula en términos de integrales explı́citas. 35. Considere una curva cerrada C(t) en un instante t en el espacio de fase (qi , pi ) de un sistema. Demuestre que la integral XI I= pi dqi i C(t) es una constante del movimiento. 36. Una partı́cula de masa m se encuentra inicialmente en x = 0 con velocidad vo x̂ y se mueve en el potencial unidimensional x x V (x) = k sin2 ∈ [−π/2, π/2], , a a y V (x) = ∞, para xa ∈ / [−π/2, π/2], con k, a constantes. Utilizando la ecuación de Hamilton-Jacobi, encuentre el perı́odo de oscilación de la partı́cula en este potencial si x a. 37. Una partı́cula con masa m y energı́a E se mueve periódicamente en el potencial unidimensional V = k|x|, k = cte. Usando variables de acción-ángulo, encuentre el perı́odo del movimiento de la partı́cula. 38. Una partı́cula de masa m se mueve en una dimensión sujeta al potencial V (x) = k sec2 (x/a). a) Encuentre una expresión para la acción S utilizando ecuación de Hamilton-Jacobi para este sistema. b) Encuentre la frecuencia de las oscilaciones de la partı́cula usando variables de acción-ángulo. Calcule esta frecuencia en el lı́mite de pequeñas amplitudes. 6.12. PROBLEMAS 303 39. Una partı́cula de masa m y energı́a E se mueve en el potencial unidimensional V (q) = 1 2 λ kq + 2 , 2 q k, λ = cte, q > 0. a) Dibuje el espacio de fase del sistema. b) Calcule la variable de acción. 40. Considere un oscilador armónico con masa m y constante de resorte k que puede moverse en un plano. a) Encuentre el Hamiltoniano del sistema en coordenadas polares. b) Calcule las frecuencias del movimiento usando variables de acción-ángulo. 41. Utilizando el método de las variables de acción-ángulo, demuestre que el perı́odo de libración de un péndulo simple, de masa m y longitud l, y cuya amplitud inicial es θ0 , se puede expresar como s Z θ0 √ dθ l √ T =2 2 . g 0 cos θ − cos θ0 42. Considere una partı́cula de masa m sujeta a moverse sin fricción sobre un cono invertido, con ángulo de vertice β, en el campo gravitacional terrestre. Calcule las frecuencias del movimiento mediante el uso de variables de acción-ángulo para este sistema. 43. Considere el Hamiltoniano H(qi , pi ) = s X βk Gk (qi , qi ), k=i donde los coeficientes βk son constantes y Gk (qi , qi ) = ap2k + (b + c)pk qk + dqk2 − (ad − bd) X (pi qk − qk pi )2 i6=k αk − αi , k = 1, . . . , s, con a, b, c, d y αk distintas constantes. Demuestre que las funciones Gk (qi , qi ) son constantes del movimiento y, por lo tanto, este sistema es integrable. 304 CAPÍTULO 6. DINÁMICA HAMILTONIANA Apéndice A Lagrangiano de una partı́cula relativista Hacia finales del siglo XIX, la Fı́sica consistı́a en dos grandes teorı́as para explicar la mayorı́a de los fenómenos conocidos hasta entonces: Mecánica, expresada en las leyes de Newton, que presentaba una descripción unificada de los fenómenos del movimiento. Electromagnetismo, contenido en las ecuaciones de Maxwell, que representaba la unificación de la descripción de los fenómenos eléctricos, magnéticos y ópticos, y que condujo al descubrimiento de las ondas electromagnéticas y de la naturaleza de la luz. En sus estudios sobre el movimiento, Galileo estableció el principio de relatividad: Principio de Relatividad de Galileo. Las leyes de la Mecánica son las mismas en diferentes sistemas de coordenadas inerciales que se encuentran en movimiento relativo uniforme. Dados dos sistemas de coordenadas S con origen O, y S’ con origen O0 , tal que O0 se mueve con velocidad constante v con respecto a O, las transformaciones de Galileo entre estos sistemas de coordenadas son r0 = r − vt t0 = t. (A.1) Si v = vx̂, las transformaciones de Galileo resultan en x0 = x − vt y0 = y z0 = z t0 = t. 305 (A.2) 306 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Figura A.1: Transformaciones de Galileo para sistemas inerciales en movimiento relativo. Derivando con respecto al tiempo la Ec. (A.1), se obtiene la suma de velocidades, dr dr0 = 0 +v dt dt ⇒ u = u0 + v, (A.3) puesto que dt = dt0 y donde u es la velocidad de una partı́cula medida en S y u0 corresponde a la velocidad de esa partı́cula medida en S’. En particular, si v = vx̂, la suma de velocidades da u0x = ux − v. (A.4) La forma de las leyes de Newton es invariante bajo las transformaciones de Galileo. Consideremos la Segunda Ley de Newton en S’, m d2 r0 = −∇0 V (r0 ) = F(r0 ). dt02 (A.5) Tenemos, dr dr0 = − v, dt0 dt d2 r0 d dr d2 r − v = = . dt02 dt dt dt2 (A.6) (A.7) Por otro lado, notamos que para cualquier f , ∂f ∂f ∂x ∂f = = , ∂x0 ∂x ∂x0 ∂x (A.8) y similarmente ∂f ∂f = , 0 ∂y ∂y ∂f ∂f = . 0 ∂z ∂z (A.9) Luego, ∇0 = ∂ ∂ ∂ , 0, 0 0 ∂x ∂y ∂z = ∂ ∂ ∂ , , ∂x ∂y ∂z = ∇. (A.10) 307 La coordenada r0 se puede expresar, en general, como la distancia entre la partı́cula en consideración y otra partı́cula (o influencia externa) con la cual aquella interactúa. Es decir, r0 = r0i − r0j = ri − rj = r. (A.11) Luego, ∇0 V (r0 ) = ∇V (r). De acuerdo a las transformaciones de Galileo Ec. (A.1), la Ec. (A.5) en el sistema de referencia S’ se expresa en el sistema S como m d2 r = −∇V (r) = F(r). dt2 (A.12) Por lo tanto, la Segunda ley de Newton es invariante (conserva su forma) bajo las transformaciones de Galileo, y el principio de relatividad de Galileo es válido para estas transformaciones. Sin embargo, en contraste con el comportamiento de las leyes de la Mecánica, las leyes del Electromagnetismo no son invariantes ante las transformaciones de Galileo. Las ecuaciones de Maxwell para los campos E(r, t) y B(r, t) en el sistema S son ∇ · E = 4πρ 1 ∂B ∇×E+ =0 c ∂t ∇·B=0 1 ∂E 4π ∇×B− = J. c ∂t c (A.13) (A.14) (A.15) (A.16) donde c es la velocidad de la luz en el vacı́o. Las ecuaciones de Maxwell fuera de las fuentes (ρ = 0, J = 0) implican que, tanto el campo eléctrico E como el campo magnético B, satisfacen la ecuación de onda electromagnética en S, 1 ∂2ψ ∇2 ψ − 2 2 = 0, (A.17) c ∂t donde ψ = Ej , o ψ = Bj (componente j del campo eléctrico o del campo magnético). Consideremos la componente Ej (r0 , t0 ) en S’. Entonces, X ∂Ej ∂x0 X ∂Ej ∂Ej ∂Ej ∂Ej 0 0 i (r , t ) = + = − 0 ∂t0 0 vi + ∂t , 0 ∂t0 ∂x ∂t ∂x i i i i (A.18) donde hemos usado las transformaciones de Galileo x0i = xi − vi t, t0 = t ∂x0i ∂x0i ⇒ = = −vi . 0 ∂t ∂t (A.19) (A.20) Luego, ∂Ej ∂Ej = + v · ∇0 Ej . ∂t ∂t0 (A.21) 308 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Por lo tanto, las ecuaciones de Maxwell son invariantes bajo las transformaciones de Galileo sólo si v = 0; es decir, conservan su forma solamente en un sistema de referencia inercial en reposo con respecto al medio en el cual se propaga una onda electromagnética. (El “medio” correspondiente al vacı́o se denominaba éter ). Ante esta situación, se presentan los siguientes escenarios posibles: 1. Las transformaciones de Galileo son correctas, tanto para la Mecánica como para el Electromagnetismo, lo cual implica que las ecuaciones de Maxwell son incorrectas. 2. Las transformaciones de Galileo son válidas para la Mecánica en todo sistema inercial, pero las ecuaciones de Maxwell sólo son válidas en un sistema inercial en reposo con respecto al éter (v = 0). 3. Tanto las leyes de la Mecánica como las del Electromagnetismo son invariantes en todo sistema inercial, pero no bajo las transformaciones de Galileo. Esto implica que las leyes de Newton son incorrectas y que se requiere otra transformación de coordenadas. El éxito de las ecuaciones de Maxwell en la predicción de las ondas electromagnéticas (experimentos de Hertz, Marconi, y otros) sugiere descartar el escenario (i). Por otro lado, la falla en la detección del movimiento relativo al éter (experimento de MichelsonMorley) requiere descartar la posibilidad (ii). El escenario (iii) fue el camino elegido por Einstein en 1905. Postulados de la Relatividad Especial. 1) Las leyes de la Naturaleza (los resultados de los experimentos) son las mismas en todos los sistemas inerciales. 2) La velocidad de la luz es constante en todos los sistemas inerciales. Según el postulado 1, la ecuación de onda electromagnética se cumple en los sistemas de referencia S y S’. El postulado 2 implica que la forma de una onda electromagnética debe ser igual en los sistemas de referencia inerciales S y S’. Entonces, consideremos un pulso esférico de luz emitido en el origen O de S en el instante t = t0 = 0, cuando ambos orı́genes O y O0 coinciden. Figura A.2: Pulso electromagnético emitido en O cuando los orı́genes O y O0 coinciden. 309 Luego, En S: |r| = ct En S’: |r0 | = ct0 , (A.22) donde c es la magnitud constante de la velocidad de la luz en ambos sistemas. En términos de las coordenadas en cada sistema, tenemos x2 + y 2 + z 2 = c2 t2 x02 + y 02 + z 02 = c2 t02 . En S: En S’: (A.23) Las relaciones (A.23) no son compatibles con las transformaciones de Galileo. Esto se puede verificar sustituyendo las transformaciones Ecs. (A.2) en la relación (A.23) para S’, lo que da x2 − 2vxt + v 2 t2 + y 2 + z 2 = c2 t2 , (A.24) y lo cual es distinto de la expresión correspondiente en S. Las transformaciones compatibles con los postulados de la Relatividad deben ser lineales en t y en x para preservar la forma de una onda esférica en ambos sistemas de coordenadas. Además, deben tender a las transformaciones de Galileo cuando la velocidad relativa entre los dos sistemas es pequeña, puesto que la suma de velocidades derivada de esas transformaciones, Ec. (A.3), funciona en las práctica en tales situaciones. La simetrı́a de los sistemas sugiere invarianza en las coordenadas y, x perpendiculares a la dirección del movimiento. Entonces, si la velocidad de O0 es v = vx̂, supongamos unas transformaciones lineales de la forma x0 = γ(x − vt) t0 = γ(t − f x) y0 = y z 0 = z, (A.25) donde γ y f son factores a determinar, tales que γ → 1 y f → 0 cuando v es pequeña. Sustitución de las transformaciones (A.25) en la relación (A.23) para S’ consistente con el segundo postulado, da v2 2 2 2 2 2 2 2 2 x γ (1 − c f ) + 2(f c − v)γ xt + y + z = 1 − 2 γ 2 c2 t2 . (A.26) c Comparando con la relación (A.23) para S, requerimos f c2 − v = 0 v2 1− 2 =1 c (A.27) γ 2 (1 − f 2 c2 ) = 1 (A.29) γ2 (A.28) lo cual conduce a f= v , c2 γ= 1− v2 c2 −1/2 . (A.30) 310 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Luego, las transformaciones buscadas son x − vt x0 = r v2 1− 2 v c t − 2x t0 = r c v2 1− 2 c y0 = y z 0 = z. (A.31) Las Ecs. (A.31) son las transformaciones de Lorentz. La ecuación de una onda electromagnética y, por tanto, las ecuaciones de Maxwell, son invariantes bajo estas transformaciones. Se acostumbra emplear la notación β ≡ v/c, con la cual las transformaciones de Lorentz se escriben en forma compacta como x0 = γ(x − βct) β t0 = γ t − x c y0 = y z 0 = z. (A.32) Note que β ≤ 1 y γ ≥ 1. En el lı́mite de pequeñas velocidades v c, tenemos β 1 y γ ≈ 1, y las transformaciones de Lorentz se aproximan a las transformaciones de Galileo, x0 ≈ x − vt t0 ≈ t. (A.33) Las transformaciones de Lorentz inversas se pueden obtener haciendo v → −v, x → −x0 , t → t0 , en las Ecs. (A.32), 0 0 x = γ(x + βct ) β t = γ t 0 + x0 c y = y0 z = z0. (A.34) A partir de las transformaciones de Lorentz se obtiene la regla de adición de velocidades, dx0 dx dt 0 ux = 0 = γ − βc 0 , dt dt0 dt (A.35) dx dx dt dt = = ux 0 , dt0 dt dt0 dt 311 luego, u0x dt = γ (ux − βc) 0 = γ (ux − βc) dt dt0 β = γ 1 − ux , dt c dt0 dt −1 , (A.36) (A.37) lo cual conduce a ux − v . (A.38) β 1 − ux c La relación inversa de la suma de velocidades se obtiene haciendo v → −v, ux → u0x , en la Ec. (A.38), u0 + v ux = x . (A.39) β 1 + u0x c u0x = Contracción de la longitud. Consideremos un objeto de longitud Lo en reposo a lo largo del eje x en el sistema S. Luego, independiente de t, Lo = x2 − x1 , (A.40) Consideremos la longitud del objeto medida en el sistema S’. Un observador en S’ debe realizar una medida de los extremos x02 y x01 simultáneamente en S’, es decir, para un mismo tiempo t0 , L0 = x02 (t0 ) − x01 (t0 ). (A.41) Figura A.3: Contracción de la longitud. Las transformaciones de Lorentz, Ecs. (A.32), dan las coordenadas x1 y x2 en S para un mismo tiempo t0 en S’ , x2 = γ(x02 + βct0 ) x1 = γ(x01 + βct0 ) ⇒ x2 − x1 = γ(x02 − x01 ) . (A.42) 312 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Luego, Lo L = = Lo γ r 0 1− v2 . c2 (A.43) Como γ > 1, la longitud L0 del objeto medida en S’ es menor que la longitud Lo en S donde el objeto se encuentra en reposo. Dilatación del tiempo. Un observador con un reloj en S, presente en dos eventos que ocurren en las mismas coordenadas con respecto al observador, mide el tiempo propio entre esos eventos. El tiempo propio entre dos eventos que ocurren en un mismo punto x de S es τ ≡ t2 (x) − t1 (x). (A.44) Las transformaciones de Lorentz inversas, Ecs. (A.34), dan para ese intervalo de tiempo en S’, β β 0 0 0 (A.45) ∆t = t2 − t1 = γ t2 − x − γ t1 − x = γ(t2 − t1 ). c c Luego, ∆t0 = γτ = r τ v2 1− 2 c . (A.46) Figura A.4: Un observador en S mide el tiempo propio entre dos eventos que ocurren en las mismas coordenadas en S. Puesto que γ > 1, el intervalo de tiempo medido en S’ es mayor que el tiempo propio medido en S. En general, el tiempo propio es el intervalo de tiempo más corto posible entre dos eventos. 313 Dinámica relativista. Los postulados de la Relatividad y las transformaciones de Lorentz son compatibles con las ecuaciones de Maxwell, pero requieren modificaciones de las leyes de Newton. Einstein propuso redefinir el momento lineal de una partı́cula que se mueve con velocidad u en un sistema S, del siguiente modo pi = m dxi , dτ (A.47) donde τ es el tiempo propio (el tiempo medido en el sistema donde la partı́cula está en reposo), el cual está definido unı́vocamente (tiene el mismo valor) para todos los observadores inerciales. Tenemos, dxi dxi dt = = γui . (A.48) dτ dt dτ Luego, el momento relativista es p = mγu = r mu u2 1− 2 c , (A.49) donde u es la velocidad de la partı́cula en el sistema de referencia S. La Segunda Ley de Newton relativista se escribe entonces, F= dp . dt (A.50) donde p está definido en la Ec. (A.49). En esta forma, la Segunda Ley de Newton es invariante bajo las transformaciones de Lorentz, dp dp0 = 0. dt dt u Note que en el lı́mite de bajas velocidades, β = 1, obtenemos p ≈ mu. c (A.51) Invariantes relativistas. Existen cantidades escalares que tienen el mismo valor en todos los sistemas inerciales. Una cantidad cuyo valor es independiente del sistema de coordenadas se denomina invariante de Lorentz. Por ejemplo, la invariancia de la cantidad s2 = (ct)2 − x2 − y 2 − z 2 , (A.52) se deduce inmediatamente de las Ecs. (A.23). Un invariante de Lorentz es el intervalo entre dos eventos, definido como ∆s2 = (c∆t)2 − ∆x2 − ∆y 2 − ∆z 2 , lo cual se demuestra directamente usando las transformaciones de Lorentz. (A.53) 314 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Igualmente, la cantidad γ 2 (1 − β 2 ) = 1 (A.54) tiene el mismo valor en todos los sistemas. Multiplicando la Ec. (A.54) por la constante m2 c4 , obtenemos otra cantidad invariante, m2 c4 γ 2 − p2 c2 = m2 c4 = cte. (A.55) E ≡ γmc2 , (A.56) Energı́a relativista. Si definimos la cantidad entonces podemos expresar la Ec. (A.55) como E 2 − p2 c2 = m2 c4 = cte. (A.57) E 2 − p2x c2 − p2y c2 − p2z c2 = cte. (A.58) lo cual equivale a Los términos en la Ec. (A.57) poseen unidades de energı́a al cuadrado. Luego, la cantidad E es un tipo de energı́a que se puede interpretar fı́sicamente si hacemos una expansión v en términos de β = 1, c 1 E = mc2 (1 − β 2 )−1/2 = mc2 1 + β 2 − O(β 4 ) (A.59) 2 Luego, 1 E = mc2 + mv 2 + · · · 2 (A.60) El primer término en la Ec. (A.60) es constante y no depende de la velocidad de la partı́cula, Eo = mc2 , (A.61) por lo que representa la energı́a en reposo de la masa m. El segundo término en la Ec. (A.60) corresponde a la energı́a cinética de la partı́cula para bajas velocidades. Luego, la cantidad E se interpreta como la energı́a total relativista de una partı́cula libre, E=r mc2 2 v 1− 2 c = mc2 + Trel . (A.62) 315 Transformaciones relativistas del momento y de la energı́a. Comparando la Ec. (A.58) con la Ec. (A.52), podemos inferir que las cantidades E/c2 , px , py y pz deben transformarse del mismo modo como lo hacen t, x, y y z, respectivamente. Esto es, p0x = γ(px − βc E) E 0 = γ(E − βcpx ) p0y = py p0z = pz . (A.63) Lagrangiano para una partı́cula relativista. Las leyes de Newton se cumplen en Relatividad con la definición apropiada de p, dada en la Ec. (A.49). Luego, las ecuaciones de Lagrange también se deben cumplir para un Lagrangiano L definido apropiadamente, d ∂L ∂L − = 0. (A.64) dt ∂ ẋi ∂xi Consideremos una partı́cula con velocidad v y posición r en un potencial V (r). Luego, ∂L = pi = γmẋi , ∂ ẋi ∂L ∂V = = Fi . ∂xi ∂xi (A.65) Supongamos la velocidad a lo largo del eje xi , i.e., ẋi = v. Entonces, ∂L ∂L = = γmv , ∂ ẋi ∂v luego, la dependencia funcional del Lagrangiano con la velocidad es Z Z v dv β dβ p L(v) = m r = mc2 , 2 1 − β2 v 1− 2 c (A.66) (A.67) lo cual da L(v) = −mc2 (1 − β 2 )1/2 . (A.68) Para β 1, L(v) se aproxima a la energı́a cinética newtoniana L(v) ≈ 1 mv 2 + · · · 2 (A.69) Luego, el Lagrangiano para una partı́cula relativista debe tener la forma L = L(v)−V (r), es decir, r v2 2 L = −mc 1 − 2 − V (r). (A.70) c 316 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Note que L 6= E − V , y L 6= Trel − V . Sin embargo, puesto que L no depende explı́citamente del tiempo, la función de energı́a es una cantidad constante para este sistema, X ∂L ẋi − L = cte. (A.71) E= ∂ ẋi i Utilizando L de la Ec. (A.70), obtenemos P p ẋi ẋi E = mp i + mc2 1 − β 2 + V, 1 − β2 lo cual se reduce a E=p mc2 1 − β2 + V = E + V = cte. (A.72) (A.73) La inclusión de potenciales dependientes de la velocidad no representa problema, y se hace del mismo modo que en el caso no relativista. En particular, recordemos que en Mecánica Clásica la energı́a potencial de una partı́cula con carga q que se mueve con velocidad v en un campo electromagnético caracterizado por los potenciales ϕ y A está dada por q V = qϕ − A · v . (A.74) c La fuerza de Lorentz sobre una partı́cula en un campo electromagnético se deriva de este potencial. Luego, el Lagrangiano relativista para una partı́cula en un campo electromagnético es r v2 q 2 L = −mc 1 − 2 − qϕ + A · v. (A.75) c c Ejemplo. 1. Partı́cula con masa m sujeta a la fuerza F = ma, donde a es una constante. El potencial es V = −max y el Lagrangiano relativista es p L = −mc2 1 − β 2 + max, donde β = ẋ/c. La ecuación de Lagrange para x da: ! d β a p = . dt c 1 − β2 (A.76) (A.77) Integrando, tenemos β p 1− β2 = at + α c ⇒ β=p at + α c2 + (at + α)2 (A.78) 317 donde α es una constante de integración. Integrando otra vez, Z (at + α)dt x=c p (A.79) c2 + (at + α)2 p c p 2 x − x0 = c + (at + α)2 − c2 + a2 (A.80) a donde hemos introducido la condición inicial x = x0 en t = 0. Si la partı́cula se encuentra en reposo ẋ(0) = 0 en el origen x0 en t = 0, entonces α = 0 y tenemos c2 x+ 2 a 2 − c2 t 2 = c4 , a2 (A.81) lo cual corresponde a una hipérbola en el plano (x, t). Note que en el lı́mite no relativista, β 1, la Ec. (A.78) da la trayectoria parábolica usual en el plano (x, t), 1 x ≈ at2 + αt + x0 . (A.82) 2 318 APÉNDICE A. LAGRANGIANO DE UNA PARTÍCULA RELATIVISTA Apéndice B Transformaciones de Legendre Dada una función f (x), con x como variable, una transformación de Legendre permite encontrar otra función g(y) que contiene la misma información que f (x), usando como argumento la pendiente y = f 0 (x). Figura B.1: Transformación de Legendre. Cada punto (f, x) en la curva f (x) define una lı́nea recta que pasa por un punto (0, b) con pendiente y = f 0 (x). El conjunto de todas las rectas (y, b) describe las envolventes de la curva f (x) y contiene la misma información que f (x). Ambas descripciones, en términos de (f, x) o de (y, b), son equivalentes. De la Fig. (B.1), tenemos y= f −b ⇒ (−b) = yx − f x (B.1) Por otro lado, y(x) = df ⇒ x = x(y) dx 319 (inversión). (B.2) 320 APÉNDICE B. TRANSFORMACIONES DE LEGENDRE Definimos la función g(y) ≡ yx(y) − f (x(y)). (B.3) La función g(y) se denomina la transformada de Legendre de f (x). Matemáticamente, los puntos (g, y) corresponden a (−b, y) y, por lo tanto, describen la misma curva que f (x). Si tenemos una función de s variables f (x1 , x2 , . . . , xs ), existen s derivadas yi = ∂f = yi (x1 , x2 , . . . , xs ), ∂xi (i = 1, 2, . . . , s). (B.4) Mediante inversión, es posible obtener las s variables xi = xi (y1 , y2 , . . . , ys ). (B.5) La transformada de Legendre de f (x1 , x2 , . . . , xs ) se define como g(y1 , y2 , . . . , ys ) = s X xi yi − f (x1 , x2 , . . . , xs ) (B.6) i=1 donde las variables xi se sustituyen usando las Ecs. (B.5). La transformada de Legendre se puede aplicar a un subconjunto de los argumentos de una función. Por ejemplo, si tenemos f (zi , xi ), se puede definir su transformada X g(zi , yi ) = zi yi − f (zi , xi ), (B.7) i=1 donde yi = ∂f (zi , xi ) = yi (xi , zi ) ∂xi ⇒ xi = xi (zi , yi ). (B.8) Las transformadas de Legendre se emplean en Termodinámica y en otras áreas de la Fı́sica para introducir descripciones alternativas que resultan útiles para diversos sistemas. En particular, si tenemos un sistema caracterizado por el Lagrangiano L(qi , q˙i , t), los momentos conjugados son ∂L = pi (q1 , . . . , qs ). (B.9) pi = ∂ q˙i Entonces, el Hamiltoniano del sistema corresponde a la transformada de Legendre del Lagrangiano, s X H(qi , pi ) = qi pi − L(qi , q˙i , t). (B.10) i=1 Apéndice C Teorema del virial Se trata de un teorema estadı́stico en Mecánica. Se refiere a promedios temporales de cantidades dinámicas. Consideremos un sistema de N partı́culas cuyas masas, posiciones y velocidades están dados por mi , ri y vi , respectivamente, i = 1, 2, . . . , N . Entonces, la ecuación de movimiento de la partı́cula i se puede expresar como Fi = ṗi , (C.1) donde Fi es la fuerza neta sobre la partı́cula i y pi = mi vi . La energı́a cinética total del sistema es T = = = 1X mi vi2 2 i 1X (mi vi · vi ) 2 i 1X (pi · vi ). 2 i (C.2) Luego, 2T = X pi · vi i = X d X (pi · ri ) − (ri · ṗi ). dt i i (C.3) Recordemos que el promedio de una variable g que toma valores discretos g1 , g2 , . . . , gN , corresponde a la cantidad N 1 X hgi = gi . (C.4) N i=1 321 322 APÉNDICE C. TEOREMA DEL VIRIAL Si g(t) es una función que toma valores continuos en el tiempo, su promedio temporal se define como Z 1 τ hgi ≡ lı́m g(t)dt. (C.5) τ →∞ τ 0 Si g(t) = df , para una función f acotada, |f (t)| < ∞, entonces dt Z 1 τ df f (τ ) − f (0) hgi = lı́m dt = lı́m = 0. τ →∞ τ 0 dt τ →∞ τ (C.6) Si tomamos el promedio temporal en todos los términos de la Ec. (C.3), y suponiendo que los movimientos de las partı́culas son finitos, obtenemos el teorema del virial, X 2hT i = −h ri · Fi i. (C.7) i Si Fi = −∇V (ri ) (fuerzas conservativas), el teorema del virial tiene la forma * + 1 X ri · ∇V (ri ) . hT i = 2 i (C.8) Como una aplicación, consideremos una partı́cula en campo central V (r) = krn . Entonces, el teorema del virial para esta fuerza conservativa establece que 1 ∂V n hT i = (C.9) r = hV i. 2 ∂r 2 Para el potencial de Kepler, con n = −1, el teorema del virial, Ec. (C.9), da 1 hT i = − hV i. 2 (C.10) El promedio de la energı́a total se puede expresar como hEi = hT i + hV i = constante = E (C.11) E = −hT i < 0, (C.12) puesto que hT i siempre es una cantidad positiva. El hecho de que la energı́a total sea negativa es compatible con un movimiento finito de la partı́cula en el potencial de Kepler (Capı́tulo 3). El potencial de un oscilador armónico corresponde a n = 2. En este caso, la Ec. (C.9) resulta en hT i = hV i, (C.13) y la energı́a total es positiva, como se espera, E = hT i + hV i = 2hT i > 0. (C.14) Apéndice D Bibliografı́a 1. H. Iro, A modern approach to Classical Mechanics, World Scientific (2002). 2. L. D. Landau and E. M. Liftshitz, Mechanics, 3rd. Edition, Pergamon Press (1976). 3. H. Goldstein, C. Poole and J. Safko, Classical Mechanics, 3rd. edition, Addison-Wesley (2002). 4. J. José and E. J. Saletan, Classical Mechanics: a contemporary approach, Cambridge University Press (1998). 5. T. Tél and M. Gruiz, Chaotic Dynamics: an introduction based on Classical Mechanics, Cambridge University Press (2006). 6. F. Scheck, Mechanics: From Newton’s Laws to Deterministic Chaos, 5th. edition, Springer (2010). 7. J. L. McCauley, Classical Mechanics: transformations, flows, integrable and chaotic dynamics, Cambridge University Press (1997). 8. J. Michael Finn, Classical Mechanics, Infinity Science Press LLC (2008). 9. T. W. B. Kibble and F. H. Berkshire, Classical Mechanics, Imperial College Press (2004). 10. G. J. Sussman and J. Wisdom, Structure and Interpretation of Classical Mechanics, MIT Press (2001). 11. A. J. Lichtenberg and M.A. Lieberman, Regular and Chaotic Dynamics, 2nd. Edition, Springer-Verlag (1992). 12. D. Ter Haar, Elements of Hamiltonian Mechanics, Pergamon Press (1971). 13. G. L. Kotkin and V. G. Serbo, Collection of problems in Classical Mechanics, Pergamon Press (1971). 14. G. L. Baker and J. A. Blackburn, The pendulum: a case study in Physics, Oxford University Press (2005). 323 324 APÉNDICE D. BIBLIOGRAFÍA