I. Descripción newtoniana del campo gravitatorio . . . 2005-06 1 LA DESCRIPCIÓN NEWTONIANA DEL CAMPO GRAVITATORIO Y LA INTERPRETACION DE LA GRAVITACION NEWTONIANA COMO CURVATURA DEL ESPACIO–TIEMPO M. Santander Departamento de Fı́sica Teórica, Universidad de Valladolid Versión 4.1 (Mayo 2006, correcciones de detalle y redefinicion de macros de formato). Revisiones anteriores: Versión 4.0, Abril 2006, 3.02, Abril 2004; 3.0, Mayo 2003; 2.2, Noviembre 2002; 2.1, Octubre 2002; 2.0, Octubre 2001. Estas notas usan los macros ACRES de G. Tuynmann. La exposición está organizada en dos partes, como sugiere el tı́tulo global. En la primera parte se pretende sólo describir el campo gravitatorio newtoniano de la manera convencional, aunque haciendo énfasis en los aspectos que nos interesen; lo haremos en dos etapas, suponiendo primero que el sistema de referencia usado es un sistema inercial, y liberándonos de esa limitación luego, especialmente en favor de un tipo particular de sistemas no inerciales, los sistemas en caı́da libre y sin rotación, que resultarán esenciales en el desarrollo posterior, y que a veces se denominan sistemas de referencia localmente inerciales. En la segunda parte, lo que se pretende es introducir la interpretación geométrica de la gravitación newtoniana como una teorı́a en la que el espacio-tiempo tienen una conexión con curvatura. La idea básica es la formulación de Cartan del principio de inercia, que requiere que en el espacio-tiempo esté definida una conexión. El resto es traducir los resultados convencionales —ecuaciones del movimiento, ecuaciones de campo, etc.— al nuevo lenguaje. Debe quedar claro desde el principio que la interpretación geométrica es simplemente una formulación o interpretación alternativa, que es fı́sicamente equivalente por completo a la interpretación usual. • ejercicio 1.1. Para referencia posterior, damos algunos datos numéricos que se usarán en diversas estimaciones: Constante de Gravitación G = 6.67 × 10−8 cm3 g−1 s−2 Velocidad de la luz c = 2.99 × 1010 cm s−1 Masa del Sol: M = 1.99 × 1033 g Radio del Sol: R = 6.96 × 1010 cm Masa de la Tierra: M⊕ = 5.97 × 1027 g Radio de la Tierra: R⊕ = 6.371 × 108 cm Masa de la Luna: Ml = 7.35 × 1025 g Distancia media Tierra-Sol (U.A.): 1.49 × 1013 cm Distancia media Tierra-Luna 3.84 × 1010 cm 1 I. Descripción newtoniana del campo gravitatorio . . . 2005-06 2 LA DESCRIPCIÓN NEWTONIANA DEL CAMPO GRAVITATORIO Descripción del Campo Gravitatorio en un Sistema de Referencia Inercial. La descripción clásica del campo gravitatorio se realiza en términos de un vector espacial (3-vector), g(x, t) llamado intensidad de campo gravitatorio que describe la fuerza gravitatoria F = mg producida por el campo sobre una partı́cula test de masa m situada en el punto x en el instante t. Para formular esta teorı́a de un modo paralelo a la teorı́a de Einstein, es necesario distinguir tres niveles en la descripción clásica; los dos primeros —potencial gravitatorio y campo gravitatorio— son bien conocidos, mientras que el tercero —campo de marea— es mucho menos familiar. En todo lo que sigue, donde se comienza desde cero, x, X denotan los vectores posición de puntos en el espacio fı́sico, asimilado al espacio euclideo 3D, referidos a sus componentes cartesianas usuales; el tensor métrico en esas coordenadas es δIJ . Asimismo se usará de manera sistemática el convenio de Einstein de suma sobre ı́ndices (latinos, I, i con rango 1, 2, 3 o griegos µ con rango 0, 1, 2, 3) repetidos (mudos). 1A) El Campo gravitatorio. La fuerza gravitatoria que se ejerce sobre una partı́cula test de masa gravitatoria mgr en el punto x, debido a la presencia de una colección de masas (gravitatorias) M(s) , situadas en las posiciones X(s) (t) está dada según la ley de Newton por: Fgrav = −mgr G X (s) M(s) x − X(s) (t) (x − X(s) (t))2 | x − X(s) (t) | (1.1) donde G es la constante gravitatoria de Newton (cuya primera determinación experimental con cierta precisión se debe a Cavendish), G = 6.67 × 10−8 cm3 g−1 s−2 . Cuando esta expresión para la fuerza gravitatoria se introduce en el marco de la mecánica Newtoniana, se obtiene la ecuación del movimiento para la partı́cula test min d2 x(t) = Fgr . dt2 (1.2) Parece ser un hecho experimental notable que la masa inercial min es universalmente proporcional a la masa gravitatoria mgr . La primera comprobación de este hecho se debe a Galileo, mediante experimentos con péndulos de diversas sustancias; enunciado en términos modernos Galileo dió una cota para la eventual diferencia relativa entre las masas inerte y gravitatoria de diversos cuerpos |min − mgr |/min < 2 · 10−3 . La comprobación fina de tal hipótesis comienza con el barón húngaro L. Eötvös, quien a partir de 1890 realizó medidas muy precisas con una balanza de torsión para muy diversas sustancias (cobre, agua, sulfato de cobre, madera, asbesto, . . . ) en comparación con un patrón de platino, obteniendo la cota |min − mgr |/min < 5 · 10−8 para la eventual diferencia relativa independientemente de la sustancia, que mejoró a < 3 · 10−9 en I. Descripción newtoniana del campo gravitatorio . . . 2005-06 3 experimentos más precisos en 1910. Sorprendentemente, una balanza de torsión sigue siendo hasta hoy el mejor instrumento para tal comprobación; las mejores cotas son < 1 · 10−11 en los experimentos de Adelberger et al. (1990) y de < 0.9 · 10−12 en los experimentos de Braginski et al. (1971), y se espera llegar hasta una precisión < 10−17 en un experimento propuesto por Barlier et al. (1991), a realizar en una nave espacial en caı́da libre, como la Estación Espacial Internacional (ISS). Si tomamos la proporcionalidad estricta entre masa inercial y gravitatoria como un hecho, podemos simplemente prescindir de la etiqueta inercial en (1.2). Entonces, usando unidades adecuadas la masa inercial y la gravitatoria son iguales para cualquier cuerpo. Como consecuencia, el movimiento en un campo gravitatorio dado de partı́culas test de masas y composiciones diferentes, para las mismas condiciones iniciales, es idéntico. Esto permite definir un vector intensidad de campo gravitatorio (o simplemente campo gravitatorio) como la fuerza por unidad de masa de la partı́cula test, que la distribución de materia que crea el campo ejerce sobre una partı́cula test de masa m: g(x, t) = 1 Fgrav . m En consecuencia la masa m de la partı́cula test desaparece de la ecuación del movimiento que adopta la forma usual: d2 x(t) = g(x(t), t). (1.3) dt2 El paso siguiente es plantear las ecuaciones de campo, que relacionan la distribución de masa (fuente del campo) con el campo del vector g(x, t). En el caso de una distribución continua de masa con densidad ρ(x, t) dada, g(x, t) es un campo vectorial irrotacional que satisface la ecuación de Poisson: − div g(x, t) = 4 π G ρ(x, t), rot g(x, t) = 0, (1.4) Estas dos ecuaciones son las ecuaciones del campo gravitatorio en la teorı́a newtoniana. • ejercicio 1.2. La solución más simple de las ecuaciones (1.4) corresponde al caso de una masa esférica de densidad uniforme ρ0 , con radio R, masa M y en reposo. En un sistema de coordenadas cartesianas con origen en el centro de la masa, el campo gravitatorio g a distancia r del centro I vale g I (x) = −GM xr3 en el exterior (cuando r > R) y en el interior (cuando r < R) está dado por g I (x) = − GM xI . Nótese que al atravesar el borde del cuerpo el campo gravitatorio R3 cambia con la posición de manera continua, y que en el interior del cuerpo puede reescribirse g I (x) = − 43 πGρ0 xI (r < R) 1B) El Potencial gravitatorio. El segundo nivel de descripción de la gravitación involucra al potencial, cuya introducción puede abordarse de dos maneras. Matemáticamente, la segunda ecuación en (1.4) permite escribir (localmente) el vector intensidad de campo gravitatorio como el vector asociado (mediante la métrica espacial δIJ ) al covector gradiente de un campo escalar ϕ(x, t), ∂ϕ(x, t) . (1.5) g I (x, t) = −δ IJ ∂xJ I. Descripción newtoniana del campo gravitatorio ... 2005-06 4 El campo escalar ϕ(x, t) se denomina potencial gravitatorio. La energı́a potencial de la partı́cula test de masa m situada en el punto x en el instante t es: V (x, t) = −mG X (s) M(s) , | x − X(s) (t) | (1.6) y en términos de V las ecuaciones (1.1) y (1.2) son: F = −∇V (x, t), m d2 x(t) = F = −∇V (x(t), t). dt2 (1.7) (1.8) Dividiendo las ecuaciones (1.7)–(1.8) por m y comparando con (1.3)–(1.5), resulta claro que el potencial gravitatorio ϕ(x, t) admite una interpretación fı́sica como la energı́a potencial gravitatoria por unidad de masa que posee una partı́cula test situada en el punto (x, t) del espacio-tiempo: ϕ(x, t) = 1 V (x, t) m Al igual que ocurrı́a en (1.3), esto implica que cuando las ecuaciones de movimiento se escriben en términos del potencial, la masa de la partı́cula test desaparece completamente: d2 xI (t) ∂ϕ = −δ IJ J (x(t), t), (1.9) 2 dt ∂x La ecuación de campo (1.4) en términos del potencial queda en la forma: ∇2 ϕ(x, t) = 4 π G ρ(x, t). • (1.10) ejercicio 1.3. El potencial producido por una masa esférica uniforme y en reposo a distancia r del centro vale en el exterior (cuando r > R) ϕ(x, t) = −GM r1 y en el interior (cuando r < R) está dado por ϕ(x, t) = − 32 GM + 21 GM r2 . Notar que el término constante aditivo en el R R3 potencial interior serı́a innecesario, pero se añade con el objeto de que el potencial sea continuo en r = R, lo que permite hacer estimaciones significativas de la diferencia de potencial entre puntos interiores y exteriores. Notar también que en el interior el potencial es un oscilador armónico. Un complemento ilustrativo es derivar la expresión para la frecuencia propia de oscilación de un cuerpo en caı́da libre atravesando el interior de la tierra por un pozo diametral. 1C) El Campo de Marea. Consideremos ahora la gravitación desde un punto de vista ligeramente distinto. Vamos a desviar nuestra atención de las ecuaciones de movimiento que dan la evolución de la posición x(t) de la partı́cula test con respecto a un sistema de referencia previamente fijado, y vamos a fijarla en las ecuaciones que describen la evolución de la posición relativa o separación η(t) entre dos partı́culas test, ambas en caı́da libre en el campo gravitatorio. I. Descripción newtoniana del campo gravitatorio . . . 2005-06 5 • ejercicio 1.4. En el campo gravitatorio de la Tierra, en el exterior, demostrar que la separación ηh (t) entre dos partı́culas en caı́da libre y situadas inicialmente en reposo a la misma altura (por tanto con separación horizontal, denotada ηh ), satisface la ecuación: d2 ηh (t) ≈− dt2 GM⊕ r3 ηh (t) (1.11) mientras que si la separación es inicialmente vertical denotada ηv , la ecuación es d2 ηv (t) ≈− dt2 −2GM⊕ r3 ηv (t) (1.12) donde r > R⊕ es la distancia al centro. El caso general es similar: Si denotamos por x(t) e y(t) las trayectorias de las dos partı́culas test —ambas soluciones de la ecuación (1.3)—, y consideramos la separación η(t) = y(t) − x(t), la aceleración de η es igual a la diferencia entre el valor del campo gravitatorio g en los dos puntos (y(t), t) y (x(t), t). Pero si ambos puntos son próximos, el término dominante en esta diferencia se obtiene desarrollando el campo g(y(t), t) alrededor de x(t) en serie de potencias de η y conservando los primeros términos del desarrollo: ∂g I (x, t) J (y − xJ ) + . . . (1.13) g I (y, t) = g I (x, t) + J ∂x Ası́ vemos que lo importante para este problema es el campo gravitatorio diferencial,es decir, el eventual cambio del vector intensidad g en el espacio. Esto conduce a considerar un nuevo objeto que llamaremos campo de marea A, un tensor (3-D, bajo rotaciones) una vez contravariante y una vez covariante cuyas componentes están definidas como: AI J (x, t) = − ∂g I (x, t) , ∂xJ (1.14) En términos de A la aceleración de la separación relativa η I (t) entre dos partı́culas test en caı́da libre es: d2 η I (t) ≈ −AI J (x(t), t) η J (t). (1.15) dt2 Expresando g en términos del potencial ϕ, las componentes del campo de marea A resultan ser las derivadas espaciales segundas del potencial: AI J = δ IK ∂2ϕ , ∂xK ∂xJ AIJ := δIL AL J = ∂2ϕ , ∂xI ∂xJ AIJ = δ IK δ JL ∂2ϕ . (1.16) ∂xK ∂xL Las ecuaciones (1.4) del campo gravitatorio se transcriben en términos de A como: AI I (x, t) = A1 1 + A2 2 + A3 3 = 4 π G ρ(x, t), AIJ = AJI , (1.17) que muestran una relación local entre el campo de marea y la densidad de fuentes del campo. • 1.5. Demostrar que el campo de marea en el exterior de una masa M de densidad 3xI xK GM , (r > R). En uniforme, simetrı́a esférica y en reposo, es AIK (x, t) = r3 δIK − r2 ejercicio I. Descripción newtoniana del campo gravitatorio . . . 2005-06 6 particular, en el punto x = (0, 0, r) sobre el eje z y a distancia r del origen, la matriz AI J es diagonal, con componentes no nulas AX X = AY Y = GM , r3 AZ Z = −2 GM , r3 (1.18) que naturalmente concuerdan con las fórmulas (1.11)–(1.12) del ejercicio al comienzo de éste apartado, cuando se aplican a separaciones inicialmente horizontales (X, Y ) o verticales (Z). Las expresiones (1.18) son aplicables al exterior, donde la densidad de masa es nula, ρ = 0; es evidente que la ecuación de campo (1.17) AX X + AY Y + AZ Z = 0(= 4πGρ) se satisface. • ejercicio 1.6. Demostrar que el campo de marea existente en el interior de una masa esférica de radio R, masa M , densidad uniforme ρ0 = 4 M y en reposo es: AIJ (x, t) = GM δ (r < R) R3 IJ 3 πR3 y como se debe, la suma de los tres elementos diagonales de AI J coincide con 4πGρ0 . Las fuerzas de marea. Podemos dar una imagen más vı́vida de los fenómenos implicados en el aspecto de marea del campo gravitatorio si consideramos una de las dos partı́culas como fiducial y referimos el movimiento de la segunda a un sistema de referencia (no inercial) que esté en caı́da libre con la primera partı́cula y sea no-rotante. Los detalles se irán precisando a lo largo del tema. Comencemos con dos ejemplos. En el caso de las mareas debidas a la gravitación de la Luna y del Sol en el océano terrestre, podemos considerar la Tierra en su movimiento de caı́da libre en el campo gravitatorio conjunto de la Luna y del Sol como movimiento fiducial, y referir el de un elemento de volumen del mar, como segunda partı́cula, a un sistema de referencia ligado al movimiento del centro de masa de la Tierra, que es quien realmente está en caı́da libre. En otro ejemplo, el de las dos partı́culas cayendo en el campo de la Tierra, al que las expresiones (1.11) y (1.12) se refieren, se tomarı́a por ejemplo una de las partı́culas como fiducial, y las ecuaciones (1.11) y (1.12) describen la aceleración experimentada por la segunda partı́cula relativamente a la fiducial. En tales situaciones, y de acuerdo con el modelo newtoniano, podemos considerar el movimiento de la segunda partı́cula de masa m relativamente a la primera, —que a su vez está dado por la ecuación (1.15)—, como el resultante de ciertas fuerzas de marea, en términos de las cuales las ecuaciones (1.15) se presentan en la forma newtoniana standard: d2 η I (t) = f I (x(t), t) (1.19) m dt2 con unas fuerzas de marea f I (x(t), t) dadas por: f I (x(t), t) = −m AI J (x(t), t) η J (t) (1.20) Ası́ pues, las fuerzas de marea se anulan para η J (t) = 0, y actuan efectivamente sólo cuando la partı́cula test se separa de la posición fiducial, siendo proporcionales a dicha separación, además de ser también proporcionales a la masa de la partı́cula. Por ejemplo, sobre un elemento de volumen del mar, que está separado del centro de la Tierra por una distancia R⊕ (que es pequeña en comparación con la distancia a que está la Luna I. Descripción newtoniana del campo gravitatorio . . . 2005-06 7 o el Sol, quuienes crean el campo de marea, aunque desde otros puntos de vista R⊕ pueda parecer grande), sı́ que se ejerce una fuerza de marea, mientras que en el centro de la Tierra no hay fuerzas de marea. Para la situación del ejercicio (1.11)/(1.12), y escogiendo las coordenadas en el sistema ligado a la partı́cula fiducial en caı́da libre de manera que las separaciones x, y sean horizontales y la z vertical, para una separación inicial horizontal, η J = (x, 0, 0), la fuerza de marea es 1 x x GM⊕ GM⊕ 1 0 = −m 3 0 , (1.21) f = −m 3 r r −2 0 0 fuerza que es atractiva, horizontal, colineal con la separación inicial, dirigida siempre hacia el origen (esto es, hacia la partı́cula fiducial) y proporcional a la separación horizontal x. Algo semejante ocurre para la separación a lo largo de cualquier otra dirección horizontal, digamos y. Para separación vertical en la dirección z, η J = (0, 0, z), la fuerza de marea resulta ser 0 1 0 GM⊕ GM⊕ f = −m 3 0 = 2m 3 (1.22) 1 0 , r r z −2 z que es repulsiva, vertical, colineal con la separación inicial y proporcional a ella. Si la posición relativa de la segunda partı́cula test es genérica, η J = (x, y, z), entonces la fuerza de marea es la dada por la expresión general, y en general ya no es colineal con la separación, de manera que no tiene sentido decir si es atractiva o repulsiva (el tensor de marea no es un múltiplo de la identidad). El campo de marea produce dos manifestaciones importantes, ambas discutidas originalmente por el propio Newton: • Las mareas. Si en vez de dos partı́culas cercanas ambas en caı́da libre en (1.11)–(1.12), consideramos una gota lı́quida, supuesta de forma inicialmente esférica, la gota se deforma bajo la acción de las fuerzas de marea hasta adoptar una forma de elipsoide de revolución; su “ecuador” horizontal (X, Y ) se encoge y su eje “vertical” Z se estira hasta que las fuerzas de marea quedan en equilibrio con las fuerzas que mantienen unida la gota. Para una gota pequeña de un lı́quido ordinario (agua) la fuerza que la mantiene unida es la tensión superficial, que la llevarı́a, de actuar sola, a la forma esférica que tiene superficie mı́nima para el volumen dado; para una gota pequeña las fuerzas de tensión superficial son abrumadoramente dominantes sobre las propias fuerzas de marea creadas por la Tierra en las cercanı́as de su superficie. de manera que no debemos esperar que la deformación de marea sea facilmente observable en la forma de una gota. Sin embargo, si imaginamos lı́quidos con tensión superficial cada vez menor, o añadimos un agente detergente que disminuya la tensión superficial, entonces en el lı́mite de tensión superficial nula, las fuerzas de marea deforman la esfera a un elipsoide, y la forma de este elipsoide (su deformación medida en términos relativos) es independiente de su tamaño, y resulta —en principio— una medida absoluta de la presencia de campo gravitatorio. En el ejemplo de las mareas, el mar debe imaginarse como una delgada pelı́cula lı́quida (espesor medio del orden de 1 Km) sobre un núcleo rocoso esférico que en primera I. Descripción newtoniana del campo gravitatorio ... 2005-06 8 aproximación supondremos rı́gido. En este caso la fuerza inicialmente responsable de la forma esférica del mar es la propia gravedad ordinaria de la Tierra (y no la tensión superficial, cuyo efecto sobre el Océano resulta despreciable). Las mareas se deben al efecto diferencial del campo gravitatorio de la Luna y del Sol, que presenta variaciones apreciables sobre distancias a la escala espacial de la Tierra. Una estimación sencilla del efecto y altura de las mareas causadas por la Luna sobre el mar terrestre se propone en el siguiente ejercicio: • ejercicio 1.7. Se trata de dar un modelo simple de la superficie del mar, supuesto una pelı́cula delgada que cubre la superficie de una Tierra esferica y sólida, bajo el efecto del campo de marea de la Luna. Dar la expresión de las fuerzas de marea que se ejercen sobre un elemento del mar 2 con la Luna en el eje z negativo) y comprobar (situado en posición (x, y, z) con x2 + y 2 + z 2 = R⊕ que estas fuerzas derivan de un potencial que deberá escribirse. La condición que determina la forma del mar es que su superficie debe ser una equipotencial del potencial conjunto “potencial de marea + potencial gravitatorio ordinario”. Encontrar la ecuación que da la altura de marea h en función del ángulo de latitud θ de la posición (x, y, z) relativa al eje polar Luna-Tierra. Dar el valor numérico del rango ∆h de la marea lunar (diferencia entre los valores máximo y mı́nimo de h). Finalmente comprobar que si la Tierra se asimilara a una gota fluida de densidad constante ρ, mantenida en esa forma por su propia gravedad, la deformación relativa ∆h/R⊕ resultarı́a independiente del tamaño, confirmando lo que se indicó antes: tal deformación relativa resulta una medida absoluta de la presencia de campo gravitatorio. • ejercicio 1.8. Alrededor de un planeta de masa Mp y radio Rp orbita, a distancia entre centros r y en órbita circular, un satélite, que supondremos una esfera sólida de roca de masa ms y radio Rs . Mostrar que si la distancia r es menor que el llamado lı́mite de Roche para ese satélite, rRoche = Rs 2Mp ms 1/3 entonces las fuerzas de marea pueden “limpiar” de rocas sueltas la superficie del satélite, esto es, levantar literalmente las rocas del suelo. Para orbitas más cercanas, las fuerzas de marea llegan enseguida a despedazar el satélite, al superar la propia resistencia de la roca a la rotura. Como un ejemplo, ¿cual es el lı́mite de Roche para Júpiter? Y a cuantas veces el lı́mite de Roche se encuentra la órbita de un satélite como Io? (conseguir datos sobre masa y radio de Io y sobre su orbita alrededor de Júpiter es fácil en Internet, p. ej: http://sse.jpl.nasa.gov/features/planets/jupiter/io.html. http://seds.lpl.arizona.edu/billa/tnp/io.html Datos de Io http://www.oarval.org/section3 2.htm Datos sobre el sistema solar http://hpiers.obspm.fr/eop-pc/models/constants.html Constantes) • Efecto sobre el movimiento de rotación. Sobre un cuerpo con tensor de inercia ILK , el campo de marea produce un torque (par) S M T I = IKL AKS (−ILS + 31 δL IM ), (1.23) Ası́ pues, para un cuerpo rotante, cualquier desviación de la simetrı́a esférica perfecta (esto es, cualquier tensor de inercia que no sea proporcional a la identidad) provoca una precesión en el eje de giro. Por ello puede decirse que el campo de marea es el responsable último de efectos astronómicos como la precesión de los equinoccios (la precesión del eje de giro de la Tierra, que no es una esfera perfecta), descubierto en la antiguedad y medido con gran precisión por Hiparco (cf. Ohanian, p. 49) I. Descripción newtoniana del campo gravitatorio . . . • 2005-06 9 1.9. La ley 1-2-3 de Kepler. La tercera ley de Kepler establece la relación entre el perı́odo T de la órbita circular de radio r en el campo gravitatorio producido por una masa central M con simetrı́a esférica. ¿Podrı́a recuperarse esta ley mediante análisis dimensional? Para p GM tiene dimensiones de inverso de tiempo; debe esperarse que ello nótese que la cantidad r3 tanto la frecuencia de rotación, ν = 1/T como la pulsación ω = 2πν = 2π/T sean proporcionales 1 a ella, con cierto coeficiente adimensional. El cálculo exacto indica que el coeficiente vale 2π para la frecuencia y 1 para la pulsación: ejercicio ν= 1 2π q GM r3 , ω= q GM r3 (curiosamente, los mismos coeficientes adimensionales que aparecen en el tı́pico problema de la frecuencia y la pulsación del péndulo simple). Es decir, excepto el coeficiente adimensional (que resulta valer exactamente 1), la relación GM = ω 2 r3 que contiene la tercera ley de Kepler (cuyo enunciado usual es T 2 = • 4π 2 3 r ) GM puede realmente obtenerse por análisis dimensional. 1.10. Imaginemos ahora una órbita circular rasante a un planeta esférico de masa M y radio R. Comparar el perı́odo de dicha órbita con el del movimiento armónico simple que ejecutarı́a un cuerpo en caı́da libre por un pozo diametral en el interior del planeta. ¿Coinciden ambos perı́odos? ejercicio El análisis dimensional de las ecuaciones (1.14)–(1.15) muestra que la dimensión del campo de marea es T −2 ; A se mide en s−2 . Las dimensiones del potencial y del vector campo gravitatorio son L2 T −2 y LT −2 respectivamente; notese la secuencia L2 T −2 , LT −2 , T −2 para los tres niveles potencial; intensidad de campo; campo de marea, que corresponde a que cada nivel es la derivada espacial del anterior. Conviene tener una idea numérica de la intensidad de los campos de marea presentes en el sistema solar: prescindiendo de los signos y factores 2 en (1.18), el orden de magnitud del campo de marea producido por una masa M a distancia r es GM/r3 ; este valor da las aceleraciones de marea entre dos partı́culas próximas, ambas en caı́da libre, por unidad de separación. Substituyendo los valores de las masas y distancias involucradas, se obtienen las siguientes estimaciones de orden de magnitud: GM⊕ ' 1.541 · 10−6 s−2 . 3 R⊕ de la Tierra: GM ' 3.97 · 10−14 s−2 . 3 R ⊕ luna Tierra: GM ' 8.6 · 10−14 s−2 . 3 R⊕ luna Campo de marea debido a la Tierra, sobre su superficie: Campo de marea debido al Sol, en la órbita Campo de marea debido a la Luna, sobre la • ejercicio 1.11. Los valores numéricos de los campos de marea del Sol sobre la Tierra, o de la propia Tierra en su superficie pueden entenderse mejor a la luz del resultado del ejercicio anterior; en particular el valor del campo de marea debido al Sol, sobre la órbita de la Tierra, escrito en las unidades temporales “adaptadas” (el perı́odo de la órbita), vale exactamente 4π 2 año−2 . Calcular el tiempo que juega el papel del “año” para el campo de marea debido a la Tierra, sobre su superficie, y comprobar que efectivamente se obtienen los 84 minutos del perı́odo de un satélite artificial en órbita rasante a la Tierra. Estos dos casos son fáciles; si se hace lo mismo con el campo de marea creado por la Luna sobre la Tierra, los resultados no parecen concordar. ¿Qué ocurre? De los valores numéricos mencionados es claro que todos estos campos de marea producen, sobre partı́culas separadas entre sı́ distancias del orden digamos de 1 m unas aceleraciones ‘de marea’ extraordinariamente pequeñas cuando se comparan con las I. Descripción newtoniana del campo gravitatorio . . . 2005-06 10 aceleraciones gravitatorias ordinarias (las asociadas al peso) a las que estamos acostumbrados. En un experimento con dos partı́culas inicialmente en reposo y con separación de 1m en una nave espacial en caı́da libre, como la Estación Espacial Internacional (ISS) la aceleración de marea causada por la Tierra es del orden de 10−6 m s−2 , que es unos siete órdenes de magnitud inferior a la aceleración gravitatoria que la tierra produce sobre un cuerpo en las cercanı́as de su superficie (orden de magnitud 10 m s−2 ). Y este ejemplo se refiere al campo de marea creado por la propia Tierra en las cercanı́as de su superficie, que comparativamente es bastante grande, unos 7 u 8 órdenes de magnitud mayor que el debido al Sol o a la Luna. Esto significa que a efectos prácticos, para separaciones en la escala de 1m las aceleraciones de marea del Sol o de la Luna son despreciables. Es interesante entender que el propio fenómeno de las mareas, causado por un campo tan extraordinariamente débil (orden de magnitud de las componentes no nulas de A del orden de 10−14 s−2 ), resulta ser tan apreciable debido a que las separaciones en juego (entre un elemento de volumen del mar y el centro de la tierra) son del orden del radio de la Tierra; debido a ello las aceleraciones de la separación causadas por ejemplo por el campo de marea del Sol, sobre el mar terrestre, son del orden de GM R⊕ ' 2.53 · 10−7 m s−2 , que aunque parecen pequeñas son las responsables del imR3 ⊕ presionante fenómeno de la marea. Curiosamente, este orden de magnitud es semejante a los 10−6 m s−2 debidas al campo de marea de la propia Tierra para dos partı́culas separadas 1 m en la ISS. • ejercicio 1.12. Si uno se sienta a la orilla del mar, durante un perı́odo completo de la marea, se observa el nivel del agua ascender y luego descender, con un comportamiento que en primera aproximación es sinusoidal en el tiempo. En los momentos de pleamar y bajamar la aceleración de este movimiento es máxima. Estimar esta aceleración. Entender porqué esta aceleración no coincide con los 2.53·10−7 m s−2 recién calculados. ¿A qué se refiere exactamente esta aceleración? En geodesia, para los campos de marea se usa como unidad el Eötvös, 1E = 10−9 s−2 . A pesar de su pequeñez, el campo de marea terrestre (el creado por la propia Tierra sobre un objeto en caida libre cercano a la superficie, como por ejemplo sobre una gota lı́quida en la Estación espacial Internacional) es medible directamente mediante un gradiómetro. Los gradiómetros de la generación de 1970 (ver C.W. Misner, K.S. Thorne and J.A. Wheeler, Gravitation, Freeman 1971, pp. 400-403), permitı́an medidas de campos hasta 1E = 10−9 s−2 . Los gradiómetros de la siguiente generación, mucho más compactos y sensibles utilizan acelerómetros superconductores y la fina tecnologı́a de los SQIDs para la detección, y llegan por debajo de 10−2 E = 10−11 s−2 , y se espera mejorar su sensibilidad en al menos dos órdenes de magnitud, lo que corresponderı́a a la posibilidad de medir directamente el campo de marea debido a la Luna sobre la Tierra. Conviene recapitular sobre la introducción de las fuerzas de marea y el campo de marea. Las fuerzas de marea, al igual que las fuerzas gravitatorias ordinarias, son estrictamente proporcionales a la masa m de la partı́cula test; esto está incorporado en la propia definición del campo de marea A a partir de (1.20). Pero conviene reconocer las diferencias importantes que hay con el vector intensidad de campo gravitatorio, que es simplemente el cociente g = F /m, y hereda el caracter vectorial de la fuerza gravitatoria ordinaria F . Para el campo de marea lo que se considera no es la propia fuerza de marea f sino su gradiente, por lo que el campo de marea ya no es un vector, sino un tensor, que describe las variaciones espaciales del propio campo de fuerzas de I. Descripción newtoniana del campo gravitatorio . . . marea: AI J (x(t), t) := − 1 ∂f I (x(t), t) m ∂xJ 2005-06 11 (1.24) expresión que permite reescribir de manera alternativa las ecuaciones del campo gravitatorio: en efecto 1 ∂f I (x(t), t) 1 AI I = − =− ∇·f (1.25) I m ∂x m y la ecuación (1.15) puede escribirse como ∇ · f (x, t) = −4πG m ρ(x, t) (1.26) que es estrictamente equivalente a la ecuación usual del campo gravitatorio: ∇2 ϕ(x, t) = 4 π G ρ(x, t). En particular, un campo gravitatorio en el vacı́o se caracteriza por la anulación de la divergencia del campo de fuerzas de marea. Conviene tener presente esta visión del campo de marea en relación con las fuerzas de marea, en paralelo con la definición original de A, que mide la variación diferencial de la intensidad ordinaria del campo gravitatorio, esto es su ritmo o tasa de variación de un punto a otro cercano. Para acabar conviene decir que las fuerzas de marea reales que se dan en la naturaleza son más complicadas que las que estamos describiendo aquı́, y su descripción correcta es —creemos— la proporcionada por la teorı́a de Einstein de la gravitación. Sin embargo, en muchas situaciones, incluyendo la práctica totalidad de los fenómenos gravitatorios en nuestro sistema solar, la teorı́a newtoniana proporciona una descripción excelentemente aproximada; sólo en campos gravitatorios mucho más intensos o mucho más rápidamente variables con el tiempo, como los que presumiblemente se dan en situaciones astrofı́sicas, las diferencias entre la situación real y las predicciones newtonianas son importantes. Los campos de marea reales resultan depender tanto de la velocidad del punto de referencia fiducial como de la velocidad relativa de la segunda partı́cula test respecto al punto de referencia, análogamente a lo que ocurre en electromagnetismo, donde además de la componente electrica, que produce fuerzas independientes de la velocidad, hay fuerzas magnéticas, dependientes de la velocidad. La descripción del campo de marea relativista es complicada; baste ahora decir que en los lı́mites adecuados de campo débil y velocidades bajas, el campo de marea relativista conserva como únicas componentes no despreciablemente pequeñas los AI J dados antes. Descripción del Campo Gravitatorio en un Sistema de Referencia no Inercial. Parte de la simplicidad de las expresiones anteriores se debe al uso de un sistema de referencia inercial global, y, estrictamente hablando, esas ecuaciones tan simples no son aplicables más que en tales sistemas. Por ejemplo, la caı́da libre en la superficie de la Tierra, partiendo de una situación con velocidad inicial nula, no sigue exactamente la vertical, como hemos supuesto al hacer las estimaciones contenidas en (1.11)–(1.12), sino que se desvı́a de ella por la fuerza de Coriolis (aunque tal desviación sea una corrección que puede despreciarse en una primera aproximación, como hemos hecho implı́citamente en (1.11)–(1.12)). Sin embargo es fundamental tratar de liberar a la descripción anterior de la condición restrictiva de estar formulada en un sistema de I. Descripción newtoniana del campo gravitatorio . . . 2005-06 12 referencia inercial. Si somos capaces de ello, conseguiremos una descripción del campo gravitatorio válida para cualquier observador (cualquier sistema de referencia). Vamos a ver en este apartado cómo puede llevarse a cabo este programa, y cómo es preciso (si lo es) modificar o reentender las ecuaciones para que sean válidas en tal situación general. Mientras que la expresión de la fuerza gravitatoria (1.1) no depende de si las posiciones se refieren a un sistema inercial o a otro no inercial, la ecuación de Newton (1.2) requiere la incorporación de las llamadas fuerzas inerciales si deseamos obtener una descripción de la evolución real de la posición de una partı́cula en caı́da libre en un campo gravitatorio desde un SRnI. En otras palabras, los movimientos “ideales” inerciales en 2 = 0 si el sistema de ausencia de campo sólo están descritos por una ecuación d dtx(t) 2 I referencia es inercial y entonces las tres coordenadas X dependen del tiempo de manI era afı́n: xI (t) = xI(0) + v(0) t; los mismos movimientos, observados en un sistema de referencia no inercial están descritos por funciones no lineales del tiempo. Supongamos pues dos sistemas de referencia, uno inercial (I), y otro no inercial (i), referidos ambos a un juego de coordenadas espaciales cartesianas, que denotaremos respectivamente xI y xi . El paso (I) → (i) está descrito por una rotación Ri I (t) y una traslación ai (t) dependientes del tiempo de modo arbitrario; la relacion entre las coordenadas (xI , t) y (xi , t) es: xi = Ri I (t) xI + ai (t), (1.27) y la condición de que Ri I (t) sea constantemente una matriz ortogonal conduce (ecuaciones de Euler) a dRi I (t) = Ωi k (t) Rk I (t), (1.28) dt donde el tensor Ωjk (t) := δij Ωj k (t) obtenido bajando los ı́ndices (espaciales) de Ωi k (t) con la métrica espacial (que al suponer el 3-espacio euclideo y las coordenadas cartesianas adopta la forma usual δij ) es un tensor antisimétrico, dual al vector velocidad angular instantánea ω k (t): Ωij (t) = −Ωji (t), • ejercicio 1.13. Ωij (t) = ijk ω k (t), ω k (t) = 1 ijk 2 Ωij (t). (1.29) Derivar estas ecuaciones e interpretarlas. 2A) El Potencial gravitatorio. Supondremos que el potencial gravitatorio se comporta como un escalar: ϕ(xi , t) = ϕ(xi (xI , t), t) bajo el cambio a un sistema de referencia no inercial; es una hipótesis razonable habida cuenta de la interpretación del potencial como la energı́a potencial por unidad de masa almacenada en el campo gravitatorio. (Alternativamente, podrı́amos adoptar otra ley de transformación como hace Wheeler et al., de modo que el término de arrastre lineal se derive del nuevo potencial; se trata de una convención sin significado fı́sico directo). I. Descripción newtoniana del campo gravitatorio . . . 2005-06 13 2B) El Campo gravitatorio. Del hecho de que el movimiento en el sistema inercial satisfaga la ecuación (1.3) se concluye para las aceleraciones en el sistema no inercial: i i d2 ak d2 xk (t) i i k d(x (t) − a (t)) j k ki ∂ϕ k }(x (t)−a (t))+2Ω Ω −Ω = −δ + +{ Ω̇ . (1.30) i i j i dt2 ∂xi dt2 dt • 1.14. Derivar esta ecuación y estudiarla en detalle en varios casos particulares simples (por ejemplo, el sistema no inercial tiene sólo movimiento de traslación, o sólo de rotación uniforme). ¿Qué términos sobreviven en cada uno de estos casos? ejercicio En esta ecuación tan sólo el primer sumando del segundo miembro es la fuerza debida al campo gravitatorio “real”. Los demás son, en conjunto, las fuerzas inerciales, que engloban el término de arrastre (debido a la no uniformidad de la traslación ai (t)), el de no uniformidad de la rotación, el término centrı́fugo y el de Coriolis. • ejercicio 1.15. Traducir esta ecuación al lenguaje vectorial ordinario, usando el vector velocidad angular instantánea. Comprobar que efectivamente los términos que aparecen en el segundo miembro corresponden a las fuerzas de inercia, como se acaba de indicar. Al igual que el campo gravitatorio “real”, las fuerzas inerciales afectan por igual a todas las partı́culas test, independientemente de su masa. Pero mientras que para las fuerzas gravitatorias esta independencia es misteriosa, para las fuerzas de inercia no resulta nada sorprendente, ya que, tal cual las hemos introducido, estas fuerzas se ‘producen’ exclusivamente por un cambio del sistema de referencia, que afecta por igual a los movimientos de cualquier tipo de partı́culas test. El status de las fuerzas de inercia ha originado ciertas controversias, y a veces se encuentran referencias calificando a las fuerzas de inercia como ficticias. Es dı́ficil conjugar esta consideración con los efectos, extraordinariamente reales, que tales fuerzas pueden producir. Los volantes de la primeras máquinas de vapor que se rompı́an debido a una resistencia insuficiente a las fuerzas centrı́fugas que actuaban sobre ellos, o el visitante de un parque de atracciones que supera cabeza abajo un loop y abandona la atracción mareado no testifican precisamente sobre un caracter aparente de dichas fuerzas. Parece más razonable la actitud de quienes dicen que, de juzgarlas por sus efectos, son fuerzas bien reales. El punto importante es que cualquier formulación de la gravitación newtoniana que sea aplicable a sistemas de referencia arbitrarios necesariamente deberá contar, además de las fuerzas gravitatorias propiamente dichas, con las fuerzas inerciales (que por cierto, deberı́an llamarse fuerzas no inerciales ya que sólo aparecen en sistemas de referencia no inerciales). 2C) El Campo de marea. Al usar la ecuación (1.30) para estudiar la aceleración de la separación relativa entre una partı́cula fiducial test y otra partı́cula próxima, ambas en caı́da libre en el campo gravitatorio, obtenemos para la diferencia η i (t) = y i (t) − xi (t) la ecuación l d2 η k (t) k l k k j l k dη (t) ≈ −A (x(t), t) η (t) + { Ω̇ − Ω Ω } η (t) + 2Ω . l l j l l dt2 dt (1.31) I. Descripción newtoniana del campo gravitatorio . . . 2005-06 14 Una lectura rápida de esta ecuacion (1.31) sugiere que las fuerzas de marea tienen también términos “no inerciales de rotación” (rotación no uniforme, centrı́fugo y de Coriolis), pero un término que provenga de una traslación no uniforme está ausente. La escritura de esta ecuación en la forma l d2 η k (t) k l k dη (t) ≈ −A η (t) + B , l l dt2 dt (1.32) con Ak l (xi , t) = Ak l (xi , t) + {Ω̇k l − Ωk j Ωj l }, B k l (t) = 2Ωk l parece tener un aspecto sugerente: en esta ecuación A y B aparecerı́an respectivamente como campos de marea tipo “eléctrico” (lineal en la separación η l ) y “magnético” (lineal en la velocidad de l separación dη dt ). El mero hecho de que consideradas desde un sistema no inercial las fuerzas de marea adquieran una componente de tipo “magnético”, es decir, dependan de velocidades, puede tomarse como un indicio de que posiblemente las fuerzas de marea reales (no las de la teorı́a newtoniana) se comporten ası́; veremos que esto ocurre en la teorı́a de Einstein. Más adelante volveremos sobre estas ecuaciones y comprobaremos que la “buena” forma de escribirlas es: l d2 η k (t) k k j l k dη (t) − { Ω̇ − Ω Ω } η (t) − 2Ω ≈ −Ak l (x(t), t) η l (t). l j l l dt2 dt (1.33) en donde la únicas fuerzas de marea presentes son las Ak l (x(t), t) η l (t), y los restantes términos aparecen en el miembro de la izquierda, junto con la aceleración de la separación, aunque por ahora no es posible desvelar lo que significa que esa sea la “buena” manera. Las ecuaciones de campo en un sistema de referencia no inercial. Finalmente, la ecuación del campo gravitatorio en el SRnI resulta formalmente idéntica a (1.15), ya que la densidad de masa se comporta como un escalar bajo este cambio: Ai i (x, t) = 4 π G ρ(x, t), Aij = Aji . (1.34) Ası́ pues, la conexión entre las fuentes del campo (densidad de masa) y el campo gravitatorio descrito por en campo de marea Ai j tiene explı́citamente la misma forma en cualquier sistema de referencia, tanto inercial como no inercial. Veremos también más adelante que la forma (1.34) de la ecuación del campo gravitatorio es la precursora de las ecuaciones de Einstein, cuyo objetivo es la descripción del campo gravitatorio desde el punto de vista de un observador arbitrario, no necesariamente inercial y de acuerdo con la teorı́a de la relatividad. Por el contrario, las ecuaciones (1.30) y (1.33) parecen no tener la misma forma que sus contrapartidas (1.9) o (1.15) en un sistema de referencia no inercial. Como suele ocurrir en otras ocasiones, también aquı́ las apariencias engañan: ambas ecuaciones pueden escribirse de una manera que explicitamente tiene la misma forma en cualquier sistema de referencia, lo que revelará la estructura geométrica del espacio–tiempo newtoniano (una conexión) relevante para la descripción del campo gravitatorio. I. Descripción newtoniana del campo gravitatorio . . . 2005-06 15 Descripción del Campo Gravitatorio en un Sistema de Referencia en caı́da libre y no rotante. Las ecuaciones del apartado anterior se han escrito para el sistema no inercial más general. Estas ecuaciones adoptan una forma mucho más simple y clara para un tipo muy particular de sistemas de referencia no inerciales. La idea es ligar a cada partı́cula en caı́da libre un sistema de referencia no inercial muy particular, determinado por las dos condiciones siguientes: el origen de coordenadas es la propia partı́cula y el sistema es no rotante relativamente a un sistema inercial. Este tipo de sistemas de referencia resultarán esenciales en la teorı́a relativista de la gravitación, y conviene haberles manejado desde los inicios en la teorı́a newtoniana; genéricamente se denominan sistemas de referencia en caı́da libre y no rotantes, SRclnr; se entiende que en caı́da libre se refiere a la partı́cula escogida. El sistema de coordenadas ligado al paradigmático ascensor que cae es de este tipo. Supongamos una partı́cula en caı́da libre que en un sistema inercial está descrita por t → xI (t) que debe satisfacer la ecuación (1.9). Veamos como se relacionan entre sı́ el SRclnr (no rotante y en caida libre con la partı́cula) y el sistema inercial. En el SRclnr denotaremos las coordenadas espaciales mediante un ı́ndice minúsculo con circunflejo, ı̂. La transformación entre las coordenadas inerciales xI y las coordenadas no inerciales en el SRclnr xı̂ debe ser del tipo (1.18): xı̂ = Rı̂ I (t) xI + aı̂ (t), Ahora la condición de ser no rotante relativamente a un sistema de referencia inercial implica que la rotación Rı̂ I (t) es independiente del tiempo; sin más que reorientar en el instante inicial los ejes de uno de los dos sistemas X I o xı̂ podemos suponer que la rotación Rı̂ I es la identidad, Rı̂ I = δ ı̂ I . Esto deja la ley de transformación como: xı̂ = δ ı̂ I xI + aı̂ (t), Ahora debemos imponer la segunda condición: a lo largo de toda su evolución, la partı́cula se mantiene en el origen del sistema (ı̂). De manera que la evolución de la partı́cula, vista desde el sistema SRclnr debe ser xı̂ (t) = 0. Esto implica que la componente de traslación aı̂ (t) del sistema en caı́da libre debe estar dada por aı̂ (t) = −δ ı̂ I xI (t). Todo ello nos lleva a la forma final de la relación: xı̂ = δ ı̂ I (xI − xI (t)) (1.35) entre las coordenadas xI e xı̂ de sucesos genéricos (recordemos que aquı́ xI (t) es el movimiento de la partı́cula fiducial descrito en el sistema inercial inicial, movimiento que se supone es un dato conocido). Para este caso, la velocidad angular de rotación del sistema de referencia no inercial (t, xı̂ ) es idénticamente nula, y por tanto las ecuaciones (1.30) y (1.31) se simplifican. La ecuación de movimiento queda: d2 ak̂ d2 xk̂ (t) k̂ı̂ ∂ϕ = −δ + . dt2 ∂xı̂ dt2 (1.36) II. Gravitación Newtoniana como curvatura . . . 2005-06 16 Esta ecuación proporciona la aceleración de cualquier movimiento causado por el campo gravitatorio desde el punto de vista del SRclnr; es por tanto la ecuación de movimiento para la caı́da libre en el sistema de referencia que consideramos. Es claro que sobre la trayectoria completa de la partı́cula fiducial, la fuerza gravitatoria real se cancela exactamente con la aparente o inercial de arrastre, de manera que xk̂ (t) = 0 (k̂ = 1, 2, 3) es una solución de la ecuación (1.36). Pero nótese bien que sobre otra partı́cula cercana que también esté en caı́da libre la cancelación ya no se da exactamente; en otras palabras, k̂ k̂ xk̂ (t) = y(0) donde los valores y(0) son constantes no todas nulas ya no es solución. Para ver esto con claridad lo mejor es formular la ecuación (1.36) en términos del campo de marea. Sean y ı̂ (t) las coordenadas de otra partı́cula en caı́da libre cercana a la partı́cula fiducial xk̂ (t) = 0 en el sistema de referencia SRclnr; la separación de esta segunda partı́cula con la fiducial, situada permanentemente en el origen es η ı̂ (t) = y ı̂ (t), y la ecuación que da la aceleración de la separación relativa es: d2 η k̂ (t) ≈ −Ak̂ l̂ (x(t), t) η l̂ (t). 2 dt (1.37) En esta forma, es evidente que η k̂ (t) = 0 es solución, mientras que si el campo de marea es no nulo (es decir, si realmente hay campo gravitatorio), entonces las partı́culas k̂ 6= cercanas no van a permanecer en reposo relativo, o lo que es lo mismo, η k̂(t) = y(0) (0, 0, 0) no es solución. El resumen de esta discusión es que en un sistema de referencia en caı́da libre y no rotante, el movimiento de caı́da libre de una partı́cula en el campo gravitatorio es lo más parecido posible al movimiento ideal en ausencia de gravitación en un sistema de referencia inercial en el que la aceleración se anula; pero nunca resulta exactamente igual ya que las aceleraciones previstas por la ecuación (1.37) sólo se anulan en el origen del sistema de coordenadas. Conviene tambien registrar ahora otro hecho notable: la ecuación (1.37) que describe la aceleración de la separación entre partı́culas próximas, ambas en caı́da libre en un SRclnr tiene exactamente la misma forma que en un sistema de referencia globalmente inercial. II. Gravitación Newtoniana como curvatura . . . 2005-06 17 LA INTERPRETACION DE LA GRAVITACION NEWTONIANA COMO CURVATURA DEL ESPACIO–TIEMPO Gravitación como curvatura (I). La idea de entender la gravitación como curvatura del espacio–tiempo tiene sus raı́ces en la teorı́a newtoniana, aunque dichas raı́ces permanecieran ocultas hasta después de que Einstein desvelara una idea semejante en su teorı́a relativista de la gravitación. En este Capı́tulo vamos a presentar una exposición en la que se mezclan de manera intencionada discusiones históricas sobre el status de las fuerzas de inercia, —que originalmente reflejaban el desagrado con que los cientı́ficos del continente veı́an el espacio absoluto—, con la formulación que hoy, casi tres siglos después, podemos hacer de aquellas discusiones. El resultado final de esta presentación es que la gravitación newtoniana puede entenderse como una fuerza cuya sede es el espacio absoluto, pero que también, y alternativamente, puede entenderse como una manifestación de la curvatura del espacio tiempo. Se trata de dos interpretaciones; ninguna de ellas es más ni menos correcta que la otra, y ambas resultan fı́sicamente equivalentes en sus predicciones. Las razones para preferir una u otra son, en todo caso, externas: podemos inclinarnos por la segunda interpretación basándonos en que permite llegar con extrema naturalidad a la teorı́a (relativista) de la gravitación de Einstein o también por las razones, de ı́ndole empirista/positivista que subyacı́an en las crı́ticas de Leibniz, Berkeley y Mach a la idea del espacio absoluto, idea de la que esta interpretación prescinde (bueno, solo en cierto modo :-) ). Históricamente, el reconocimiento de que era posible entender la gravitación como una consecuencia de la curvatura del espacio-tiempo se produjo por vez primera en la teorı́a propuesta por Einstein, que es fı́sicamente diferente de la de Newton a la que incluye como lı́mite en situaciones muy particulares (campo débil y movimiento lento). Este orden histórico de los descubrimientos, muy apartado del orden conceptual subyacente en las ideas básicas, ha tenido como consecuencia desafortunada el que por mucho tiempo la interpretación de la gravitación como curvatura se ha presentado como una consecuencia de que el marco espacio-temporal correcto para la descripción de la naturaleza sea la relatividad especial de Einstein (Lorentz, Poincaré). Aún hoy es todavı́a frecuente encontrar afirmaciones tajantes de que en la teorı́a Newtoniana el espacio-tiempo es rı́gido, llano, pasivo ante la materia que contiene, actuando sobre ella pero sin dejarse influir, mientras que en la teorı́a de Einstein, el espacio-tiempo pierde su caracter rı́gido, absoluto, y adquiere un cierto caracter flexible que se curva por la presencia de materia y energı́a. Un objetivo de este Capı́tulo es proporcionar el necesario contrapunto a estas afirmaciones en exceso dogmáticas y algo cortas de miras: con la interpretación oportuna dichas afirmaciones, que son correctas para la teorı́a de Einstein, pero también resultan serlo esencialmente también para la teorı́a de Newton. En descargo de los autores voluntarios o involuntarios de malentendidos de este tipo hay que decir que a la dificultad de formalizar de una manera satisfactoria algunas de las ideas fı́sicas implicadas en una teorı́a no relativista de la gravitación —en concreto, las II. Gravitación Newtoniana como curvatura . . . 2005-06 18 fuerzas de inercia— se unió la circunstancia histórica accidental de que la interpretación de la gravitación como curvatura surgió por primera vez en el transcurso de la elaboración de una teorı́a relativista de la gravitación por parte de Einstein entre 1908 y 1915; ası́ las cosas, la simplificación excesiva de atribuir a la nueva teorı́a de la relatividad especial —que proporciona el marco espacio-temporal correcto— la razón última de la interpretación de la gravitación como curvatura era una tentación muy fuerte. Aunque no entraremos en los interesantı́simos detalles, conviene indicar que en muchos aspectos la relación entre las teorı́as gravitatorias de Newton y de Einstein es también muy semejante a la relación que hay entre la pura electrostática y la teorı́a electromagnética completa de Maxwell. Comenzaremos viendo qué conceptos se deben introducir para formular de manera matemáticamente adecuada las ideas del espacio absoluto de Newton y de su crı́tica por Leibniz. Una vez hecho esto, apreciaremos que, como suele ocurrir con las polémicas entre grandes, ambos tenı́an razón. Sistemas Inerciales y no Inerciales. ¿Quién es quién? La interpretación usual de la teorı́a de Newton supone la existencia de unos “movimientos ideales”, o inerciales, que son los que seguirı́an los cuerpos en ausencia de cualquier tipo de fuerzas ‘genuinas’ sobre ellos, y a continuación refiere los movimientos reales en presencia de gravitación a esos movimientos “ideales” mediante las ecuaciones de Newton. Si la Luna siguiera dicho movimiento “ideal” se alejarı́a de la Tierra según la tangente instantanea a su órbita. Pero de hecho la la Luna, en su movimiento real “circular” alrededor de la Tierra está constantemente cayendo hacia ella con una cierta aceleración con respecto al movimiento “ideal” instantáneo que serı́a rectilı́neo y uniforme, según la tangente al cı́rculo. Por tanto la idea básica podrı́a formularse ası́: si no hubiera fuerzas, ni gravitatorias ni de ningún otro tipo, el movimiento de un cuerpo cualquiera serı́a un movimiento “ideal” inercial, rectı́lineo y uniforme. Cuando hay fuerzas, sean éstas gravitatorias o de cualquier otro origen (electromagnéticas, de rozamiento, elásticas, etc.), el movimiento se desvı́a del “ideal” inercial, y esta desviación se entiende como causada por la fuerza externa F vı́a la usual ecuación de Newton: la aceleración del movimiento de una partı́cula de masa m, relativamente a los movimientos ideales inerciales es F /m. Todo esto estarı́a muy bien si hubiera un criterio independiente que permitiera distinguir sin ambigüedad los movimientos ideales inerciales. Pero parece imposible dar tal criterio al margen del conjunto de las leyes de la dinámica newtoniana. Precisa y exactamente, esta era la objeción central en la que basaban los cientı́ficos continentales su oposición a la idea del espacio absoluto —alguno de cuyos ecos se recogen en la parte que atañe al espacio y al tiempo en la polémica Leibniz–Clarke, en la que realmente Clarke actuaba como portavoz de las ideas de Newton—. Newton pretendió zanjar la cuestión de una manera expeditiva, —y que hoy, con las herramientas matemáticas disponibles podemos reconocer como una de las posibilidades correctas— mediante la introducción del espacio absoluto. Se trata, en el fondo, de un fantasma cuya única función es distinguir entre los movimientos inerciales ideales y los demás. Cuando antes se ha dicho que si no hubiera fuerzas externas, gravitatorias o de otro tipo, el movimiento de un cuerpo cualquiera serı́a un movimiento “ideal” inercial, II. Gravitación Newtoniana como curvatura . . . 2005-06 19 rectilineo y uniforme, sibilinamente se ha omitido la pregunta: rectilı́neo y uniforme, ¿con respecto a qué? La única función del espacio absoluto es la de dar una respuesta de emergencia a esa pregunta: rectilı́neo y uniforme, con respecto al espacio absoluto. Aceptar el espacio absoluto permite distinguir entre aquellos sistemas de referencia que estén en reposo o movimiento rectilı́neo uniforme con respecto al espacio absoluto (que son precisamente los llamados sistemas inerciales, SRI) de los demás sistemas de referencia (llamados sistemas no inerciales, SRnI) cuyo movimiento relativamente al espacio absoluto es de cualquier otro tipo (incluyendo una traslación que no sea rectilı́nea y uniforme, sino acelerada, o una rotación de cualquier tipo, aunque sea uniforme, o bien ambas simultáneamente). Y obviamente, la idea de movimiento rectilı́neo y uniforme, con respecto al espacio absoluto se traduce de inmediato en movimiento rectilı́neo y uniforme, con respecto a cualquier sistema de referencia inercial. Esta es la caracterización habitual de la ley de inercia; no hace falta ser muy inquisitivo para sentir cierta circularidad, ya que se describen los SRI como aquellos en los que la ley de inercia se satisface, y la ley de inercia como caracterizando el movimiento en ausencia de fuerzas en un SRI. Un aspecto de la crı́tica de Leibniz podrı́a centrarse en la siguiente pregunta: si la geometrı́a del 3-espacio es euclı́dea, tanto vista en el 3-espacio de un SRI como en el de un SRnI, ¿como podemos zanjar la discusión sobre si un sistema de referencia rı́gido se mueve o no con respecto al espacio absoluto? Newton dió una respuesta satisfactoria a otra pregunta algo más especı́fica: según él, el movimiento de rotación con respecto al espacio absoluto sı́ que es distinguible: basta observar la aparición de fuerzas centrı́fugas. Ası́, la superficie del agua en un caldero que esté en reposo con respecto al espacio absoluto es plana, pero deja de serlo, para adoptar una forma de paraboloide en cuanto el caldero rota con respecto al espacio absoluto [Un experimento está al alcance de cualquiera con un cuenco con agua en el plato de un tocadiscos de discos de vinilo; haced el experimento antes de que estos desaparezcan]. Como esta diferencia es observable, la idea de rotación absoluta (rotación con respecto al espacio absoluto) tiene según Newton, un status fı́sico aceptable. Pero el movimiento rı́gido más general, aparte de su eventual rotación con respecto al espacio absoluto, tiene también una componente de traslación, posiblemente acelerada; en lo que respecta a este movimiento no parece existir ningún procedimiento para determinar la aceleración absoluta (aceleración con respecto al espacio absoluto). Esta imposibilidad, entendida como la afirmación de una propiedad de la Naturaleza, es el contenido esencial del principio de equivalencia: un campo gravitatorio uniforme produce los mismos efectos que un movimiento acelerado del sistema de referencia. La aceptación histórica de la Teorı́a Newtoniana de la Gravitación (T.N.G.) fue relativamente lenta, y estuvo precedida por una fuerte reacción de desagrado inicial entre varios de los grandes cientı́ficos del siglo XVIII (Leibniz, Huygens) y con importantes crı́ticas posteriores por parte de los filósofos empiristas británicos (Berkeley, Hume). Sólo paulatinamente fueron quedando estos crı́ticos relegados, vencidos —que no convencidos— por los éxitos repetidos y abrumadores de la teorı́a de Newton. Con el tiempo, la mayor parte de los cientı́ficos adoptaron la actitud pragmática “si funciona, no lo arregles”, evitando entrar siquiera en la discusión sobre el status del espacio absoluto, que todos reconocı́an como una cuestión obscura. Las razones últimas de este desagrado eran dos: una es que los movimientos “ideales” II. Gravitación Newtoniana como curvatura . . . 2005-06 20 son estrictamente inobservables y por tanto no deberı́an aparecer en la formulación de las teorı́as; la otra es que la idea de acción a distancia con propagación instantánea resulta harto inquietante. La historia de la teorı́a de la gravitación está ligada a los intentos de eliminar estos dos molestos fantasmas. Pero una cosa es reconocer que se trata de fantasmas cuya eliminación es deseable —reconocimiento que estaba al alcance de los grandes de la época— y otra muy diferente es ser capaz de hacerlo; las matemáticas del siglo XVIII carecı́an de las herramientas necesarias, que con gran esfuerzo se fueron desarrollando durante el siglo XIX y principios del XX, precedidas por más de 2000 años de reflexión sobre la fundamentación de la geometrı́a. Siendo más consciente que muchos de sus continuadores de las debilidades del edificio que construyó, y posiblemente también entendiendo que las criticas de los cartesianos eran pertinentes, al parecer Newton fue también lúcido al reconocer que la única posibilidad de progreso abierta en su época era seguir el camino que él siguió: aceptar al espacio absoluto como un huesped indeseable pero que no podemos rechazar, esperando que el futuro se encargue de aclarar las cosas. La misma postura tomaron, abiertamente, muchos de los cientı́ficos posteriores (p. ej. Euler). Sistemas Inerciales, no inerciales y la ley de inercia. El papel del espacio absoluto es simplemente el de proporcionar un marco en el que los movimientos “ideales” inerciales aparezcan como movimientos rectilı́neos uniformes (a velocidad constante). Un movimiento real bajo la acción de fuerzas genuinas — sean éstas gravitatorias o no— se describe mediante su desviación con respecto a los movimientos “inerciales”, desviación que se mide por la aceleración; por ello en los sistemas de referencia inerciales (en estado de reposo o de movimiento uniforme con respecto al espacio absoluto) las aceleraciones que aparecen en la ley de Newton son exclusivamente las debidas a las fuerzas externas, mientras que nos vemos obligados a introducir unas fuerzas auxiliares o de inercia cuando se trata de describir el movimiento de un cuerpo en un sistema de referencia que esté en movimiento arbitrario con respecto al espacio absoluto. La forma convencional de distinguir entre sistemas de referencia inerciales y no inerciales es postular el principio de inercia: Principio de inercia, formulación convencional: Existen ciertos sistemas de referencia privilegiados o inerciales, con respecto a los cuales los movimientos “ideales” inerciales aparecen como teniendo aceleración nula: d2 xI (t) =0 dt2 (2.38) Podemos ahora plantear la siguiente pregunta: ¿cómo se verı́an los movimientos “ideales” inerciales desde el punto de vista de un sistema de referencia no inercial? Esta cuestión ya se discutió en la primera parte de estas notas: resulta que cuando la posición se describe en uno de tales sistemas (componentes cartesianas del vector posición denotadas xi ), ya no es cierto que los movimientos “ideales” inerciales aparezcan como teniendo aceleración nula; por el contrario, presentan aceleraciones que dependen del movimiento del sistema no inercial relativamente al espacio absoluto (o, lo que es lo II. Gravitación Newtoniana como curvatura . . . 2005-06 21 mismo, respecto a un sistema inercial), que desaparecen cuando el movimiento del SR respecto al espacio absoluto es una traslación rectilı́nea y uniforme, a velocidad constante, y sin rotación. Como vimos en el Capı́tulo I, la ecuación que describe los movimientos “ideales” inerciales en un sistema de referencia no inercial es: i i d2 ak d2 xk (t) k k j i i k d(x (t) − a (t)) = + { Ω̇ − Ω Ω }(x (t) − a (t)) + 2Ω . i j i i dt2 dt2 dt (2.39) en donde no aparece la masa de la partı́cula test; el carácter no inercial del sistema de referencia está descrito por las funciones del tiempo ak (t), Ωk i (t) que corresponden respectivamente al movimiento de traslación y de rotación con respecto al espacio absoluto i (recordemos que dRdtI (t) = Ωi k (t) Rk I (t)). En presencia de la acción conjunta de fuerzas de naturaleza gravitatoria, electromagnética, elástica, de rozamiento, etc., englobadas en una única resultante F , que es un vector espacial cuyas componentes en el sistema de referencia más general no inercial arbitrario son F i (t, xl ), las correspondientes ecuaciones de movimiento serı́an: i i d2 ak k k j i i k d(x (t) − a (t)) + {Ω̇ i − Ω j Ω i }(x (t) − a (t)) + 2Ω i . dt2 dt (2.40) en donde en el segundo miembro, aparte de las fuerzas genuinas F , aparecen otros términos, encerrados en { } que podemos, si queremos, entender como las fuerzas inerciales; su única función es salvar formalmente la ecuación de Newton. Las fuerzas de inercia que actúan sobre una partı́cula de masa m en un sistema de referencia no inercial resultan estrictamente proporcionales a m. Como tales fuerzas no aparecen si el sistema de referencia es inercial, a veces se las califica como ficticias, ya que simplemente desaparecen o cambian cuando el movimiento se describe desde otro sistema de referencia, lo que no ocurre con la fuerza gravitatoria que está siempre presente, pero es manifiesto que sus efectos son tan reales como los de las fuerzas de origen gravitatorio, electromagnético, etc. Cuando interese distinguirlas de las fuerzas de otro origen que hemos llamado genuinas, llamaremos auxiliares a las fuerzas de inercia. El punto de vista newtoniano es comenza analizando las ecuaciones en ausencia de otras fuerzas (esto es, cuando sólo hay fuerzas inerciales auxiliares) y después referir el movimiento en presencia de fuerzas adicionales añadiendo las expresiones oportunas para F . d2 xk (t) = F k (t, xl )+m m dt2 La estructura geométrica del Espacio-Tiempo newtoniano y la ‘conexión inercial’. El espacio-tiempo newtoniano es una variedad de cuatro dimensiones, en la que un suceso está especificado por cuatro coordenadas, que colectivamente denotaremos xµ . Sistemáticamente emplearemos el convenio de asignar valores µ = 0, 1, 2, 3 a los ı́ndices griegos, e i = 1, 2, 3 a los ı́ndices latinos. Consideraremos sucesivamente la descripción que se harı́a de la situación desde un sistema de referencia globalmente inercial SRI en el que las coordenadas de un suceso son (t, xI ) con t el tiempo (newtoniano, absoluto) y xI las coordenadas cartesianas usuales, o desde un sistema de referencia no inercial, SRnI, en cuyo caso las coordenadas (t, xi ) corresponden al tiempo (newtoniano, absoluto) II. Gravitación Newtoniana como curvatura . . . 2005-06 22 y a las coordenadas cartesianas usuales relativas al SRnI. Para estos dos sistemas de coordenadas (t, xI ), (t, xi ), el ı́ndice 0 se reservará siempre para la coordenada t, x0 ≡ t, mientras que los ı́ndices latinos hacen referencia a las tres componentes ordinarias de la posición; los ı́ndices mayúsculos servirán para enfatizar o recordar que el sistema de referencia en uso tiene un caracter globalmente inercial. Naturalmente, el uso de estas coordenadas tan particulares no es obligatorio. Podemos perfectamente usar cualquier otro sistema de coordenadas, dado por cuatro funciones arbitrarias xµ (t, xI ) o xµ (t, xi ) (con las limitaciones usuales de que el jacobiano de la transformación sea diferente de cero). Pero en la práctica, la coordenada temporal privilegiada es el tiempo absoluto, y usar otra simplemente oscurece las expresiones. Como coordenadas espaciales, se puede y a veces conviene usar coordenadas no cartesianas, como las esféricas (r, θ, φ) en problemas con simetrı́a esférica. Obsérvense dos puntos importantes: 1) estamos asumiendo el tiempo absoluto de la fı́sica newtoniana, al escoger t como coordenada que se identifica con la duración temporal y que coincide en todos los SR, tanto inerciales como no inerciales; 2) de una manera un poco más solapada, estamos también asumiendo implı́citamente que el espacio es euclı́deo, al decir que escogemos coordenadas (cartesianas) xI , xi en las que la métrica está dada por el tensor δIJ , δij . El enunciado convencional de la ley de inercia, y la idea de que los sistemas de referencia inerciales son aquellos que se encuentran en movimiento rectilı́neo y uniforme con respecto al espacio absoluto se traduce de manera matemáticamente impecable mediante la siguiente idea: Principio de inercia, formulación de Cartan: En el espacio-tiempo hay una conexión, D dxµ denominada conexión inercial, cuyas autoparalelas Dτ dτ = 0 son exactamente los movimientos inerciales ideales. Las expresiones explı́citas de los coeficientes de la conexión como función de las coordenadas dependerán del sistema de referencia y de coordenadas que se use, y debemos esperar que sean más simples en ciertos sistemas de referencia y de coordenadas ’adaptados’. Pasemos a comprobar que efectivamente es posible encontrar una conexión cuyas autoparalelas son exactamente los movimientos inerciales ideales. Por motivos que quedarán claros enseguida, a ésta conexión no la denotaremos con el sı́mbolo tradicional Γ para las conexiones, sino como Λ. La idea básica es que en un sistema de referencia inercial, y en coordenadas cartesianas relativas al SRI, todos los coeficientes de la conexión ‘inercial’ Λ son nulos: Λ0 00 (t, xM ) = 0, Λ I M 00 (t, x Λ0 J0 (t, xM ) = Λ0 0J (t, xM ) = 0, ) = 0, Λ I M J0 (t, x )=Λ I M 0J (t, x Λ0 JK (t, xM ) = 0, ) = 0, Λ I M JK (t, x ) = 0, (2.41) (2.42) Veamos ahora que, en efecto, la ecuación de las autoparalelas de esta conexión, en el SRI coincide con la ecuación habitualmente usada para caracterizar el movimiento ‘ideal’ inercial (2.38). Las ecuaciones de las autoparalelas de la conexión Λµ αβ , en coordenadas arbitrarias y referidas al parámetro afı́n τ son: dxα dxβ d2 xµ µ + Λ = 0, αβ dτ 2 dτ dτ (2.43) II. Gravitación Newtoniana como curvatura ... 2005-06 23 que se reducen inmediatamente en las coordenadas (t, xM ) usando la elección de los coeficientes de conexión (2.41), (2.42) a cuatro ecuaciones: d2 xµ = 0. dτ 2 (2.44) d2 x0 =0 dτ 2 (2.45) La ecuación µ = 0 queda: cuya solución general x0 = cte τ + cte indica que salvo un cambio trivial de origen y de escala, el parámetro afı́n τ de las autoparalelas se identifica con la coordenada x0 ≡ t. Asumiendo la identificación entre el parámetro τ y tiempo absoluto t, las tres ecuaciones restantes quedan: d2 xI = 0. (2.46) dt2 que es exactamente lo que estipula la formulación convencional de la ley de inercia. Esto resulta decepcionantemente simple, y seguramente parece una construcción muy artificial la primera vez que uno se encuentra con ella. Pero es la manera en la que las matemáticas nos dicen que se debe entender el espacio absoluto. Cuando Newton decı́a: sistema de referencia en reposo o en movimiento uniforme con respecto al espacio absoluto, lo que estaba diciendo era: sistema de referencia en el que, en coordenadas cartesianas, todas las componentes de la conexión inercial se anulan. • 2.16. Si en un sistema original de referencia (t, xI ) la conexión Λ tiene nulos todos sus coeficientes, se pide usar la ley de transformación de una conexión para encontrar cómo son los coeficientes de Λ en el sistema de referencia cuya relación con el original es: ejercicio 0 xI = R I 0 0 0 I 0 xI + v I t + a I . 0 (2.47) 0 con RI I una rotación fija, independiente del tiempo, y v I , aI son constantes. Evidentemente, este cambio de coordenadas pasa de un sistema de referencia a otro que se mueve con respecto al primero con movimiento uniforme, por tanto el nuevo sistema también es inercial. El resultado 0 correcto es que en el nuevo sistema de coordenadas (t, xI ) todos los coeficientes de conexión son 0 nulos. [Ayuda: basta observar que las ecuaciones del cambio de coordenadas (t, xI ) → (t, xI ) son lineales.] Por lo tanto, tenemos una caracterización de los sistemas de referencia inerciales en términos de la conexión Λ: los sistemas de referencia inerciales son aquellos en los que, en coordenadas espaciales cartesianas, la ‘conexión inercial’ es nula. Pasemos ahora a un sistema de referencia general no inercial, y denotemos (xi ) las coordenadas cartesianas en él. El tiempo universal es el mismo en el nuevo sistema que en el antiguo, y las relaciones entre las “coordenadas inerciales I” y las “no inerciales i” son (1.27): xi = Ri I (t) xI + ai (t). (2.48) en donde la novedad con relación a (2.47) es que el movimiento de traslación tiene una dependencia arbitraria del tiempo (en vez del movimiento uniforme, a velocidad constante que corresponde a la forma particular ai (t) = v i t + ai ) y la rotación depende II. Gravitación Newtoniana como curvatura . . . 2005-06 24 también del tiempo; ya no es una simple reorientación de los ejes de coordenadas como en (2.47). • 2.17. Si en un sistema original de referencia (t, xI ) la conexión Λ tiene nulos todos sus coeficientes, se pide usar la ley de transformación de una conexión para encontrar cómo son los coeficientes de Λ en el nuevo sistema de referencia no inercial cuya relación con el original es: ejercicio xi = Ri I (t) xI + ai (t). con Ri I (t) una rotación dependiente del tiempo de manera arbitraria, y ai (t) un vector, dependiente del tiempo también de manera arbitraria. Este cambio de coordenadas pasa de un sistema de referencia a otro que se mueve aceleradamente y rota con respecto al primero. Comprobar que en el nuevo sistema de coordenadas (t, xi ) algunos coeficientes de conexión son no nulos, y encontrar sus expresiones explı́citas. [Ayuda: como en el sistema original la conexión es nula basta considerar la parte inhomogénea de la ley de transformación]. El resultado del ejercicio precedente es que en el nuevo sistema de referencia no inercial, la conexión es: Λ0 00 = 0, Λi 00 Λ0 0j = Λ0 j0 = 0, Λ0 jk = 0 (2.49) 2 i l d a (t) i da (t) = −{Ω̇i l − Ωi j Ωj l }xl − − 2Ω − {Ω̇i l − Ωi j Ωj l }al (t) , l dt2 dt (2.50) Λi 0j = Λi j0 = −Ωi j (t), (2.51) Λi jk = 0. (2.52) Nótese que los coeficientes de conexión no nulos dependen de (t, xi ) de una manera muy especial: la dependencia en las coordenadas espaciales aparece solo en el coeficiente Λi 00 y es lineal; el resto de la dependencia es sólo del tiempo, a través de Ωi j (t) en Λi 0j = Λi j0 y de las dos expresiones (que dependen de Ωi j (t) y de ai (t)) que aparecen entre llaves y entre corchetes en Λi 00 (2.50). • ejercicio 2.18. Comprobar que las ecuaciones de las autoparalelas en un sistema de referencia no inercial incluyen la relación τ = t y la ecuación (2.39). [Ayuda: desglosar la ecuación de las autoparalelas en la forma d2 x0 dx0 dx0 dx0 dxj dxj dxk 0 0 0 + Λ + 2Λ + Λ = 0, 00 0j jk dτ 2 dτ dτ dτ dτ dτ dτ d2 xi dx0 dx0 dx0 dxj dxj dxk i i i + Λ + 2Λ + Λ = 0, i = 1, 2, 3. 00 0j jk dτ 2 dτ dτ dτ dτ dτ dτ (2.53) (2.54) y ver que de la primera ecuación se deriva τ = t salvo cambio de origen y escala, y entonces la segunda coincide exactamente con (2.39)] Ahora comienza a emerger lo interesante de este enfoque, que revela la auténtica naturaleza de las fuerzas de inercia: estas fuerzas están descritas por una conexión en el espacio-tiempo. Las ecuaciones de las autoparalelas para la conexión (2.41)–(2.42), o lo que es lo mismo, (2.49)–(2.52) contienen a la vez la identificación del parámetro afı́n τ con el tiempo absoluto y las ecuaciones de los movimientos “ideales inerciales” de la teorı́a newtoniana. Por lo tanto es posible interpretar la ley de inercia en términos de II. Gravitación Newtoniana como curvatura . . . 2005-06 25 una conexión. Esta forma de hablar es un eufemismo; realmente, no es que sea posible, es que debe hacerse ası́; lo reconoció con claridad por primera vez Cartan, aunque estaba implı́cito en la teorı́a de Einstein. Y con esta idea el espacio absoluto se reviste de un ropaje matemático bien definido: traduce la existencia de una ‘conexión inercial’ en el espacio-tiempo. El tensor de curvatura de esta conexión se obtiene sin nigún cálculo: ya que en ciertos sistemas de coordenadas la conexión Λ es nula, el tensor de curvatura de Λ se anula idénticamente. Desde éste punto de vista, que es el Newtoniano estricto, está justificado decir que el espacio-tiempo no tiene curvatura, y por tanto es rı́gido, insensible a la presencia de materia, etc. Aunque el enunciado de la teorı́a newtoniana en estos términos se debe a Cartan (1923), es seguro que este enunciado no hace sino traducir a un lenguaje matemático preciso lo que tenı́an implı́citamente en mente aquellos que entendı́an de verdad de qué hablaban cuando hablaban del espacio absoluto, aunque lo expresaran de una manera matemáticamente tosca. La base empı́rica de la ley de inercia y su sustitución por el principio de Galileo. Una cosa es haber encontrado una manera matemáticamente satisfactoria de enunciar la ley de inercia newtoniana, y otra muy diferente la evidencia experimental, basada en resultados empı́ricos, que pueda encontrarse para apoyar dicha interpretación matemática. Cuando este aspecto se toma en consideración, lo que la naturaleza nos sugiere es que toda la construcción anterior es matemáticamente consistente pero fı́sicamente insatisfactoria, lo que finalmente reivindica el rechazo a la idea del espacio absoluto que avanzaron Leibniz y otros. Pero, como suele ocurrir, veremos que las nuevas ideas que toman el relevo están implı́citamente sugeridas por el intento insatisfactorio que acabamos de describir. La pregunta esencial es: ¿son observables los movimientos “ideales inerciales”? ¿Quién serı́a el mejor candidato a partı́cula test en movimiento “ideal inercial”? Las fuerzas de origen electromagnético pueden eliminarse si tomamos una partı́cula sin carga eléctrica y sin momentos multipolares eléctricos ni magnéticos. Las fuerzas de rozamiento con el aire pueden eliminarse haciendo el vacı́o; las de rozamiento ordinario evitando el contacto. Otras fuerzas pueden descartarse mediante una preparación adecuada. Pero producir un movimiento “ideal inercial”, que exige la ausencia total de fuerzas, requerirı́a desconectar las fuerzas gravitatorias, de lo que no hay manera; a diferencia de las fuerzas electromagnéticas sobre un sistema test que se ‘desenchufan’ sin más que eliminar la carga eléctrica —y los momentos dipolares, cuadrupolares, etc.— del sistema test, la masa gravitatoria tiene siempre el mismo signo, lo que hace que literalmente hablando no podamos desconectar la gravitación. Para verlo más formalmente, la fuerza gravitatoria que se ejerce sobre una partı́cula con masa gravitatoria pasiva mgr es mgr g, donde g es la familiar intensidad de campo gravitatorio. En consecuencia, en el sistema de referencia no inercial más general, la ecuación de movimiento de la partı́cula es: 2 k i i d a d2 xk (t) k l k k j i i k d(x (t) − a (t)) = mgr g (t, x (t))+m + {Ω̇ i − Ω j Ω i }(x (t) − a (t)) + 2Ω i . m dt2 dt2 dt (2.55) II. Gravitación Newtoniana como curvatura . . . 2005-06 26 en donde dividiendo por la masa inercial m de la partı́cula test se obtiene: 2 k i i mgr k d a d2 xk (t) i i k d(x (t) − a (t)) j k k l = + {Ω̇ i − Ω j Ω i }(x (t) − a (t)) + 2Ω i g (t, x (t))+ . dt2 m dt2 dt (2.56) Si midiendo las posiciones, velocidades y aceleraciones de un número suficiente de partı́culas en caı́da libre en el campo gravitatorio relativamente a éste sistema de referencia fuera posible encontrar separadamente el vector intensidad de campo gravitatorio g k (t, xl ) en cada punto del espacio-tiempo y las dos cantidades ak (t), Ωk j (t) como funciones solamente del tiempo, entonces la forma usual de la ley de inercia tendrı́a una base empı́rica clara. Este serı́a el caso si existieran partı́culas con diferentes cocientes (mgr /m) —que podrı́a llamarse masa gravitatoria especı́fica—. Midiendo posiciones, velocidades y aceleraciones de varias partı́culas con cocientes (mgr /m) diferentes, se podrı́a descontar sin ambiguedad el término en g k (t, xl ), y del resto se podrı́a recuperar sin tampoco ambiguedad las dos cantidades ak (t), Ωk j (t). Pero no parece que esa sea la situación experimental. Por el contrario, toda la evidencia experimental apoya muy fuertemente la suposición de que en la naturaleza el cociente (mgr /m) es el mismo para todas las partı́culas, independientemente de su naturaleza, composición quı́mica, etc. (En la primera parte revisamos la impresionante precisión con que esta idea se ha comprobado experimentalmente). En estas circunstancias, la esperanza de usar la ecuación (2.56) para dotar de contenido empı́rico a la ley de inercia se desvanece: si el cociente (mgrav /m) es una constante universal, que podemos hacer igual a 1 escogiendo adecuadamente las unidades de medida de mgr por ejemplo, entonces es fácil ver que la ecuación 2 k i i d a d2 xk (t) k l k k j i i k d(x (t) − a (t)) = g (t, x (t))+ + {Ω̇ i − Ω j Ω i }(x (t) − a (t)) + 2Ω i . dt2 dt2 dt (2.57) en la que todas las masas han desaparecido, permite medir Ωk j (t) —como correcta 2 k y astutamente vió Newton—, y también la combinación g k (t, xl (t)) + ddta2 , pero no g k (t, xl (t)) y ak (t) separadamente. Se conoce como principio de equivalencia débil o principio de Galileo la hipótesis de que en la naturaleza el cociente (mgr /m) es el mismo para todas las partı́culas, independientemente de su naturaleza, composición quı́mica, etc. Se suele enunciar tal principio a través de su consecuencia: Principio de equivalencia débil: Las órbitas de partı́culas test neutras, en caı́da libre en un campo gravitatorio dado son independientes de la masa y composición de las partı́culas test, y están determinadas unicamente por su posición y velocidad inicial. Esta es la idea en la que Einstein basó su teorı́a relativista de la gravitación. Nadie habı́a reparado antes en formular explı́citamente este principio dentro de una teorı́a clásica de la gravitación, pero es manifiesto que el rango de validez incluye el dominio no-relativista. Si se acepta el principio de equivalencia débil (o de Galileo) resultan dos consecuencias. Primero, lo que antes era una misteriosa semejanza entre las fuerzas gravitatorias II. Gravitación Newtoniana como curvatura . . . 2005-06 27 y las de inercia, un hecho para el que no hay razón fı́sica aparente —a saber— la proporcionalidad estricta de las masas inercial y gravitatoria, queda incorporada de manera natural. Y segundo, resulta imposible medir la intensidad de campo gravitatorio de manera inambigua: lo único que es medible de manera inambigua es la combinación 2 k g k (t, xl (t)) + ddta2 . El camino a seguir ahora es claro: como ya sabemos que las fuerzas inerciales se describen correctamente mediante una conexión, intentemos describir conjuntamente las fuerzas gravitatorias y las inerciales mediante una sola conexión, que ahora sı́ llamaremos Γ, y que es diferente de la anterior Λ. No es demasiado atrevido conjeturar que, sin poderlo formular de manera matemáticamente precisa, este camino era el que hubieran preferido seguir los oponentes continentales de Newton. La conexión ‘gravitatorio-inercial’ o de caı́da libre. Lo que se pretende ahora es abordar una interpretación alternativa de la Teorı́a Newtoniana de la Gravitación de modo que la gravitación aparezca como una manifestación de curvatura del espacio–tiempo. En esa interpretación el espacio absoluto —representado por la conexión ∆— desaparece completamente de la escena. En una primera etapa, nos limitaremos sucesivamente a comprobar que en efecto, las ecuaciones de movimiento (1.9)/(1.30) son las ecuaciones de las autoparalelas (geodésicas) de una cierta conexión en el espacio–tiempo, que las ecuaciones de separación de marea (1.15)/(1.31) son las ecuaciones de desviación geodésica para la aceleración (covariante) de la separación relativa entre autoparalelas de esa conexión (lo que permite identificar el tensor de marea con las componentes posiblemente no nulas del tensor de curvatura), y que finalmente, las ecuaciones del propio campo gravitatorio (1.17)/(1.37) se leen de modo muy simple en términos del tensor de curvatura de la conexión: la única componente no nula del tensor de Ricci (una contracción del tensor de curvatura de la conexión) es proporcional a la densidad de masa. La ‘conexión gravitatorio-inercial’ en un sistema de referencia inercial ¿Es posible identificar los movimientos en caı́da libre en un campo gravitatorio con las lı́neas autoparalelas (geodésicas) de una conexión Γµ αβ ? La respuesta es afirmativa. El hecho de que una curva sea autoparalela de la conexión es intrı́nseco y no depende del sistema de coordenadas, de modo que la interpretación que ası́ se obtiene entre los movimientos en caı́da libre en el campo gravitatorio y las autoparalelas de la conexión resulta independiente del sistema de coordenadas. Comencemos el ejercicio considerando un SRI. Se trata de identificar la ecuación de caı́da libre en el campo gravitatorio, (1.9), M d2 xI (t) IL ∂ϕ(t, x ) = −δ , dt2 ∂xL (2.58) con las ecuaciones de las autoparalelas de la conexión Γµ αβ , referidas al parámetro afı́n τ , que son: d2 xµ dxα dxβ µ + Γ = 0. (2.59) αβ dτ 2 dτ dτ II. Gravitación Newtoniana como curvatura . . . 2005-06 28 Para llevar a cabo esta identificación, procede separar explı́citamente la ecuación µ = 0 de las tres ecuaciones µ = I, y en cada una de ellas además separar los términos en la suma doble en α, β que corresponden a las alternativas α = 0, J ó β = 0, K, manteniendo el convenio de suma en ı́ndices espaciales I, J, K repetidos. Ello lleva a: 0 0 dx0 dxJ dxJ d2 x0 0 dx dx 0 0 + Γ 00 + 2Γ 0J + Γ JK dτ 2 dτ dτ dτ dτ dτ 0 0 0 J J dx d2 xI dx dx dx dx I I I + Γ + 2Γ + Γ 00 0J JK dτ 2 dτ dτ dτ dτ dτ dxK = 0, dτ dxK = 0, dτ I = 1, 2, 3 La elección: Γ0 00 = 0, ΓI 00 (x, t) = δ IM ∂ϕ(x, t) , ∂xM Γ0 J0 = Γ0 0J = 0, Γ0 JK = 0, (2.60) ΓI J0 = ΓI 0J = 0, ΓI JK = 0, (2.61) hace que la componente µ = 0 de la ecuación de las autoparalelas se reduzca a d2 x0 =0 dτ 2 (2.62) cuya solución general x0 = cte τ + cte indica que un cambio trivial de origen y de escala reducen las constantes a 1 y 0, de manera que el parámetro afı́n τ de las autoparalelas 0 τ se identifica con la coordenada x0 ≡ t. Habida cuenta de τ = t y de dx dt = 1, las tres restantes componentes µ = I de las autoparalelas quedan: d2 xI dxJ dxJ dxK I I I + Γ + 2Γ + Γ = 0, 00 0J JK dt2 dt dt dt I = 1, 2, 3 (2.63) que para la elección (2.61) se reducen exactamente a la ecuación de caı́da libre (2.58). Es pertinente hacer aquı́ una pequeña disgresión: la ecuación (2.63) en su forma más general, para una conexión dada por (2.60) pero con ΓI 00 , ΓI J0 = ΓI 0J , ΓI JK que sean funciones de las coordenadas mas generales que las dadas en (2.61) podrı́a verse como una ‘ecuación de Newton’ para unas ‘fuerzas’ mucho más generales que las habituales, con términos lineales y cuadráticos en las velocidades (que aparecerı́an descritas mediante los coeficientes ΓI J0 = ΓI 0J y ΓI JK de la conexión), además de los términos ordinarios, independientes de la velocidad (como las gravitatorias ordinarias) que estarán descritas por los coeficientes ΓI 00 . De nuevo aquı́ aparece una analogı́a con el electromagnetismo, en donde además de las fuerzas electrostáticas hay también fuerzas (magnéticas) lineales en la velocidad; las fuerzas cuadráticas en las velocidades no tienen análogo en electromagnetismo. La elección de la conexión (2.61), que estipula la anulación de las ‘posibles’ componentes adicionales de las fuerzas gravitatorias que sean lineales y cuadráticas en las velocidades puede verse como un reflejo de que en la teorı́a de gravitación de Newton las fuerzas gravitatorias sobre una partı́cula test son independientes de la velocidad de dicha partı́cula; en términos imprecisos pero sugerentes, el campo gravitatorio newtoniano carece de un campo ‘gravimagnético’ asociado, que serı́a un campo especı́fico, creado por la masa en movimiento y distinto del gravitatorio usual. II. Gravitación Newtoniana como curvatura ... 2005-06 29 Dicho de otro modo: la gravitación newtoniana resulta análoga a la electrostática, en donde los efectos magnéticos no aparecen; en la naturaleza sı́ que parece haber efectos de tipo gravimagnético y por tanto la teorı́a newtoniana de la gravitación, al igual que la electrostática, es sólo una aproximación. Resumiendo: las ecuaciones de las autoparalelas para la conexión (2.60)–(2.61) contienen a la vez la identificación del parámetro afı́n τ con el tiempo absoluto y las ecuaciones de caı́da libre (2.58). Por lo tanto es posible interpretar el movimiento en caı́da libre bajo el campo gravitatorio con las autoparalelas de la conexión gravitatorio-inercial o de caı́da libre Γ, dada en un SRI por (2.60)–(2.61). Naturalmente, la nueva conexión no es la ‘conexión inercial’ Λ que incorporaba exclusivamente las fuerzas de inercia. El tensor de curvatura de la conexión Γ se calcula sin gran dificultad y ahora resulta no nulo; las componentes RI 0J0 y RI 00J son diferentes de cero: RI 0J0 = δ IK ∂ 2 ϕ(x, t) , ∂xK ∂xJ RI 00J = −RI 0J0 demás Rµ ναβ = 0 (2.64) donde se ve que esencialmente, las componentes no nulas del tensor de curvatura de la conexión gravitatorio-inercial de caı́da libre son las componentes del tensor de marea ordinario, RI 0J0 ≡ AI J (2.65) Debe observarse en particular: a) todas las componentes R0 ναβ = 0 (anulación ligada con el tiempo absoluto) y b) que todas las componentes puramente espaciales del tensor de curvatura también se anulan, RI JKL = 0 lo que corresponde a que el 3-espacio es plano en la teorı́a newtoniana. Este mismo resultado también se ve en la expresión de la conexión: del hecho de que todos los ΓI JK (t, x1 , x2 , x3 ) = 0 se deriva que el espacio es plano, lo que es consistente con la consideración implı́cita que se ha hecho desde el principio, aceptando sin mucha discusión el que las coordenadas xI fueran coordenadas cartesianas. • ejercicio 2.19. Comprobar la expresión (2.64) de las componentes del tensor de curvatura. La separación entre dos autoparalelas próximas τ → xµ (τ ) y τ → xµ (τ ) + η µ (τ ) satisface la ecuación de desviación geodésica D2 η µ (τ ) dxν α dxβ µ η ≈ 0. + R ναβ Dτ 2 dτ dτ (2.66) en la que aparece la derivada covariante del vector separación η I (τ ) a lo largo de la curva τ → xµ (τ ); recordemos que para un vector arbitrario ξ µ (τ ) a lo largo de la curva, su derivada covariante está definida por: Dξ µ (τ ) dξ µ (τ ) dxβ = + Γµ αβ ξ α (τ ) . Dτ dτ dτ (2.67) Para ver mejor qué significa la ecuación (2.66) desde el punto de vista ordinario 1 + 3 (‘tiempo + espacio’), debemos realizar el descenso desde la notación ‘cuadridimensional’ a la ordinaria tridimensional. Para ello hay que distinguir entre componentes temporales (las que lleven un ı́ndice 0) y espaciales (que llevan un indice I) de los objetos II. Gravitación Newtoniana como curvatura . . . 2005-06 30 involucrados (la separación η µ , el tensor de curvatura Rµ ναβ y el vector tangente a β la autoparalela fiducial dx dτ ), y por otro lado, debemos considerar separadamente las ecuaciones µ = 0 y µ = I. El ejercicio siguiente plantea paso a paso el cálculo de la derivada covariante del vector separación: • 2.20. El vector separación entre las dos autoparalelas tiene nula la componente η 0 , esto es, tiene la forma τ → (η 0 = 0, η I (τ )). Por tanto, aunque se describa como un vector en el espacio-tiempo (4-vector), se trata realmente de un 3-vector puramente espacial. (Este es el primer ejemplo del nexo entre la formulación cuadridimensional, en el espacio-tiempo, y la descripción tridimensional ordinaria que emerge de manera natural de la espaciotemporal). El ejercicio consiste en comprobar que en un sistema de coordenadas en el que la conexión esté dada por (2.60)–(2.61), la derivada covariante de la separación a lo largo de la geodésica fiducial está dada por: Dη 0 (t) Dη I (t) dη I (t) = 0, = . (2.68) Dτ Dτ dt ejercicio es decir, las componentes espaciales de la derivada covariante de la separación con respecto al parámetro afı́n de las autoparalelas coinciden con las derivadas temporales ordinarias. Para verlo se debe partir de la expresión de la derivada covariante, introduciendo ya la relación τ = t: Dη µ (τ ) dη µ (t) dxα β = + Γµ αβ η (t). (2.69) Dτ dt dt y notar los siguientes hechos: 1) Para µ = 0 habida cuenta de (2.60), esta ecuación se reduce a una identidad 0 = 0 2) Para µ = I, teniendo en cuenta las expresiones (2.61) para la conexión, la derivada covariante de la separación η I (t) a lo largo de la geodésica fiducial tiene, en adición a la derivada ordinaria, α η β (τ ). Al llevar a cabo la suma en α, β, vemos que los términos extra del tipo ΓI αβ dx dt únicos coeficientes de conexión no nulos son los ΓI 00 , que aparecen acompañados de un factor dx0 0 η (τ ) que resulta ser idénticamente nulo pues η 0 (τ ) = 0. Ası́ se obtiene el resultado dτ buscado. Habiendo obtenido los resultados previos, pasemos a nuestro objetivo que es escribir en forma 3 + 1 la ecuación de desviación geodésica (2.66). La componente µ = 0 de estas ecuaciones es una identidad debido a que η 0 (t) = 0 y R0 ναβ = 0. Tan solo quedan las tres componentes espaciales µ = I que son: D2 η I (t) dxν α dxβ I + R η ≈ 0. ναβ Dt2 dt dt (2.70) Ahora debemos tener en cuenta tres hechos: 1) en el sistema de coordenadas en que estamos trabajando las derivadas covariantes de η I con respecto al tiempo están dadas por las derivadas ordinarias (según (2.68)), 2) al sumar sobre los indices mudos ν α β, sólo los elementos RI 0J0 y RI 00J del tensor de Riemann RI ναβ son eventualmente distintos de 0; estos elementos del tensor de Riemann van acompañados respectivamente 0 dx0 0 dxJ J dx0 J de los factores dx dt η dt = η y dt η dt = 0, de manera que solo hay contribución proveniente de RI 0J0 y finalmente la ecuación anterior se reduce a: d2 η I (t) + RI 0J0 η J (t) ≈ 0, dt2 (2.71) II. Gravitación Newtoniana como curvatura . . . 2005-06 31 que es la ecuación del campo de marea (1.15) con la identificación AI J ≡ RI 0J0 . (2.72) que ya habı́a aparecido en (2.65). En otras palabras: la definición “fı́sica” del campo de marea AI J (1.14) resulta coincidir exactamente con las componentes algebraicamente independientes RI 0J0 del tensor de curvatura (2.64) asociado a la conexión ‘gravitatorio-inercial’ (2.60)–(2.61). Las ecuaciones del propio campo gravitatorio se escribieron en su momento en términos del potencial (1.10), del vector campo gravitatorio (1.4), y del tensor campo de marea (1.17). Ahora podemos añadir un eslabón más a esa cadena: el campo de marea aparece como la parte posiblemente no nula del tensor de curvatura. Como consecuencia, la ecuación de Poisson del campo gravitatorio puede expresarse como una relación entre el tensor de curvatura de la conexión Γ y la densidad de masa: ∇2 φ(x, t) = −divg(x, t) = AI I (x, t) = RI 0I0 (x, t) = 4 π G ρ(x, t) (2.73) La última ecuación, que es la realmente nueva en la interpretación de la gravitación como curvatura se formula habitualmente en términos del tensor de Ricci de la conexión. El tensor de Ricci Rνβ asociado al tensor de curvatura Rµ ναβ se define como: Rνβ := Rµ νµβ • (2.74) 2.21. Comprobar que para un tensor de curvatura de tipo newtoniano (2.64), en el que R0 ναβ = 0, la suma en los cuatro ı́ndices µ se reduce a una suma en los tres ı́ndices espaciales: ejercicio Rνβ := Rµ νµβ = R0 ν0β + RI νIβ = RI νIβ (2.75) con lo que el tensor de Ricci asociado a (2.64) tiene componentes R00 = δ IM ∂2ϕ = ∇2 ϕ, ∂xI ∂xM R0I = RI0 = RIJ = 0 (2.76) que es bastante especial: en un SRI sólo la componente R00 puede ser no nula y las demás se anulan de manera automática. Esto es análogo a lo que ocurrı́a también en el tensor de curvatura, y está ligado a la estructura del espacio-tiempo newtoniano, especı́ficamente a la existencia de la foliación asociada al tiempo absoluto. La exploración de esta conexión se propone en una serie de ejercicios (aun no incluı́dos). Según las ecuación del campo (1.10b), el laplaciano del potencial es proporcional a la densidad de masa. Como este laplaciano aparece como la única componente no nula del tensor de Ricci, la ecuación de campo se transcribe: R00 (x, t) = 4 π G ρ(x, t). (2.77) Conviene recordar que ésta no es la única ecuación del campo gravitatorio: en términos del vector campo gravitatorio (1.4) hay otra condición que expresa el hecho II. Gravitación Newtoniana como curvatura . . . 2005-06 32 de que g es un campo irrotacional, que para el campo de marea se traduce en términos del tensor de curvatura como: δIK RK 0J0 (x, t) = δJK RK 0I0 (x, t) (2.78) Para un tensor de curvatura dado en términos del potencial mediante (2.64) esta condición se satisface idénticamente y la anterior se reduce a la ecuación de Poisson. Ambas ecuaciones deben considerarse como las ecuaciones del campo gravitatorio newtoniano. En resumen: Es posible interpretar el movimiento de caı́da libre en un campo gravitatorio como movimiento autoparalelo de una conexión gravitatorio-inercial o conexión de caı́da libre Γ (que recoge conjuntamente las fuerzas gravitatorias y las inerciales) definida en el espacio-tiempo. La curvatura de esta conexión, descrita por el tensor de curvatura (2.64), es no nula, de manera que es perfectamente aceptable decir que el espacio-tiempo newtoniano tiene curvatura. Como la teorı́a sigue teniendo un tiempo absoluto, la curvatura es bastante especial; en particular el propio 3-espacio (cada espacio de simultaneidad absoluta, en un instante t) es plano. Lo que se obtiene puede describirse como curvatura de un espaciotiempo con tiempo absoluto y sin curvatura puramente espacial. Esto se ve bien en (2.64), ya que todas las componentes de tipo Rµ νKL son nulas, y son esas componentes del tensor de curvatura las que regulan el cambio de un vector en transporte paralelo a lo largo de un circuito cerrado puramente espacial, contenido en el 2-plano espacial KL. La interpretación de la gravitación newtoniana como teorı́a de curvatura del espacio tiempo mantiene un espacio tridimensional sin curvatura espacial; la curvatura sólo se manifiesta cuando hay transcurso temporal y es, estrictamente hablando, una propiedad del espacio-tiempo. A posteriori, esto justifica el que implı́citamente hayamos estado usando las xI como coordenadas cartesianas en las que la métrica espacial está dada por el familiar tensor métrico δIJ . Esto lo hemos estado haciendo sin decirlo muy explı́citamente, pero debe quedar claro qu de manera subrepticia hemos estado presuponiendo desde el principio que el espacio fı́sico es un 3-espacio euclı́deo. Si tal actitud despreocupada funciona ello se debe a que en la teorı́a newtoniana las propias ecuaciones del campo gravitatorio implican que la curvatura del espacio tridimensional tiene que ser idénticamente nula. En consecuencia, si desde el principio suponemos que el 3-espacio es plano (curvatura=0) no caemos despues en inconsistencias ni otras dificultades. Conviene señalar ya desde ahora que una de las diferencias esenciales entre la gravitación Newtoniana y la relativista es que en la teorı́a de Einstein, el espacio-tiempo es curvo, y el 3-espacio también es curvo lo que allı́ complica extraordinariamente las cosas ya que entonces no será posible escoger coordenadas espaciales canónicas —como hemos hecho nosotros con las xI (o las xi )— en términos de las cuales toda la descripción sea tan sencilla y sobre todo tan fácilmente visualizable. La ‘conexión gravitatorio-inercial’ en un sistema de referencia no inercial La discusión anterior supone un sistema de coordenadas globalmente inercial. ¿Qué ocurre si planteamos una discusión análoga partiendo de las ecuaciones de movimiento y de marea en un sistema no inercial? II. Gravitación Newtoniana como curvatura . . . 2005-06 33 La interpretación geométrica es la misma: la caı́da libre (1.30) corresponde a las autoparalelas (geodésicas) de la misma conexión, referida ahora a un nuevo sistema de coordenadas; la ecuación de marea (1.37) se identifica con la misma ecuación de desviación geodésica en las nuevas coordenadas; el campo de marea son las componentes esenciales del tensor de curvatura de la conexión, y las ecuaciones de campo relacionan la componente ‘tiempo-tiempo’ R00 del tensor de Ricci con la densidad de masa en el sistema no inercial, exactamente de la misma forma que en el sistema de referencia inercial. Ası́ pues, el proceso de análisis que comenzamos caracterizando la gravitación como “aceleración de la separación relativa en caı́da libre” se cierra produciendo una descripción que resulta ser válida en cualquier sistema de coordenadas, sea éste inercial o no. Veamos las expresiones. Sean (xi ) las coordenadas cartesianas en un sistema de referencia no inercial arbitrario. El tiempo universal es el mismo en el nuevo sistema que en el antiguo, y las relaciones entre las “coordenadas inerciales I” y las “no inerciales i” es (1.27): xi = Ri I (t) xI + ai (t). (2.79) Las ecuaciones de caı́da libre y de marea en el sistema no inercial son (1.30) y (1.31). Ambas resultan ser la ecuación de las autoparalelas y la ecuación de desviación geodésica para la separación relativa entre dos autoparalelas. Comencemos por la identificación de la caı́da libre (1.30) i i d2 ak d2 xk (t) ki ∂ϕ k k j i i k d(x (t) − a (t)) = −δ + +{ Ω̇ −Ω Ω }(x (t)−a (t))+2 Ω (2.80) i j i i dt2 ∂xi dt2 dt con las ecuaciones de las autoparalelas τ → xµ (τ ) de la conexión Γµ αβ (xi , t): 0 0 j j k 0 d2 x0 0 dx dx 0 dx dx 0 dx dx + 2Γ + Γ = 0, + Γ 0j jk 00 dτ 2 dτ dτ dτ dτ dτ dτ 0 0 0 j j k d2 xi i dx dx i dx dx i dx dx + Γ + 2Γ + Γ = 0, i = 1, 2, 3. 00 0j jk dτ 2 dτ dτ dτ dτ dτ dτ La elección Γ0 00 = 0, Γ0 0j = Γ0 j0 = 0, Γ0 jk = 0, (2.81) (2.82) (2.83) permite al igual que hicimos con la conexión inercial Λ , identificar la coordenada x0 ≡ t 0 con el parámetro afı́n τ , (salvo un cambio trivial de origen y escala), con lo que dx dt = 1. Comparando los términos independientes, lineales o cuadráticos en las velocidades en (2.80) con los términos correspondientes en (2.82) reescrita como: j j k d2 xi i i dx i dx dx + Γ + 2Γ + Γ = 0, i = 1, 2, 3, (2.84) 00 0j jk dt2 dt dt dt el candidato a conexión cuyas autoparalelas sean (2.80) debe tener las restantes componentes dadas por: 2 i l d a (t) i im ∂ϕ i i j i i da (t) i i j l Γ 00 = δ − {Ω̇ l − Ω j Ω l }x − − 2Ω l − {Ω̇ l − Ω j Ω l }a (t) , ∂xm dt2 dt (2.85) Γi 0j = Γi j0 = −Ωi j (t), Γ i jk = 0. (2.86) (2.87) II. Gravitación Newtoniana como curvatura . . . 2005-06 34 Con esta elección la ecuación (2.82) o (2.84) de las geodésicas coincide con la ecuación de caı́da libre (2.80). Nótese que la rotación del sistema no inercial con respecto al inercial está descrita por un Ωi j (t) que depende sólo del tiempo, y que el campo gravitatorio ordinario, al ser un gradiente, es un campo irrotacional. Son aquı́ aplicables los comentarios que en su momento se hicieron sobre la forma de la conexión inercial, tras (2.52). Pero debe notarse que ahora el coeficiente Γi 00 depende de x de una manera que ya no es lineal, a través del potencial gravitatorio. • ejercicio 2.22. • ejercicio 2.23. Comprobar las ecuaciones (2.85)–(2.87) Comprobar que la conexión Γi jk (t, xm ) en el sistema de referencia no inercial es exactamente (como se debı́a) la que se obtiene a partir de la conexión ΓI JK (t, xM ) (2.60)– (2.61) mediante la ley de transformación de una conexión, para el cambio de coordenadas (2.48). xm Conviene notar que para el potencial gravitatorio estamos suponiendo una ley de transformación de tipo escalar. Es posible encontrar otro convenio para la ley de transformación del potencial —equivalente fı́sicamente— en el que las fuerzas inerciales de arrastre y centrı́fugas están incorporadas en el potencial; ambas elecciones conducen a la misma ecuación de movimiento. Es fundamental entender que en esta interpretación un solo objeto geométrico, la conexión gravitatorio-inercial, presenta mezcladas sin distinción invariante posible a las fuerzas gravitatorias ‘reales’ con las fuerzas inerciales. Ası́ se corta el nudo gordiano de la discusión “sistema inercial + fuerzas gravitatorias” versus “sistema no inercial y ausencia de fuerzas” por el expediente, directo pero bastante radical, de englobar ambas en un mismo objeto y dejar la tarea de discernir (ya que no separar) entre ambos tipos a otro objeto, el tensor de curvatura. El tensor de curvatura se calcula a partir de la conexión con poco más trabajo que el necesario para pasar de (2.60)–(2.61) a (2.64); el resultado —esperable— es que la no inercialidad del sistema de referencia (descrita por ai (t) y Ωi j (t)) no se manifiesta en el tensor de curvatura, cuyas únicas componentes no nulas son otra vez Ri 0j0 y las algebraicamente dependientes de ellas: Ri 0j0 = δ im ∂2ϕ , ∂xj ∂xm Ri 00j = −Ri 0j0 demás Rµ ναβ = 0 (2.88) que podrı́a también haberse obtenido mediante la ley de transformación tensorial del tensor de Riemann bajo el cambio de coordenadas (2.48) partiendo de su expresión en el sistema inercial (2.64). • ejercicio 2.24. Comprobar, al menos por uno de los dos procedimientos. Al escribir en estas coordenadas la ecuación general de desviación geodésica, la identidad de la coordenada t con el parámetro afı́n τ se mantiene, ası́ como el hecho de que la separación es un vector espacial, η 0 (t) = 0 (lo que concuerda con la anulación de los coeficientes Γ0 αβ ), pero la derivada covariante de la separación η i (t) a lo largo de la geodésica fiducial ya no coincide con la derivada ordinaria, sino que adquiere un II. Gravitación Newtoniana como curvatura . . . 2005-06 35 término extra: Dη i dη i dxβ = + Γi αβ η α Dτ dt dt i dx0 dx0 dxj dxk dη = + Γi 00 η 0 + Γi j0 η j + Γi 0j η 0 + Γi jk η j dt dt dt dt dt i dη i dη = + Γi j0 η j = − Ωi j (t)η j . dt dt (2.89) Notar que en esta expresión (en un sistema de referencia no inercial) sólo aparece la velocidad angular Ωi j (t) con la que el sistema no inercial rota relativamente al inercial. Para sistemas no inerciales sin rotación (en los que la no inercialidad se debe sólo a un movimiento de traslación acelerada), la derivada covariante de la separación con respecto al tiempo coincide con la derivada ordinaria; véase de nuevo la astucia y la visión de Newton al usar un SR rotante en su réplica a Leibniz. En consecuencia, la transcripción de la ecuación de desviación geodésica: dxν α dxβ D2 η µ (τ ) µ η ≈ 0, + R ναβ Dτ 2 dτ dτ (2.90) en el SRnI tiene términos extra comparados con los de la fórmula (2.68)) que proceden de la segunda derivada covariante. Partiendo de (2.89) se llega a: D2 η i (t) D = 2 Dt Dt dη i (t) i j − Ω jη dt k j d2 η i (t) dη (t) i j i dη i k m = − Ω̇ j η − Ω j −Ω k − Ω mη = dt2 dt dt j d2 η i (t) i i k j i dη − ( Ω̇ + Ω Ω )η − 2Ω . = j k j j dt2 dt Dη i (t) Dt D = Dt (2.91) Exactamente igual que en un SRI, al término que contiene el tensor de Riemann en (2.90) sólo pueden aportar contribución las componentes no nulas del tensor que son 0 j dx0 j Ri 0j0 y Ri 00j . Las primeras contribuyen acompañadas de un factor dx dt η dτ = η 0 0 dxj mientras que las Ri 00j no contribuyen pues su factor acompañante dx dt η dτ se anula al ser η 0 = 0; todos los restantes elementos del tensor de Riemann se anulan y no aportan ninguna contribución a (2.90). Ası́ pues la transcripción de la ecuación de desviación geodésica es: j D2 η i (τ ) d2 η i (t) i j i i k j i dη + R η = − ( Ω̇ + Ω Ω )η − 2Ω + Ri 0j0 η j (t) ≈ 0, (2.92) 0j0 j k j j Dτ 2 dt2 dt cuya identidad con la ecuación de marea en el sistema no inercial (1.31): l d2 η i (t) i i l j i dη (t) − { Ω̇ + Ω Ω } η (t) − 2Ω ≈ −Ai j (x(t), t) η j (t) j l j l dt2 dt (2.93) II. Gravitación Newtoniana como curvatura . . . 2005-06 36 es evidente. La relación entre el tensor de curvatura y el campo de marea en el nuevo sistema, de acuerdo con el carácter tensorial de ambos, es: Ri 0j0 = Ai j . (2.94) El comentario hecho al final del apartado dedicado a la descripción de la gravitación Newtoniana, en el sentido de que la “buena” forma de escribir la ecuación de marea en el sistema no inercial era precisamente (1.33), es decir (2.93), se refiere, por supuesto, a que en esa forma el segundo miembro contiene sólo el término de curvatura que corresponde al campo gravitatorio “real” (es decir, el creado por las masas), mientras que los términos extra en el primer miembro se deben a que las derivadas relevantes son las derivadas “absolutas” covariantes, y no las derivadas temporales ordinarias. El tensor de Ricci Rµν = Rα µαν en el sistema no inercial es: R00 = δ im ∂2ϕ = ∇2 ϕ(xi , t), ∂xi ∂xm Ri0 = R0i = Rij = 0, (2.95) y las ecuaciones del propio campo gravitatorio son formalmente idénticas a (2.77), R00 (x, t) = 4πGρ(x, t), δik Rk 0j0 = δjk Rk 0i0 (2.96) A modo de resumen El programa de formular la teorı́a newtoniana de la gravitación como una teorı́a de curvatura del espacio–tiempo galileano resulta un completo éxito: el principio de equivalencia débil, según el cual el movimiento de partı́culas test en un campo gravitatorio con las mismas condiciones iniciales es independiente de la masa, composición, etc, permite interpretar el movimiento en caı́da libre como las autoparalelas de cierta conexión definida en el espacio–tiempo. En un sistema de referencia globalmente inercial la conexión (2.60)–(2.61) que describe el campo gravitatorio es bastante simple aunque no es nula, pero las leyes de transformación no homogéneas de una conexión hacen que al pasar a un sistema no inercial aparezcan una serie de términos extra, que deben entenderse como fuerzas de inercia; no hay ninguna posibilidad de separar de forma invariante las fuerzas gravitatorias “reales” de las de inercia. La idea de construir una teorı́a en la que las fuerzas de inercia se describan en pie de igualdad con las gravitatorias está sugerida por la observación de que las fuerzas gravitatorias reales satisfacen el principio de Galileo —las aceleraciones de origen gravitatorio sufridas por un cuerpo son independientes de su masa, composición, etc.— lo que es un hecho experimental muy especial y sin razón fı́sica aparente. Las fuerzas de inercia satisfacen también esta propiedad de que las aceleraciones que producen sean independientes de la masa, composición quı́mica, etc del cuerpo sobre el que actúan, pero para estas fuerzas la razón última de la independencia se entiende perfectamente: es consecuencia del caracter “auxiliar” que dichas aceleraciones (o las fuerzas que las producen) tienen para ‘salvar’ la ley de Newton en cualquier sistema de referencia. Y ya que cambiando el sistema de referencia podemos hacerlas desaparecer es evidente que deben afectar por igual a cualquier objeto, independientemente de su masa, composición, etc. II. Gravitación Newtoniana como curvatura . . . 2005-06 37 Es frecuente leer que se da una explicación del principio de Galileo al englobar las aceleraciones gravitatorias e inerciales en un mismo objeto pero parece mucho más acertado decir que es el principio de Galileo quien permite una interpretación geométrica de la gravitación. Si el movimiento de diversas partı́culas en caı́da libre con condiciones iniciales idénticas pudiera ser diferente (como ocurre para partı́culas cargadas en un campo electromagnético, en donde el movimiento depende del cociente q/m), entonces la identificación de la caı́da libre con unas curvas determinadas de una vez por todas en el espacio–tiempo serı́a imposible, y se caerı́a por su propio peso —valga la tonterı́a— la pretensión de interpretar el campo gravitatorio como descrito por una conexión en el espacio-tiempo. Y si este fuera el caso, la única alternativa viable serı́a la descripción de la gravitación como un campo adicional de fuerzas en un espacio-tiempo llano, en el que las fuerzas de inercia aún estarı́an dadas por la conexión inercial ∆, esto es, recaerı́amos en la interpretación convencional de la gravitación newtoniana. En la interpretación alternativa, la aparente proporcionalidad estricta de la masa inercial y gravitatoria, comprobada en los experimentos de tipo Eötvös-Dicke, sugiere que la auténtica naturaleza matemática del campo gravitatorio no es la de un campo vectorial, sino la de una conexión, que incorpora automáticamente las fuerzas de inercia, y cuyas autoparalelas son los movimientos de caı́da libre; todos los enunciados son válidos indistintamente para sistemas de referencia inerciales o no inerciales. Esta caracterı́stica anticipa, en el contexto de la gravitación Newtoniana, lo que será uno de los ingredientes principales en la teorı́a de Einstein. La conexión, que en un sistema globalmente inercial presenta la forma más simple (2.60)–(2.61) está dada en un sistema no inercial por (2.85)–(2.87), pero a pesar de las apariencias, se trata del mismo objeto, que engloba conjuntamente las fuerzas gravitatorias y las inerciales. La curvatura, descrita por el tensor de Riemann de la conexión, está relacionada con las fuentes del campo (la densidad de masa) mediante una relación muy simple entre el tensor de Riemann (el campo de marea) y la densidad de masa. Además esta relación tiene la misma forma en cualquier sistema de referencia (inercial o no): la componente R00 del tensor de Ricci (la traza del campo de marea) es proporcional a la densidad de masa. Es necesario insistir en que sı́ es posible distinguir entre un campo gravitatorio ‘real’ y el campo de las “fuerzas de inercia” que aparece en un sistema de referencia no inercial, pero dicha distinción es local y no requiere el espacio absoluto; basta observar el movimiento “relativo” de dos partı́culas test próximas en caı́da libre; la segunda derivada covariante de esta separación con respecto al tiempo está siempre ligada con la presencia intrı́nseca de campo gravitatorio y el objeto que describe esta presencia es el campo de marea, que geométricamente aparece como el tensor de curvatura. Una parte importante de los malentendidos que surgen sobre la correcta interpretación del principio de equivalencia se deben a ignorar que el comportamiento del campo gravitatorio en un punto dado requiere (al menos) dos niveles de descripción: la intensidad de campo gravitatorio g y el tensor campo de marea A. Mientras consideremos el comportamiento de la caı́da libre de una sola partı́cula test, el segundo nivel no es relevante, y entonces la discusión entre dos posturas que pueden enunciarse como “la fuerza que se observa sobre la partı́cula se debe a la existencia de un campo gravitatorio; el sistema de referencia es inercial” versus “no hay campo gravitatorio; el sistema de referencia no es inercial” puede proseguir indefinidamente y no hay manera de zanjarla. Sin embargo, en cuanto consideremos dos partı́culas test cercanas, ambas en caı́da libre, el II. Gravitación Newtoniana como curvatura . . . 2005-06 38 nivel campo de marea es esencial, y basta la observación de los efectos de marea para distinguir de manera absoluta entre los campos gravitatorios “reales” de los aparentes debidos al empleo de sistemas de referencia no inerciales. En ausencia de campo gravitatorio (ϕ = 0, g = 0) y en un sistema de referencia inercial global, la conexión es nula (Γµ αβ = 0), y el tensor de curvatura se anula (Rµ ναβ = 0). Al pasar a un sistema no inercial, aparecen en la conexión ciertas componentes no nulas, las aceleraciones de inercia, contenidas en los coeficientes de conexión Γi 00 , Γi j0 que ahora ya no son nulos, sino que valen: 2 i l d a (t) i da (t) i i j l i i i j i − 2Ω l − {Ω̇ l − Ω j Ω l }a (t) , Γ 00 = −{Ω̇ l − Ω j Ω l }x − dt2 dt (2.97) Γi 0j = Γi j0 = −Ωi j (t), (2.98) Γi jk = 0. (2.99) mientras que el tensor de curvatura en las nuevas coordenadas sigue siendo nulo (como se debe). Esto es: la ausencia de campo gravitatorio corresponde de manera intrı́nseca, independiente de las coordenadas, a la anulación del tensor de Riemann. Cuando hay un campo gravitatorio real, incluso si escogemos como sistema de referen∂ϕ cia un SRI, la conexión tiene alguna componente no nula, ΓI 00 = δ IM ∂x M y el tensor de I curvatura también tiene componentes no nulas, (p.ej., R 0J0 ). Si el campo se describe en un SRnI, entonces la conexión tiene otras contribuciones, como las dadas en (2.85)– (2.87), y alguna de las componentes del tensor de curvatura en el SRnI son también no nulas. Esto es: la presencia de campo gravitatorio corresponde de manera intrı́nseca, independiente de las coordenadas, a que el tensor de Riemann tenga componentes no nulas. Gravitación como curvatura (II). Más de 2000 años de reflexión sobre los fundamentos de la geometrı́a llevaron, en el periodo entre 1820 y 1860 al reconocimiento de que la geometrı́a euclidea es sólo una de las posibles geometrı́as del mundo real, y que la geometrı́a del espacio fı́sico bien pudiera ser no euclidiana. El marco matemático adecuado para describir esta extensión es la geometrı́a Riemanniana: en ella las propiedades de un espacio se parecen en pequeñas escalas a la geometrı́a euclidea pero estrictamente hablando las propiedades son diferentes, y las diferencias están cualitativa y cuantitativamente descritas por la curvatura; los espacios son más cercanos en sus propiedades locales al espacio euclideo en cuanto más pequeña sea su curvatura, que (por definición) es nula en el espacio euclı́deo. Entre estos espacios hay algunos ejemplos particulares (muy especiales y no genéricos), que conservan otra propiedad del espacio euclı́deo, su homogeneidad: estos son los espacios de curvatura constante, como la esfera y el espacio hiperbólico de Lobachewski. Uno de los objetivos de este programa matemático, en el que destacan sobre todo los nombres de Gauss y Riemann, era el de responder a viejas preguntas sobre la naturaleza de la geometrı́a euclı́dea y sobre su excelente adecuación experimental al espacio fı́sico. Una vez que quedó claro cuales son las posibles propiedades de un espacio curvo, y cómo se reconoce la posible la existencia de curvatura en el espacio, la pregunta natural para un fı́sico es: ¿Es realmente curvo el espacio? II. Gravitación Newtoniana como curvatura . . . 2005-06 39 Se sabe que la suma de los tres ángulos de un triángulo puede ser diferente de π en caso de que la geometrı́a del espacio no sea euclı́dea. En concreto, si la geometrı́a es de curvatura constante (positiva/negativa) entonces esta suma es mayor/menor que π y el exceso/defecto de la suma sobre π es proporcional al área del triángulo. En el transcurso de sus trabajos de geodesia y topografı́a, Gauss midió los ángulos de un gran triángulo cuyos vértices eran tres montañas separadas del orden de 100 Km. De sus datos se concluye que el espacio fı́sico es euclı́deo con una muy buena aproximación, y si tuviera curvatura no nula, en cualquier caso su posible valor absoluto es muy pequeño. Por su parte Lobachewski fue mucho más atrevido: usando el diámetro de la órbita de la Tierra alrededor del Sol como base de un triángulo, (del orden de 3 ×108 Km), y una estrella como tercer vértice, indicó que si la geometrı́a del espacio fı́sico era hiperbólica (curvatura negativa) en vez de euclı́dea, entonces el paralaje de cualquier estrella, arbitrariamente alejada debı́a ser superior a un valor no nulo (el ángulo de paralelismo de la base). De los paralajes que se habı́an determinado en su época fue capaz de concluir que si el espacio era hiperbólico, su curvatura era muy pequeña. Hoy sabemos que el 3-espacio es curvo, pero su curvatura en circunstancias ordinarias es extraordinariamente pequeña —mucho más pequeña de lo que ningún experimento directo de este tipo podrı́a medir—, y además los intentos anteriores estaban viciados por la suposición implı́cita de que la luz se propaga según las geodésicas de la métrica del 3-espacio, lo que veremos no es el caso en la teorı́a de Einstein (y por lo que parece, tampoco en la realidad experimental). Tuvieron que pasar otros 50 años después de Riemann para entender plenamente que una conexión es cuanto se requiere para dar su auténtico sentido a la idea de curvatura. Ası́ puede extenderse la idea de curvatura a situaciones, más alla de lo imaginado por Gauss y Riemann, en las que los espacios no tengan una estructura local euclı́dea. Hay dos etapas naturales en la extensión de esta idea: primero, a espacios con una métrica indefinida, por ejemplo lorentziana, cuya estructura local serı́a minkowskiana, y después, a situaciones en las que no incluso puede ni haber una métrica, lo que constituye la extensión más amplia, en la que la estructura local es simplemente afı́n. Una situación intermedia entre ambos extremos lo proporciona el caso de que la métrica sea degenerada (como es el caso del espacio-tiempo newtoniano) Si ahora nos restringimos al contexto del espacio-tiempo newtoniano, debemos recordar que allı́ inicialmente introducimos una conexión Λ cuyas autoparalelas son los movimientos inerciales ideales. Resulta claro que estos movimientos juegan un papel espacio–temporal muy semejante al de las lı́neas rectas de la geometrı́a euclı́dea. La analogı́a proviene de que sólo en ciertos sistemas de coordenadas las lı́neas rectas de la geometrı́a euclidea (que son las curvas solución del problema variacional de buscar las extremales de la longitud) están descritas mediante ecuaciones lineales en las que las propias coordenadas dependen linealmente del parametro natural (la longitud de arco a lo largo de la curva); esto es muy parecido a lo que ocurre con los sistemas inerciales, en los que los movimientos inerciales están descritos mediante ecuaciones lineales, con las cuatro coordenadas (la temporal y las tres espaciales) dependiendo linealmente del parametro natural a lo largo de la evolución, es decir el tiempo propio, que en la teorı́a de Newton coincide con la coordenada temporal t. Tras haber introducido la conexión Λ, la analogı́a parece bien fundada: también en el plano o el espacio euclı́deo hay una conexión natural, la conexión de Levi-Civita II. Gravitación Newtoniana como curvatura . . . 2005-06 40 asociada a la métrica, que en coordenadas cartesianas tiene nulos todos los coeficientes de conexión. El hecho de que las rectas euclı́deas en otras coordenadas, como por ejemplo las polares, no estén dadas por ecuaciones en las que las coordenadas dependen linealmente del parámetro natural de evolución (en este caso la longitud de arco), parece totalmente análogo al hecho de que los movimientos inerciales presentan aceleración cuando se describen en un sistema de referencia no inercial. Pero es fundamental entender que esta analogı́a no es perfecta, y en un aspecto importante falla por completo. La diferencia es que las lı́neas rectas de la geometrı́a euclı́dea son observables, mientras que los movimientos inerciales ideales son inobservables. Para comprobar la primera afirmación, baste decir que es posible construir un aparato real (no un experimento mental) que distinga sin ambiguedad una recta de una curva, aparato que podrı́amos imaginar como un medidor de la curvatura geodésica de cualquier curva: cuando este aparato avanza a lo largo de una recta mide constantemente 0 y cuando avanza a lo largo de una curva en el plano euclı́deo mide diferente de 0. [Para una descripción de tal aparato, la Carretilla China indicadora del Sur, véase Am. J. Phys 60 782–787, (1992)]. La clave del funcionamiento de la carretilla china indicadora del sur es la comparación entre las longitudes de dos trayectorias próximas (las dos ruedas siguen lı́neas equidistantes a la trayectoria del centro de la carretilla). Por lo tanto la idea de que una lı́nea en el plano euclı́deo sea ‘recta’ o ‘curva’ no es convencional, sino observacionalmente distinguible. La pregunta importante ahora es: ¿Será posible encontrar un aparato real que mida 0 cuando sigue en el espacio–tiempo un movimiento “ideal” inercial y que mida diferente de 0 cuando sigue un movimiento acelerado? Este aparato, de existir serı́a un acelerómetro absoluto, que medirı́a la aceleración con respecto al espacio absoluto. Podemos imaginar un acelerómetro que verosı́milmente se comportarı́a de ese modo en ausencia de campo gravitatorio. Su versión más simple es una esfera con una masa m mantenida cuando el aparato no acelera, en una posición de equilibrio estable en el centro de la esfera mediante fuerzas no gravitatorias (p.ej. resortes o fuerzas electromagnéticas). Cuando el aparato acelera, las fuerzas de inercia desplazan la posición de equilibrio a un punto excéntrico; sometido este aparato a un movimiento arbitrario se observarı́a una desviación de la posición de la masa central con respecto a su posición central de equilibrio. Que la masa no se desvı́e del centro significa aceleración 0; cualquier otra medida corresponde a un movimiento acelerado [Versión muy simplificada que sólo detecta aceleraciones en un plano ’horizontal’ en el que se mueve un automóvil: un péndulo suspendido del techo del coche. Mientras el movimiento del coche es no acelerado, el péndulo permanece en una posición de equilibrio vertical, pero el equilibrio se retrasa o adelanta cuando acelera o frena, y se desplaza hacia los lados cuando se gira, incluso a velocidad lineal constante]. Cabe poca duda de que si en ausencia de campo gravitatorio este aparato marca permanentemente 0, entonces está siguiendo un un movimiento “ideal” inercial. En particular, esperarı́amos que si el aparato está en reposo en un sistema de referencia inercial, entonces deberı́a marcar 0. Pero cuando hay un campo gravitatorio, como consecuencia de la universalidad de la gravitación un aparato construido como se ha descrito, realmente no se comporta de éste modo. El hecho básico es que la gravitación es universal y no se puede eliminar: la fuerza gravitatoria sigue actuando siempre sobre la masa m del centro hasta que las fuerzas II. Gravitación Newtoniana como curvatura . . . 2005-06 41 gravitatorias se cancelan con las de recuperación que garantizan en funcionamiento del acelerómetro. En otras palabras: cuando un acelerómetro real sigue un movimiento inercial (por ejemplo está en reposo en un SRI), en presencia de un campo gravitatorio, su lectura es diferente de 0. La discusión de si esta medida se debe a “campo gravitatorio + sistema inercial” o por el contrario a “ausencia de campo + sistema no inercial” es completamente indecidible mientras no se introduzcan más elementos en la discusión. Traducido al lenguaje matemático, lo que esto significa es que la conexión Λ es inobservable. En vez de especular con inexistentes acelerómetros ideales, que medirı́an la aceleración con respecto al espacio absoluto (e.g., la aceleración de caı́da de la Luna hacia la Tierra que hemos comentado antes), resulta mucho más satisfactorio declarar que los auténticos análogos de las lı́neas rectas (geodésicas) son los movimientos a lo largo de los cuales la lectura del acelerómetro real es constantemente 0. ¿Quiénes son éstos? Naturalmente, los movimientos de caı́da libre en el campo gravitatorio, esto es, las autoparalelas de la conexión Γ, no de la Λ. ¿Es razonable tomar los movimientos reales en el campo gravitatorio como análogos de las lı́neas rectas? Sı́, debido a la propiedad muy especial de las fuerzas gravitatorias de que la aceleración gravitatoria sobre un cuerpo cualquiera es completamente independiente de su masa, composición, etc., por lo que condiciones iniciales idénticas producen el mismo movimiento para cualquier cuerpo. En resumen, mientras que la conexión Λ y su alter ego el espacio absoluto son inobservables, hay una conexión observable Γ, cuyas autoparalelas se distinguen porque un acelerómetro real que siga una de ellas marca permanentemente 0; en otras palabras, está en caı́da libre. Desde este punto de vista es evidente que los auténticos análogos de las rectas euclidianas son los movimientos en caı́da libre, que sı́ son observables. Como la conexión Γ gravitatorio-inercial presenta curvatura, el espacio-tiempo newtoniano con la conexión Γ es análogo no al espacio euclı́deo, sino a un espacio curvo. Si la conexión Γ es observable, la interpretación de la gravitación newtoniana como curvatura del espacio tiempo es preferible a la vieja interpretación que exige el espacio absoluto, en base al carácter observable de Γ versus la inoservabilidad de Λ. En el espacio euclideo habı́amos introducido un aparato que distingue las rectas de las curvas. Preguntémonos ahora que le ocurre al indicador de la carretilla indicadora del Sur cuando se “engaña” a este aparato haciéndole funcionar en una superficie curva. Su reacción es . . . ¡indicar 0 cuando la carretilla sigue una geodésica! Es decir, exactamente ¡lo mismo que hace un acelerómetro real cuando está en caı́da libre! Para acabar de presentar la analogı́a con la idea de curvatura en una superficie, recordemos que allı́ la curvatura aparece, entre otras manifestaciones, como aceleración en la separación relativa entre geodésicas. Si se mide el progreso a lo largo de la geodésica fiducial por la longitud recorrida l y la separación por la distancia η(l) entre ambas a lo largo de las geodésicas ortogonales a la fiducial, la ecuación que regula la aceleración de la separación y que mide el “comportamiento no thalesiano” es: d2 η(l) ≈ −K η(l) dl2 (2.100) No es necesario ningún esfuerzo para percibir la analogı́a con la aceleración de la separación relativa entre dos partı́culas test en caı́da libre en el campo gravitatorio. II. Gravitación Newtoniana como curvatura . . . 2005-06 42 Como vimos en la primera sección, en el campo gravitatorio de la Tierra, un cálculo extremadamente simple indica que la separación ηh (t) entre dos partı́culas en caı́da libre y situadas inicialmente en reposo a la misma altura (por tanto con separación horizontal), satisface la ecuación: GM⊕ d2 ηh (t) ≈− ηh (t) dt2 r3 mientras que si la separación es inicialmente vertical, la ecuación es −2GM⊕ d2 ηv (t) ≈− ηv (t) dt2 r3 donde r > R⊕ es la distancia al centro. La identidad formal de estas ecuaciones con (2.100) es absoluta, y simplemente sugiere que es posible una descripción geométrica de la gravitación (incluso newtoniana) como curvatura del espacio–tiempo en donde los ⊕ ⊕ y −2GM deberán interpretarse como curvaturas en los 2–planos (h0) coeficientes GM r3 r3 y (v0) que contienen la dirección horizontal h (o vertical v) y la dirección temporal 0, para el caso de un campo central creado por una masa M , que es exactamente lo que se deriva del tensor de curvatura de la conexión Γ. De este modo la primera causa de desagrado en la formulación convencional de la T.N.G. —mencionada en la primera sección— desaparece a la vez que el espacio absoluto. La segunda causa de desagrado, la acción a distancia, permanece, ya que está ligada al tiempo absoluto y a la posibilidad —caracterı́stica del espacio-tiempo newtoniano— de velocidades arbitrariamente altas para la propagación de las interacciones. Esta acción a distancia sólo desaparece en una teorı́a propiamente relativista como es la teorı́a de Einstein de la gravitación, en la que la gravitación se propaga a velocidad finita c. Sistemas de Referencia inerciales versus no inerciales: ¿En qué queda la discusión? A casi todos los efectos, la discusión sobre el status de los SRI y SRnI, que en la interpretación convencional se distinguen por su diferente movimiento con respecto al espacio absoluto, queda dentro de esta formulación alternativa en casi nada. Una vez que se reconoce que la descripción correcta del movimiento real en un campo gravitatorio requiere una conexión, lo único relevante es conocer los coeficientes de conexión en el sistema de coordenadas en que estemos trabajando. Que este sea o no inercial carece de ningún significado fundamental; todo lo que es necesario es emplear las ecuaciones generalmente covariantes, que son válidas en cualquier sistema de referencia y de coordenadas, y emplearlas correctamente en el sistema particular en el que hayamos escogido trabajar. De nada sirve entrar en discusiones sobre la terminologı́a, sobre todo si está consagrada por un uso de siglos. Pero sı́ conviene ser consciente de lo confusa que resulta la nomenclatura impuesta por la tradición newtoniana. Al menos tras la discusión anterior se puede describir claramente la situación. Si no existiera gravitación, serı́a aceptable identificar los SRI como aquellos en que en coordenadas espaciales apropiadas (de tipo II. Gravitación Newtoniana como curvatura . . . 2005-06 43 cartesiano) la conexión inercial tiene todos los coeficientes nulos. Pero cuando hay un campo gravitatorio, la conexión inercial resulta inobservable, y conviene eliminarla por completo en favor de la conexión Γ, en la que resulta que no hay ningun SR, de ningún tipo, en el que todos los coeficientes se anulen. Desde este punto de vista podrı́amos decir que en presencia de un campo gravitatorio real no hay, estrictamente hablando, SRI. Pero esto no es obstáculo para poder escribir las ecuaciones de movimiento, las de campo, etc., en coordenadas en las que la conexión tiene las expresiones (2.60)–(2.61) que globalmente son, en cierto sentido, las más simples posible. Cabe entender estos sistemas de referencia como lo que queda de la vieja idea de SRI en la interpretación geométrica de la gravitación; por ello les denominaremos Sistemas de referencia globalmente inerciales (SRgI). En un sistema globalmente inercial (y en coordenadas cartesianas en el 3-espacio), sólo los ΓI 00 son diferentes de 0; se trata del tipo de sistemas más conveniente para discusiones generales. Por ejemplo, el sistema de coordenadas heliocéntrico (origen en el centro de masas del sistema solar, ejes orientados según las estrellas fijas, no rotante) es de este tipo, y es el sistema al que implı́citamente se refieren las afirmaciones usuales de que las órbitas de los planetas son elipses, las de los cometas elipses o hipérbolas, etc. ‘Bien adaptado’ significa en este caso, que muchos de los coeficientes de la conexión son idénticamente nulos. Nótese que esta acepción del término SRgI, calificada por el adjetivo ‘globalmente’ es estrictamente hablando diferente de la idea (inobservable) de SRI en ausencia de gravitación. Los sistemas de referencia localmente inerciales Esto abre una pregunta interesante: ¿existe algún sistema de referencia en el que la expresión de la conexión sea aún más “sencilla”? Todo depende de qué se entienda por sencilla. Basta un vistazo a (2.85)–(2.87) para concluir que la expresión de la conexión en sistemas de referencia acelerados con respecto a un SRgI es, en general, más complicada que en un SRgI. Pero entre los sistemas no inerciales es posible encontrar ciertos sistemas (que con la interpretación tradicional serı́an SRnI y que sin embargo corresponden mucho mejor, aunque sea sólo localmente a la idea newtoniana original de sistema de referencia inercial), y que tienen sobre aquellos la ventaja de ser observables. Estos sistemas tienen una gran importancia en la teorı́a de Einstein y se denominan sistemas de Referencia localmente inerciales, SRlI; para mayor confusión del lenguaje, desde el punto de vista newtoniano convencional, estos sistemas deberı́an ser calificados como no inerciales. Veamos cómo se llega a estos sistemas. En primer lugar, escribamos la conexión en un SRnI de tipo restringido, al que permitimos que pueda moverse relativamente a un SRgI con traslación arbitraria, eventualmente acelerada, pero cuyos ejes de coordenadas no roten con respecto al SRI. La relación entre las coordenadas de un suceso arbitrario en el sistema SRgI original y en el nuevo sistema, que llamaremos Sistema de referencia no rotante (SRnr) es: xi = δ i I xI + ai (t). (2.101) de donde sólo los términos en ai (t) van a aparecer en la conexión; como no hay rotación se tiene Ωi j (t) = 0. El SRnr (i) se mueve con respecto al SRgI (I) con un movimiento exclusivamente de traslación y el origen del SRnr (xi = 0) se mueve en el SRI como II. Gravitación Newtoniana como curvatura . . . 2005-06 44 t → xI (t) = −δ I i ai (t). En este tipo de sistemas de coordenadas las componentes de la conexión son: Γı̂ 00 (t, xn ) = δ ı̂m̂ • d2 aı̂ (t) d2 aı̂ (t) ∂ϕ ı̂ n − = g , (t, x ) − ∂xm̂ dt2 dt2 (2.102) Γı̂ 0ĵ = Γı̂ ĵ0 = 0, (2.103) Γı̂ ĵ k̂ = 0. (2.104) ejercicio 2.25. ¡Comprobar! Aparentemente la expresión es un poco más complicada que la (2.61). Pero nótese que tenemos una libertad en la elección de ai (t) que corresponde a un movimiento de traslación arbitrario del sistema de referencia. Resulta que podemos aprovechar esa libertad para anular todas las componentes de la conexión a lo largo de una linea temporal de caı́da libre en el espacio-tiempo (pero sólo en esa lı́nea en el caso de que realmente haya campo gravitatorio). Esto se ve directamente en (2.102), ya que si fijamos una lı́nea temporal (esto es, especificamos un movimiento t → xi(0) (t)), entonces g ı̂ (t, xn(0) (t)) pasa a ser una función de t sólo, y podemos escoger un ai (t) de manera que sobre esa lı́nea se tenga Γı̂ 00 (t, xn(0) (t)) = 0. [Nótese que si el campo gravitatorio no es uniforme y depende realmente de x, entonces mediante este procedimiento se consigue sólo la anulación de la conexión sobre la lı́nea escogida; si el campo fuera estrictamente uniforme, entonces el término debido a ai (t) podrı́a cancelar el campo gravitatorio en toda una región] Si este argumento no es claro, veamoslo de otra manera: sea t → x0 (t) un determinado movimiento (fiducial) de caı́da libre, que por tanto suponemos descrito por d2 xI(0) (t) dt2 =δ IM ∂ϕ = g I (t, x(0) (t)) ∂xM (t,x(0) (t)) y consideremos un sistema no inercial determinado por dos condiciones: estar en caı́da libre con el movimiento t → x0 (t) y ser no rotante. Este sistema, que denominaremos SRnrcl, está relacionado con el SRI inicial mediante (2.48) con la elección para la rotación y la traslación: Rı̂ I (t) = δ ı̂ I , aı̂ (t) = −δ ı̂ I xI0 (t), (2.105) de modo que las expresiones del cambio de sistema son: xı̂ = δ ı̂ I (xI − xI(0) (t)). (2.106) y en particular el movimiento descrito en el SRI por t → xI (t) resulta estar descrito en el SRnrcl por xı̂ (t) = δ ı̂ I (xI (t) − xi(0) (t)). (2.107) En concreto esto significa que el movimiento xI (t) = −xI(0) (t), que es solución de las ecuaciones de movimiento, y por tanto una autoparalela, aparece en el SRnrcl como II. Gravitación Newtoniana como curvatura . . . 2005-06 45 xı̂ (t) = 0. Y si t → xı̂ (t) = 0 es una autoparalela, necesariamente todos los coeficientes de la conexión se anulan en el SRnrcl a lo largo de la lı́nea xı̂ = 0. Ya sabı́amos que si hay un campo gravitatorio no es posible escoger un sistema de referencia en el que todas las componentes de la conexión Γ se anulen en todo el espacio-tiempo. Ahora vemos que existen infinidad de sistemas de referencia localmente inerciales, cada uno asociado a un movimiento posible de caı́da libre y no rotante, en los cuales todas las componentes de la conexión se anulan a lo largo de la autoparalela de caı́da libre fiducial; el prototipo de estos sistemas de referencia es el sistema ligado al ascensor en caı́da libre de Einstein: la aceleración que un observador ligado a la Tierra atribuirı́a a la caı́da del ascensor se compensa en el interior con la aceleración debida a la gravedad, produciendo una cancelación perfecta de ambas fuerzas en el centro de masas del ascensor. Es conveniente entender correctamente que si existe campo gravitatorio, el movimiento relativo de dos de tales sistemas localmente inerciales no es un movimiento relativo uniforme; al contrario, presenta la aceleración relativa que discutimos al hablar de las fuerzas de marea. Ası́ debe quedar claro que los SRnrcl o sistemas localmente inerciales no son inerciales desde el punto de vista newtoniano tradicional. Para describir lo que ocurre en las cercanı́as de la lı́nea de universo de una partı́cula en caı́da libre los sistemas SRlI son claramente mejores que los globalmente inerciales, ya que en ellos se aúnan la anulación (en todo el espacio-tiempo) de casi todas las componentes de la conexión que se da en un SRgI y la anulación, sólo a lo largo de un movimiento particular, de las restantes componentes de Γµ αβ que son no nulas en un SRgI. Es fundamental entender que esta cancelación se da sólo a lo largo de la lı́nea de universo del movimiento fiducial, pero no en el resto del espacio-tiempo. Tan sólo es posible escoger un sistema de coordenadas en el que todas las componentes de la conexión sean nulas en todo el espacio–tiempo si el tensor de curvatura se anula, esto es, si no existe ningún campo gravitatorio. En un sistema de referencia en caı́da libre con una partı́cula fiducial, la derivación covariante de la separación entre el movimiento fiducial y otro próximo se reduce a la derivada ordinaria (pues los términos extra en (2.90) son nulos), pero el segundo miembro de la ecuación de desviación geodésica contiene el tensor de curvatura, que naturalmente, no se anula en general sobre la trayectoria de la partı́cula fiducial (ya que la anulación de este tensor no depende de nuestra habilidad para escoger coordenadas sino de si la geometrı́a del espacio tiempo es curva o no, es decir, de si hay o no campo gravitatorio). Es usual encontrar en la literatura mención a la posibilidad de escoger sistemas de coordenadas en los que todas las componentes de la conexión se anulen en un punto dado, sistemas que se suelen denominar localmente galileanos o minkowskianos, según el contexto sea la teorı́a de Newton o la de Einstein. Los sistemas en caı́da libre y sin rotación son claramente de este tipo. Nuestra discusión muestra que es posible encontrar sistemas de coordenadas que sean localmente galileanos o minkowskianos no sólo en un punto, sino también a lo largo de una lı́nea de universo de una partı́cula fiducial en caı́da libre, ya que en ellos se consigue anular todas los componentes de la conexión a lo largo de una autoparalela dada. Un último comentario para acabar: el SRgI heliocéntrico habitual es, de hecho, el SRlI asociado a la caı́da libre del centro de masas del sistema solar, de manera que vemos que el sistema de referencia globalmente inercial más importante en la astronomı́a observacional del sistema solar resulta ser, a la postre, un sistema localmente inercial. II. Gravitación Newtoniana como curvatura . . . 2005-06 46 En este sistema, a lo largo de la lı́nea de universo del centro de masas del sistema solar (situado muy cerca del centro del Sol), todas las componentes de la conexión Γ se anulan. Conforme nos vamos alejando del centro, las componentes Γi 00 se van haciendo progresivamente más importantes, hasta que en la región en la que se mueven los planetas, ya en el exterior del Sol y lejos de él, la conexión adopta una forma en la que la naturaleza localmente inercial del SR se hace difı́cil de reconocer [Para analizar este aspecto es pertinente recurrir a la expresión del potencial gravitatorio creado por una masa central simétrica de densidad y tamaño finito, tanto en el exterior como en el interior, como se vió en un ejercicio en la primera sección]. El campo gravitatorio central simétrico descrito en la interpretación geométrica de la gravitación newtoniana Esta sección se dedica a un ejercicio. Se trata de describir, mediante la conexión Γ, el campo gravitatorio producido por un cuerpo esférico, de masa M y radio R, como el Sol, del cual tambien ignoramos la rotación (en el caso del Sol, la rotación es realmente bastante lenta, del orden de 1 vuelta en 25 a 30 dı́as). Vamos a comenzar estableciendo un sistema de referencia ‘inercial’ adecuado (de hecho, se trata del ‘sistema heliocéntrico’, no rotante y en caı́da libre con el centro de masas del sistema solar), en el que vamos a usar alternativamente las coordenadas cartesianas usuales (xI ≡ x, y, z) y las polares convencionales (r, θ, φ). Las relaciones entre ellas son bien conocidas. Imaginemos primero que no hay campo gravitatorio. Entonces la conexión gravitatorio-inercial Γ coincide con la puramente inercial, que tiene nulas todas sus componentes en coordenadas cartesianas. Pasando a polares, se encuentran las siguientes componentes: Λt rt = Λt tr = 0, Λr tt = 0, demás Λt µν = 0 Λr rr = 0, Λr θθ = −r, Λr φφ = −r sin2 θ, demás Λr µν = 0 Λθ rθ = Λθ θr = 1/r, Λθ φφ = − sin θ cos θ, demás Λθ µν = 0 Λφ rφ = Γφ φr = 1/r, Λφ θφ = Λφ φθ = 1/ tan θ, demás Λφ µν = 0 donde la presencia de los coeficientes de conexión no nulos se debe a la elección de coordenadas no cartesianas. • ejercicio 2.26. Comprobar! Pasemos ahora a considerar la conexión que describe el campo gravitatorio (2.60)– (2.61). Ahora el potencial está dado, en el exterior de la masa M , por ϕ(t, x) = −GM/r, y en coordenadas cartesianas los únicos coeficientes de conexión no nulos son: Γx tt = • GM x , 3/2 (x2 + y 2 + z 2 ) Γy tt = GM y , 3/2 (x2 + y 2 + z 2 ) Γz tt = GM z 3/2 (x2 + y 2 + z 2 ) , 2.27. En el interior del cuerpo que crea el campo, supuesto de densidad constante ρ0 , masa M y radio R y en reposo, comprobar que para los coeficientes de la conexión se tiene: ejercicio Γx tt = GM x , R3 Γy tt = GM y , R3 Γz tt = GM z , R3 II. Gravitación Newtoniana como curvatura . . . 2005-06 47 que efectivamente se anulan en el centro del cuerpo, como era de esperar ya que el sistema de coordenadas que estamos usando es el sistema no rotante en caı́da libre con la masa central que crea el campo. La simetrı́a esférica del problema aconseja el uso de coordenadas polares en el espacio. Limitando ya de ahora en adelante nuestra atención a la zona exterior, x2 +y 2 +z 2 > R2 , los coeficientes de la conexión de caı́da libre en estas coordenadas polares resultan: Γt rt = Γt tr = 0, Γr tt = GM , r2 Γr rr = 0, demás Γt µν = 0 Γr θθ = −r, Γθ rθ = Γθ θr = 1/r, Γφ rφ = Γφ φr = 1/r, Γr φφ = −r sin2 θ, demás Γr µν = 0 Γθ φφ = − sin θ cos θ, demás Γθ µν = 0 Γφ θφ = Γφ φθ = 1/ tan θ, demás Γφ µν = 0 (2.108) La inclusión explı́cita en (2.108) de algunos coeficientes de conexión que resultan ser nulos es intencionada para facilitar la comparación con el problema análogo en la teorı́a de Einstein. Debe notarse que la masa M que crea el campo gravitatorio aparece, a través del producto GM en un sólo coeficiente Γr tt , que en cierto sentido recoge por completo la presencia del campo gravitatorio en la conexión; los restantes coeficientes no nulos provienen del mero hecho de usar coordenadas polares, por lo que en ellos no aparece GM . La simetrı́a esférica del problema está detrás de esta ‘simplificación’ en los terminos ‘gravitatorios’ de la conexión (en comparación con las expresiones en cartesianas), a costa de introducir algunos coeficientes no nulos que se originan al abandonar las coordenadas espaciales cartesianas y pasar a polares. Ahora podemos escribir explı́citamente la ecuación de las autoparalelas. Veamos sucesivamente las cuatro ecuaciones d2 xµ dxα dxβ µ + Γ = 0, αβ dτ 2 dτ dτ (2.109) en el sistema de coordenadas que estamos usando. Comencemos como siempre por la ecuación µ = t. Como todos los Γt αβ son nulos, de la componente µ = t de la ecuación se concluye, exactamente igual que en (2.62) que τ = t. Daremos por hecha esta sustitución en las demás ecuaciones que siguen. Sigamos con la ecuación µ = θ. Los únicos Γθ αβ no nulos son Γθ rθ = Γθ θr y Γθ φφ , por lo que la componente µ = θ de la ecuación de las autoparalelas: 2 dθ dφ dφ d2 θ θ θ + 2Γ θφ + Γ φφ =0 2 dt dt dt dt se reduce sustituyendo los coeficientes Γθ µν según (2.108) a: d2 θ 1 dθ dφ −2 − sin θ cos θ 2 dt r dt dt dφ dt 2 =0 (2.110) Es claro que θ(t) = π/2 es solución de esta ecuación; de hecho es la solución con condiciones iniciales θ(0) = π/2, dθ dt (0) = 0. Esto traduce el bien conocido hecho de que II. Gravitación Newtoniana como curvatura . . . 2005-06 48 el movimiento es plano; escogiendo adecuadamente la orientación de las coordenadas polares podemos suponer que el movimiento ocurre siempre en el plano ‘ecuatorial’ θ(t) = π/2, cosa que supondremos en lo sucesivo. Pasamos ahora a la ecuación µ = φ. Los dos coeficientes no nulos del tipo Γφ αβ se leen en (2.108) y son Γφ rφ = Γφ φr = 1/r, Γφ θφ = Γφ φθ = 1/ tan θ. Sustituyendo se encuentra la componente φ de la ecuación de las autopararelas como: 1 dr dφ 1 dφ dθ d2 φ −2 −2 =0 2 dt r dt dt tan θ dt dt que en el caso particular de que θ(t) = π/2 queda: d2 φ 1 dr dφ −2 =0 2 dt r dt dt (2.111) Esta ecuación tiene una integral primera; por manipulaciones directas se comprueba que si φ(t) satisface la ecuación, entonces d dt r 2 dφ dt = 0, es una constante del movimiento, el momento lo que implica que la cantidad r2 dφ dt angular por unidad de masa, L = L/m. Esta ecuación expresa la bien conocida ley de las áreas de Kepler: dφ r2 =L (2.112) dt Finalmente queda sólo la ecuación radial, que en vista de los coeficientes no nulos del 2 r r tipo Γr αβ que se leen en (2.108) Γr tt = GM r 2 , Γ θθ = −r, Γ φφ = −r sin θ se escribe en su total generalidad: d2 r GM + 2 + (−r) dt2 r dθ dt 2 2 + (−r sin θ) dφ dt 2 =0 Para el movimiento que estamos estudiando θ(t) = π/2; si además se introduce la integral primera (2.112), queda la ecuación radial en la forma bien conocida: d2 r GM L2 + − =0 dt2 r2 r3 (2.113) que a su vez también tiene una integral primera, la energı́a: por manipulación directa se comprueba que si r(t) satisface la ecuación, entonces d dt 1 2 dr dt 2 GM 1 L2 − + r 2 r2 ! =0 II. Gravitación Newtoniana como curvatura . . . 2005-06 49 de donde la cantidad entre paréntesis es una constante del movimiento, que denominaremos E y que corresponde a la energı́a total de la partı́cula test por unidad de masa E = Etot /m: 2 GM 1 L2 1 dr − =E (2.114) + 2 dt r 2 r2 Formalmente, esta ecuación es la ecuación de conservación de la energı́a (por unidad de masa) de una partı́cula de masa m que se mueve en un potencial unidimensional 1 L2 radial equivalente Veff = −m GM + m r 2 r 2 , idea de la que se puede derivar de manera directa información cualitativa sobre el movimiento. Las ecuaciones obtenidas permiten resolver completamente el problema del movimiento de una partı́cula en este campo gravitatorio. Por ejemplo, si se quiere conocer la forma de la órbita, lo mejor es encontrar la ecuación diferencial para la función r(φ): Substituyendo dr dr dφ L dr = = 2 dt dφ dt r dφ en (2.114) se encuentra la ecuación que deben satisfacer las funciones r(φ): 1 E= 2 L dr r2 dφ 2 − GM 1 L2 + r 2 r2 (2.115) Como es muy bien conocido, la solución general de esta ecuación es r(φ) = p 1 + e cos(φ − φ0 ) (2.116) que representa una cónica de excentricidad e con un foco en el origen. La ecuación de la órbita involucra tres constantes. Una de ellas φ0 corresponde a la orientación de la órbita dentro del plano en el que se realiza el movimiento (para ser preciso, determina la orientación del periastro, el punto de la órbita más cercano al centro). Las otras dos p, e están ligadas con las dos constantes del movimiento E, L mediante las ecuaciones L2 , p= GM • ejercicio 2.28. • ejercicio 2.29. s e= 1+ 2EL2 (GM )2 Comprobar que efectivamente (2.116) es solución de la ecuación (2.115). Escribir la ecuación de las órbitas en términos de la variable auxiliar u = 1/r. Derivando otra vez en esa ecuación con respecto a φ, encontrar la ecuación de las órbitas en su forma llamada de Binet: GM d2 u + u(φ) − 2 = 0 dφ2 L cuya solución en la forma u(φ) − GM L2 ∝ cos(φ − φ0 ) es obvia.