TRABAJO FIN DE ESTUDIOS MÁSTER INTERUNIVERSITARIO EN MODELIZACIÓN MATEMÁTICA, ESTADÍSTICA Y COMPUTACIÓN Determinación de la probabilidad de escape en un sistema galáctico Wafaa Kanaan Tutor: Víctor Lanchares Barrasa Facultad de Ciencias, Estudios Agroalimentarios e Informática Curso 2011-2012 Determinación de la probabilidad de escape en un sistema galáctico, trabajo fin de estudios de Wafaa Kanaan , dirigido por Víctor Lanchares Barrasa (publicado por la Universidad de La Rioja), se difunde bajo una Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 3.0 Unported. Permisos que vayan más allá de lo cubierto por esta licencia pueden solicitarse a los titulares del copyright. © © El autor Universidad de La Rioja, Servicio de Publicaciones, 2012 publicaciones.unirioja.es E-mail: publicaciones@unirioja.es UNIVERSIDAD DE LA RIOJA Facultad de Ciencias, Estudios Agroalimentarios e Informática TRABAJO FIN DE MÁSTER Máster en Modelización Matemática, Estadı́stica y Computación Determinación de la probabilidad de escape en un sistema galáctico Alumna: Director: Wafaa Kanaan Vı́ctor Lanchares Barrasa Logroño, 7 de septiembre de 2012 Introducción Todas las estrellas que podemos ver a simple vista en una noche oscura pertenecen a nuestra galaxia, la Vı́a Láctea. Determinar su forma y estructura no es sencillo y a ello dedicaron su esfuerzo los astrónomos desde el trabajo pionero de William Herschel [6]. La figura 1 muestra, de manera esquemática, la estructura de la Vı́a Láctea, en la que puede verse su forma espiral, pero también que se trata de un disco plano con un engrosamiento central. 30 kpc C N C S Sol Sol Figura 1: La Vı́a Láctea vista desde arriba se muestra como un sistema circular con brazos espirales. Vista de lado aparece como un disco con un engrosamiento central. El Sol está situado aproximadamente a dos tercios de distancia del centro C. La Galaxia gira alrededor de un eje central, donde N y S representan los polos norte y sur galácticos respectivamente. El diámetro estimado del disco es de unos 30 kiloparsecs, donde un parsec es una unidad de distancia que equivale a 3.26 años luz. Por el contrario, el espesor del disco es tan solo de un kiloparsec. La galaxia gira alrededor de su eje, pero no como un sólido rı́gido, sino que las estrellas giran individualmente alrededor del centro galáctico, preferentemente en órbitas casi circulares. Por ejemplo el Sol tarda unos 200 millones de años en completar una órbita. Se cree que hay unos 100 mil millones de estrellas en la galaxia, aunque también hay presente materia oscura, representada en la figura 1 por una lı́nea de trazo negro. La distancia entre estrellas dentro de la galaxia fueron determinadas hacia mediados del siglo XIX por el método de paralaje trigonométrica. Sin iii iv Introducción Figura 2: Clasificación de Hubble de los diferentes tipos de galaxias, atendiendo a su forma. Las galaxias que no responden a este esquema se clasifican como irregulares (I). embargo, este método tiene un rango de aplicación que está en torno a 100 parsecs. A partir de 1912, se pudo estimar la distancia a un tipo especial de estrellas, las variables Cefeidas, lo que permitió probar que nuestra galaxia era mayor de lo que se pensaba previamente. Gracias a la observación de Cefeidas, en la década de 1920, Hubble [7] descubrió que ciertas nebulosas brillantes, que hasta entonces habı́an sido consideradas parte de la Vı́a Láctea, eran en realidad objetos que estaban muy alejados de ella. Su descubrimiento desterró la creencia de que todo el universo observable se reducı́a a nuestra propia galaxia y se vio que estas nebulosas eran en realidad otras galaxias, es decir, estructuras con un enorme número de estrellas, gas, polvo y materia oscura. La galaxia más cercana a la nuestra es la Galaxia de Andrómeda (M31) y tiene una estructura espiral similar a la nuestra. Las galaxias espirales, como ası́ se denominan a estas galaxias, son probablemente las más numerosas entre las galaxias brillantes. Comparten con la Vı́a Láctea las caracterı́sticas principales, como son la rotación, el aplanamiento, el engrosamiento central y la presencia de materia oscura. Según la clasificación de Hubble, de 1926, se subdividen en diferentes tipos: Sa, Sb y Sc, en orden decreciente, según la importancia del núcleo, o engrosamiento central, en relación con el disco que lo rodea. Algunas de estas galaxias tienen en la parte central estructuras con aspecto de barra y a este tipo de galaxias se les denomina espirales barradas y, con el mismo criterio que las espirales, se subdividen en SBa, SBb y SBc. Mientras que las galaxias espirales son las más abundante entre las galaxias brillantes, el grupo más numeroso entre todas las galaxias es el que se clasifica como elı́pticas. Estas tienen forma elipsoidal, apenas rotan y casi no tienen gas y polvo. Las galaxias elı́pticas se subdividen en E0, E1, . . . , E7, Introducción v Elíptica Espiral Figura 3: Curvas isofotas para galaxias elı́pticas y espirales. donde el número se va incrementando a medida que la forma de la galaxia se va lejando más de un cı́rculo. La figura 2 muestra, de manera esquemática, la clasificación de las galaxias, según el sistema propuesto por Hubble. A diferencia de las estrellas, que presentan una imagen puntual, las galaxias tienen apariencia nebulosa, con las formas descritas previamente. Gracias a los dispositivos de captación de luz disponibles actualmente, es posible obtener una distribución precisa de la luz proveniente de estos objetos. Esta distribución queda descrita de manera conveniente mediante las isofotas, que son curvas de nivel de igual intensidad lumı́nica (véase la figura 3). El problema principal estriba en determinar dónde termina una galaxia, ya que no hay un borde definido, debido a la disminución gradual del brillo desde el centro hacia la periferia. En este sentido, para estimar el tamaño de una galaxia se usa el radio de Holmberg, que corresponde a la isofota con un brillo de 26.5 magnitudes por segundo de arco cuadrado. Sin embargo, este lı́mite no es del todo real ya que, en la década de 1970, la observación de las nubes de hidrógeno que rodean las galaxias espirales puso de manifiesto que los tamaños de la galaxias debı́an de ser mucho mayores que la parte visible observable. No obstante, este hecho también se puede deducir del estudio sistemático de las órbitas de las estrellas, principalmente en las galaxias dominadas estelarmente, es decir, con poco gas y polvo, como son las elı́pticas y las espirales de tipos tempranos (Sa, Sb, SBa, SBb). De este modo, podemos decir que el estudio de las órbitas estelares dentro de las galaxias constituye una importante fuente de información sobre las mismas. De hecho, su estudio no solo es importante por conocer los tipos de órbitas que se dan en estos sistemas, sino porque también las órbitas son necesarias para construir modelos autoconsistentes de galaxias. Por autoconsistente podemos entender un modelo en el que se cumple que el potencial gravitatorio galáctico, creado por las estrellas, gas y polvo, da lugar a una distribución de masas similar a la que se deduce de las isofotas. Pero además, la superposición de todas las órbitas estables, que se derivan de la acción del potencial gravitatorio galáctico, reproducen la forma de la Introducción vi galaxia. En este sentido podemos hablar de pares potencial-densidad que tengan la propiedad de autoconsistencia. Estos modelos están creados teniendo en cuenta que la función potencial Φ(x, y, z) satisface la ecuación de Poisson (ver, por ejemplo, [1, 4, 5]) ∆Φ(x, y, z) = 4πGρ(x, y, z), donde ∆ representa el operador de Laplace, G es la constante de gravitación universal y ρ(x, y, z) es la función de densidad. Los modelos clásicos más usados [1, 3] son: 1. Modelo de Plummer GM , ΦP = − √ 2 R + b2 donde R2 = x2 +y 2 +z 2 , M es la masa de la galaxia y b es una constante. 2. Modelo de Kuzmin ΦK = − q GM r2 + (a + |z|)2 , con r2 = x2 + y 2 . 3. Modelo de Miyamoto-Nagai Φ = −q GM , √ 2 2 2 2 r + (a + z + b ) donde a y b son constantes. Obsérvese que este modelo generaliza los dos anteriores, ya que si a = 0 se tiene el modelo de Plummer y si b = 0 el de Kuzmin. 4. Modelo logarı́tmico 1 z2 ΦL = v02 ln RC2 + r2 + 2 , 2 qΦ " # donde v0 , RC y qΦ son constantes con |qΦ | < 1. Estos son los potenciales usados con mayor frecuencia, aunque hay otros modelos que se usan en la literatura (para una relación amplia de los diferentes modelos de potencial puede consultarse el libro de Binney & Tremaine [1]). Introducción vii En cualquier caso, cerca del centro galáctico todos los potenciales anteriores admiten un desarrollo en serie de potencias de la forma Φ(x, y, z) = a r2 + b z 2 + c r2 z 2 + d r4 + e z 4 , (1) con a, b, c, d y e parámetros que dependen del modelo y de las constantes del mismo. Nosotros consideraremos el caso en que a = b y d = e. Tomando como potencial galáctico la expresión anterior, más manejable y sencilla, numerosos autores han estudiado el comportamiento de los sistemas galácticos desde diferentes puntos de vista, fundamentalmente desde el de los sistemas dinámicos (véase [3] para una compilación extensa de referencias). Considerado como un sistema dinámico, se pueden aplicar las numerosas herramientas que existen para su estudio con el fin de obtener información relevante. En concreto, se puede establecer un atlas de soluciones periódicas con su tipo de estabilidad, se puede estudiar el grado de regularidad del sistema o la dinámica de escape. A esta última parte vamos a dedicar el objeto de esta memoria. Un sistema con escape es aquel en el que si la energı́a del sistema supera un cierto lı́mite, algunas órbitas pueden escapar al infinito. Existen numerosos ejemplos de sistemas con escape y entre ellos se encuentran los modelos galácticos con un potencial como el anterior. Para estos sistemas un parámetro de importancia es la probabilidad de escape para un determinado nivel de energı́a. Esta probabilidad se puede obtener de diversas maneras, una de las cuales se basa en la aplicación del Método de Montecarlo. Para ello suelen tomarse grandes muestras con diferentes tipos de órbitas evaluando, con un criterio fiable, cuándo la órbita escapa o no. Lo que nos proponemos hacer en esta Memoria es estimar el tamaño óptimo de la muestra que nos dé con cierta precisón, en un margen de confianza establecido, la probabilidad de escape. Esto, sin duda, contribuye a optimizar el cálculo de probabilidades de escape, aunque, como se verá, el problema es más difı́cil de lo que parece, ya que la forma en la que se tome la muestra influye en gran medida en la probabilidad obtenida. Este es tanto más acusado para probabilidades bajas. viii Introducción Índice general Introducción III 1. Planteamiento del problema 1.1. Potencial y curvas de velocidad cero . . . 1.2. Equilibrios . . . . . . . . . . . . . . . . . 1.2.1. Equilibrios en el plano z = 0 . . . 1.2.2. Equilibrios fuera del plano z = 0 . 1.3. Mecanismo de escape . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 3 4 5 7 9 2. Probabilidad de escape por el método de Monte Carlo 2.1. Determinación del tamaño muestral . . . . . . . . . . . . 2.2. Cálculo de la probabilidad para Lz constante . . . . . . . 2.2.1. Muestra uniforme frente a muestra aleatoria . . . 2.3. Probabilidad de escape con energı́a fija . . . . . . . . . . . . . . . . . . . . . . 15 17 19 22 26 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Conclusiones 29 Bibliografı́a 31 ix Capı́tulo 1 Planteamiento del problema El problema que vamos a considerar es el de evaluar la probabilidad de escape de una estrella de las inmediaciones del núcleo de la galaxia. En general, los núcleos galácticos presentan una acumulación de masa, que puede ser un agujero negro, y ejercen su atracción sobre las estrellas más distantes del centro, hasta un cierto lı́mite que fijaremos en 1.5 kiloparsecs, es decir estrellas alejadas del centro no más de 4890 años luz. Para estudiar el problema debemos modelar el tipo de atracción que ejerce el núcleo sobre una estrella. El modelo más sencillo serı́a mediante la ley de gravitación de Newton, pero este modelo no recoge bien la estructura real de una galaxia. En el modelo de Newton es como si toda la masa del núcleo galáctico estuviera situada en un punto que se localiza en el centro del mismo. Es por ello que se consideran otros modelos diferentes, aunque, eso sı́, basados siempre en la mecánica clásica. Como se ha dicho en la introducción de esta memoria, las galaxias dominadas estelarmente pueden ser modeladas por potenciales relativamente sencillos, que dan lugar a estructuras autoconsistentes. En estos casos, la fuerza con la que una estrella es atraı́da por el núcleo viene determinada por el potencial. En el modelo que nosostros vamos a considerar, la función de potencial, creada por la atracción del núcleo, va a venir dada por la expresión (1) y que escribiremos como V (r, z) = h i ω2 2 (r + z 2 ) − α(r4 + z 4 ) + 2βr2 z 2 . 2 Aquı́, se ha supuesto que la galaxia tiene simetrı́a de rotación, además de ser simétrica respecto a un plano, que es el denominado plano galáctico. Esto qiere decir que si la galaxia es girada alrededor de un eje perpendicular al plano galáctico, que pasa por el centro de la galaxia, siempre verı́amos la misma figura. Bajo este supuesto, r = x2 + y 2 es la distancia de una estrella al centro de la galaxia, medida sobre el plano galáctico (el plano de simetrı́a); 1 2 Capı́tulo 1. Planteamiento del problema z es la altura de una estrella sobre el plano galáctico; ω es la velocidad angular con que gira la galaxia; α y β son parámetros que dependen de la forma de la galaxia y es un parámetro de escala, que no es relevante, salvo para medir la importancia relativa de los dos términos del potencial. Si a la energı́a creada por el potencial del centro de la galaxia le sumamos la energı́a cinética de la estrella, debida a su velocidad, se obtiene la función de energı́a L2 1 H = (p2r + p2z ) + z2 + V (r, z), 2 2r donde pr es la velocidad radial (pr = dr/dt), pz es la velocidad vertical ~ × R, ~˙ (pz = dz/dt) y Lz es la tercera componente del momento angular, R ~ = (x, y, z) y R ~˙ = dR/dt. ~ donde R Suponiendo que el sistema considerado es conservativo y, debido a las simetrı́as del problema, tanto H como Lz son constantes, es decir, dH/dt = dLz /dt = 0. Por otra parte, r, z, pr y pz definen un conjunto de variables canónicas, de manera que H es la función hamiltoniana del sistema. De aquı́ se deducen las ecuaciones del movimiento, que son un conjunto de ecuaciones diferenciales que nos indican cómo cambian la posición (r y z) y velocidad (pr y pz ) de la estrella con el tiempo. Estas ecuaciones se escriben como ∂H dr = = pr , dt ∂pr ∂H dz = = pz , ż = dt ∂pz ṙ = ∂H L2 pr =− = 3z − ω 2 r + (4αr3 + 4βrz 2 ), ṗr = dt ∂r r pz ∂H ṗz = =− = −ω 2 z + (4αz 3 + 4βr2 z). dt ∂z (1.1) En este punto, fijaremos los valores de los parámetros que aparecen en el problema, que tomaremos como ω = 1, = 1, α = 0,2, β = −1,2. Con esta elección de valores para ω y , las unidades de medida son: una unidad de longitud = 1 kiloparsec, una unidad de tiempo = 107 años, una unidad de masa = 1 masa solar. 1.1. Potencial y curvas de velocidad cero 3 Los parámetros definidos anteriormente son idénticos para cada estrella, sin embargo, Lz y H dependen de cada una en particular, ya que representan su energı́a y la tercera componente de su momento angular que, obviamente, cambiarán con cada estrella considerada. Dependiendo de estos valores, podemos encontrar dos tipos de movimiento: acotados y no acotados, que denominaremos de escape. En realidad hay un valor crı́tico de la energı́a, que recibe el nombre de energı́a de escape, de manera que por encima de dicho valor la estrella puede escapar de la atracción del núcleo galáctico. 1.1. Potencial y curvas de velocidad cero Para comprender el mecanismo de escape es conveniente estudiar las regiones en las que una estrella puede estar localizada, en función de su energı́a y su momento angular. Esto puede deducirse a partir de la función de potencial efectivo, que se obtiene de H restando ṙ2 + ż 2 . En este caso resulta h i L2z ω2 2 L2z 2 4 4 2 2 + V (r, z) = + (r + z ) − α(r + z ) + 2βr z . 2r2 2r2 2 Como la energı́a, dada por H, se conserva, una vez fijado un nivel de energı́a, el mayor valor del potencial efectivo se alcanza cuando la velocidad es 0, es decir, cuando p2r + p2z = 0. De aquı́ resultan las curvas de velocidad cero, que son las curvas de nivel que se obtienen de Ve = Ve = H para diferentes valores de la energı́a H. La figura 1.1 muestra varias de estas curvas para los valores establecidos de ω = 1, = 1, α = 0,2, β = −1,2 y un valor de Lz = 0,1. Una estrella con energı́a inicial H solo puede desplazarse hacia regiones donde el valor de Ve sea menor que H. Esto es ası́ ya que, si hay una ganancia de velocidad, p2r + p2z será una cantidad mayor que cero, obligando a que Ve sea menor, para que la energı́a se conserve. Por tanto, si una estrella tiene una energı́a que da lugar a una curva de velocidad cero cerrada, su órbita se mantendrá siempre en el interior de dicha curva y la estrella no puede escapar de la atracción del núcleo galáctico. Este es el caso que aparece en la figura 1.1 para un valor de la energı́a igual a 0.2. Por el contrario, si la curva de velocidad cero es no acotada, la estrella puede llegar a escapar de la influencia del núcleo, como en el caso de la figura 1.1 para una energı́a igual a 0.4. Entre estos dos valores de la energı́a se encuentra el valor crı́tico de la misma que separa los movimientos acotados de los de escape. Este valor, 4 Capı́tulo 1. Planteamiento del problema 1.0 0.316513 z 0.5 0.0 0.2 0.2 0.4 -0.5 0.5 -1.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 r Figura 1.1: Diferentes curvas de velocidad cero. Son las curvas de nivel del potencial efectivo Ve para diferentes valores de la energı́a. para Lz = 0,1, es H = 0,316513. Ası́, por debajo de este valor las estrellas están atrapadas en una cierta región, mientras que para valores superiores pueden tener una trayectoria de escape. El cambio de situación está asociado a la aparición de un punto de equilibrio inestable de tipo centro × silla, que se ve claramente en la curva de color rojo de la figura 1.1. Las coordenadas de este punto se pueden obtener resolviendo numéricamente las ecuaciones (1.1) cuando son igualadas a 0. Estas soluciones corresponden a puntos de equilibrio, es decir, puntos en los que una estrella podrı́a permanecer por tiempo indefinido si no actuaran otras fuerzas sobre ella. Cuando Lz = 0,1 se obtienen los siguientes puntos de equilibrio E1,2 ≡ (pr = 0, pz = 0, r = 0,188086, z = ±1,20924), E3 ≡ (pr = 0, pz = 0, r = 0,323203, z = 0), E4 ≡ (pr = 0, pz = 0, r = 1,1144, z = 0). Como vemos hay cuatro equilibrios, dos de los cuales no aparecen reflejados en la figura 1.1. Si los tenemos en cuenta, vemos que si la energı́a se hace mayor que 0,586415 aparecen nuevos canales de escape debidos a los puntos de silla correspondientes a E1,2 (ver figura 1.2, curva azul). 1.2. Equilibrios Los equilibrios dependen del valor de Lz y, en general de los parámetros del sistema. Aunque nosotros hayamos fijado dichos valores, vamos a hacer un análisis más detallado de su existencia ası́ como de su tipologı́a. Igualando 1.2. Equilibrios 5 1.5 0.586415 0.586415 1.0 0.8 0.5 z 0.2 0.0 -0.5 0.316513 0.8 0.2 0.8 0.316513 -1.0 -1.5 0.586415 0.2 0.4 0.6 0.8 1.0 1.2 1.4 r Figura 1.2: Curvas de velocidad cero, cuando Lz = 0,1 y valores de la energı́a superiores. Se puede apreciar que aparecen nuevos canales de escape, asociados a los equilibrios inestables fuera del plano z = 0. a cero las ecuaciones (1.1), se obtiene que para las soluciones de equilibrio debe ser pr = 0, pz = 0, [ω 2 − (4αz 2 + 4βr2 )]z = 0 De la tercera igualdad se sigue que hay dos tipos de equilibrios; aquellos con z = 0 y aquellos en los que z viene dado por √ 2 ω − 4βr2 √ . (1.2) z=± 2 α 1.2.1. Equilibrios en el plano z = 0 Si z = 0, sustituyendo en la tercera ecuación de (1.1), se tiene un equilibrio siempre que r satisfaga la ecuación P(r) ≡ 4αr6 − ω 2 r4 + L2z = 0. (1.3) Aplicando la regla de los signos de Descartes [11], la ecuación (1.3) tiene a lo más dos raı́ces reales positivas. Si α > 0, como es el caso que estamos considerando, a partir de la resultante de P(r) podemos concluir lo siguiente: 1. Si 0 ≤ L2z < ω6 , existen dos equilibrios con z = 0. 1082 α2 2. Si L2z = ω6 existe un solo equilibrio con z = 0. 1082 α2 3. Si L2z > ω6 no hay equilibrios con z = 0. 1082 α2 6 Capı́tulo 1. Planteamiento del problema Además, es fácil ver que, cuando L2z ción (1.3) viene dada por ω6 , la raı́z doble de la ecua= 1082 α2 ω . (1.4) 6α A partir de aquı́, deducimos que, cuando P(r) tiene dos raı́ces positivas r1 y r2 , éstas satisfacen 0 < r1 < rd , r2 > rd . (1.5) rd = √ Una vez estudiada la existencia de estos equilibrios, nos centramos ahora en su naturaleza, analizando su estabilidad lineal. Para ello debemos ver cómo son los valores propios que resultan de la matriz asociada a la linealización del sistema (1.1) en torno a los puntos de equilibrio. Esta matriz resulta ser ∂2H ∂pr ∂r ∂2H ∂pr ∂z ∂2H ∂p2r ∂2H ∂pz ∂r − ∂2H ∂r2 ∂2H ∂pz ∂z ∂2H ∂pz ∂pr M= 2 ∂ H − ∂z∂r 2 2 ∂ H ∂ H − ∂r∂z − ∂r∂p r 2 2 − ∂∂zH2 ∂2H ∂pr ∂pz 2 ∂ H − ∂r∂p z ∂2H ∂p2z 2 ∂ H ∂ H − ∂z∂p − ∂z∂p r z pr =0,pz =0,z=0,r=r1,2 de donde se obtienen los siguientes valores propios q 2 − ω2, λ1,2 = ± 4βr1,2 q λ3,4 = ± 6 2 12αr1,2 − ω 2 r1,2 − 3L2z 2 r1,2 (1.6) . Como en nuestro caso β < 0, los dos primeros valores propios son imaginarios puros, para los dos puntos de equilibrio. Sin embargo, la naturaleza de λ3,4 va a depender de r. En efecto, puesto que estamos en una solución de equilibrio, se cumple P(r) = 0 ⇒ L2z = ω 2 r4 − 4αr6 . Por tanto, q λ3,4 = ± 4 2 4r1,2 (6αr1,2 − ω2) 2 r1,2 , y, teniendo en cuenta (1.4) y (1.5), λ3,4 son imaginarios cuando r = r1 y son reales cuando r = r2 . En consecuencia, cuando r = r1 tenemos un punto de tipo centro y cuando r = r2 el equilibrio es de tipo centro × silla, que habitualmente se denomina simplemente punto de silla. Cuando los dos equilibrios coinciden los valores propios λ3,4 se anulan y se produce una bifurcación que, por la naturaleza de los equilibrios que intervienen, va a ser de tipo silla-nodo. 1.2. Equilibrios 1.2.2. 7 Equilibrios fuera del plano z = 0 El análisis de estos puntos se hace de manera similar al efectuado en la subsección anterior. Para empezar, sustituimos el valor de z dado por la ecuación (1.2) en la tercera de las ecuaciones (1.1). De este modo, para obtener un punto de equilibrio, r ha de verificar la ecuación Q(r) ≡ 4(α2 − β 2 )r6 − ω 2 (α − β)r4 + αL2z = 0. (1.7) El estudio conjunto de las ecuaciones (1.2) y (1.7) es más dificultoso que en el caso z = 0, ya que sus soluciones dependen no solo del valor de Lz , sino también de α y β. Aquı́ analizaremos solo el caso en que α > 0 y β < 0, como es el caso que nos va a ocupar. También supondremos > 0. En estas condiciones, por cada solución de la ecuación (1.7) se obtienen valores válidos de z dados por (1.2), ya que β < 0. Por tanto, solo debemos ocuparnos de estudiar las soluciones de (1.7). Para poder determinar el número de soluciones de (1.7) vemos que la secuencia de coeficientes del polinomio Q(r) es la siguiente potencia r6 coeficiente 4(α2 − β 2 ) signo +/− r5 0 r4 r3 −ω 2 (α − β) 0 − r2 0 r1 0 r0 αL2z + De aquı́ se deduce que si α2 − β 2 > 0 el número de soluciones puede ser a lo sumo dos, mientras que si α2 − β 2 < 0 el número de soluciones es siempre una. Caso α2 − β 2 < 0 Como ya se ha dicho, en este caso siempre hay una solución de la ecuación (1.7), que da lugar a dos puntos de equilibrio situados simétricamente respecto al plano z = 0. Su naturaleza depende de los valores propios de la matriz del sistema lineal asociado. Esta matriz tiene la siguiente estructura M = donde A=− ∂ 2H , ∂r2 0 0 1 0 0 0 A B 0 B C 0 B=− ∂ 2H , ∂z∂r 0 1 0 0 , C=− ∂ 2H , ∂z 2 8 Capı́tulo 1. Planteamiento del problema por lo que los valores propios son solución de la ecuación λ4 − (A + C)λ2 + (AC − B 2 ). Una condición suficiente para que el equilibrio sea de tipo centro × silla es que AC − B 2 < 0. Ahora bien, teniendo en cuenta que se satisface (1.7), resulta AC − B 2 = − 8(α − β) (4βr2 − ω 2 ) (6αr2 + 6βr2 − ω 2 ) . α (1.8) Como α2 − β 2 < 0 y α > 0 y β < 0 es evidente que AC − B 2 < 0 y el punto de equilibrio es de tipo centro × silla. Caso α2 − β 2 > 0 Al igual que se hizo en la subsección 1.2.1, a partir de la resultante de Q(r), podemos concluir lo siguiente: ω 6 (α − β) , existen cuatro equilibrios con z 6= 0, simétri108α2 (α + β)2 cos dos a dos respecto al plano z = 0. 1. Si 0 ≤ L2z < ω 6 (α − β) 2. Si = existen dos equilibrios con z 6= 0, simétricos 108α2 (α + β)2 respecto al plano z = 0. L2z 3. Si L2z > ω 6 (α − β) no hay equilibrios con z 6= 0. 108α2 (α + β)2 Además, puede verse que, cuando L2z = ω 6 (α − β) , la raı́z doble de 108α2 (α + β)2 la ecuación (1.7) viene dada por rd = q w . (1.9) 6(α + β) A partir de aquı́, deducimos que, cuando Q(r) tiene dos raı́ces positivas r1 y r2 , éstas satisfacen 0 < r1 < rd , r2 > rd . (1.10) La estabilidad de los puntos de equilibrio se sigue de (1.8), (1.9) y (1.10). Puede verse que los equilibrios para los que r = r1 son de tipo centro × silla, mientras que aquellos para los que r = r2 son de tipo centro. Cuando los equilibrios coinciden, r1 = r2 , se produce una bifurcación silla-nodo. 1.3. Mecanismo de escape 9 Lz = 0.1 Lz = 0.24 1.0 0.5 0.5 0.5 0.0 0.0 0.0 -0.5 z 1.0 z z Lz = 0.05 1.0 -0.5 -1.0 -0.5 -1.0 0.0 0.2 0.4 0.6 0.8 r 1.0 1.2 -1.0 0.0 0.2 0.4 0.6 0.8 1.0 r 1.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 r Figura 1.3: Curvas de velocidad cero, cuando α2 − β 2 > 0. En la figura ω = = α = 1 y β = −0,5. De izquierda a derecha va aumentando el valor de la tercera componente del momento angular (Lz = 0,05, 0,1 y 0,24), pasando de una situación en la que hay seis equilibrios hasta otra en la que no hay ninguno. En la figura 1.3 pueden verse las curvas de velocidad cero en el caso en que α2 − β 2 > 0, donde se observa la evolución de los puntos crı́ticos a medida que Lz va aumentando, pasando de haber seis equilibrios hasta que no hay ninguno. Además, de las dos bifurcaciones que tienen lugar, siempre se produce primero la que afecta a los equilibrios en el plano z = 0. En ω6 , mientras que efecto, la primera bifurcación se produce cuando L2z = 1082 α2 ω 6 (α − β) la segunda tiene lugar para L2z = . Restando ambos valores 108α2 (α + β)2 resulta ω 6 (α − β) ω6 (3α + β)βω 6 − =− < 0. 108α2 (α + β)2 1082 α2 1082 α2 (α + β)2 1.3. Mecanismo de escape La discusión hecha sobre los de puntos de equilibrio, ası́ como de las correspondientes curvas de velocidad cero, refleja la existencia de diferentes situaciones, en cada una de las cuales el problema de determinar órbitas acotadas o no es diferente. En este trabajo, nos centraremos exclusivamente en el caso en que los parámetros del sistema son los que quedaron fijados anteriormente: ω = = 1, α = 0,2 y β = −1,2. En estas condiciones, se ha visto que siempre existen dos equilibrios fuera del plano z = 0, que son de tipo centro × silla y que hemos denominado E1,2 . Además, mientras Lz < 0,481125 hay otros dos equilibrios en el plano z = 0, uno de tipo centro, 10 Capı́tulo 1. Planteamiento del problema 1.0 Órbita de Lyapunov z 0.5 0.0 0.32 ! 0.5 ! 1.0 0.32 0.2 0.4 0.6 0.8 1.0 1.2 1.4 r Figura 1.4: Órbita de Lyapunov para el nivel de energı́a 0,32, cuando Lz = 0,1. E3 y otro de tipo centro × silla, E4 . Es este último punto de equilibrio el que propicia la separación entre movimientos acotados y no acotados. De hecho, si la energı́a es superior a la del punto E4 , las curvas de velocidad cero se abren en las inmediaciones de E4 . En esa apertura se encuentra una órbita que actúa de puente y es la denominada órbita de Lyapunov. En una primera aproximación podemos calcularla resolviendo el sistema lineal asociado al equilibrio E4 , para un valor de la energı́a ligeramente por encima del de E4 . La estructura del sistema lineal es muy simple, ya que el sistema de ecuaciones (1.1) se desacopla en dos subsistemas, uno en r, pr y otro en z, pz : ( ṙ = pr , ṗr = 4(6αr22 − ω 2 )r, ( ż = pz , ṗz = (4βr22 − ω 2 )z, donde r2 = 1,1144 es la coordenada r de E4 . El primer subsistema está asociado a los valores propios reales λ3,4 (ver Eq. (1.6)), dando lugar a soluciones que no son periódicas. Por el contrario, el subsistema en z es el asociado a los valores propios imaginarios λ1,2 y da lugar a soluciones periódicas. De este modo, en una primera aproximación, la órbita de Lyapunov es tal que r = r2 y aparecerá como un segmento vertical que actúa de puente o puerta en las curvas de velocidad cero. En la figura 1.4 se muestra la órbita de Lyapunov para un valor de la energı́a igual a 0,32. La importancia de la órbita de Lyapunov estriba en el hecho de que toda trayectoria que la cruce en una dirección no puede volver a cruzarla en la 11 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 z z 1.3. Mecanismo de escape 0.32 -0.2 ! 0.4 -0.4 -0.6 0.32 ! 0.2 ! 0.6 0.32 0.2 0.4 0.6 0.8 r 1.0 1.2 1.4 0.32 0.2 0.4 0.6 0.8 1.0 1.2 1.4 r Figura 1.5: Dos órbitas con comportamiento de escape distinto para un nivel de energı́a igual a 0,32 y Lz = 0,1. dirección contraria [3, 9]. Es decir, la órbita de Lyapunov es la puerta de salida para las trayectorias de escape. Dado que su disposición es aproximadamente vertical con r = r2 , podemos suponer que si para una trayectoria existe un tiempo t para el cual r(t) > r2 , entonces la trayectoria es una trayectoria de escape. No todas las órbitas escapan, sino solo aquellas que en algún momento cruzan por la órbita de Lyapunov. En la figura 1.5 pueden verse dos órbitas diferentes, una de las cuales escapa y la otra no. Por otra parte, debemos hablar de escape efectivo, en el sentido de que si el tiempo de escape es superior a un determinado tiempo lı́mite, hemos de considerar que la trayectoria no ha escapado realmente. Este tiempo lı́mite lo hemos fijado en 109 años, por lo que en las unidades de tiempo elegidas equivale a t = 100. De este modo, si una órbita no ha escapado en 100 unidades de tiempo no va a ser considerada de escape. Nuestro objetivo es estimar la probabilidad de escape para una estrella con una energı́a y un momento angular dados en un tiempo inferior a 100. En una primera aproximación podemos ver lo que sucede mediante secciones de Poincaré. Una sección de Poincaré es una sección del espacio de fases del sistema, transversal a las órbitas. Sobre la misma se define una función, denominada aplicación de Poincaré, que a un punto P de dicha sección le hace corresponder el primer punto de la órbita que pasa por P que está en la sección de Poincaré y que la corta en una dirección determinada. En nuestro caso, hemos tomado como sección de Poincaré el plano z = 0, cuando pz > 0, de manera que la sección está contenida en el plano (r, pr ), donde puede verse con facilidad el escape. El lı́mite de la sección, fijado un 12 Capı́tulo 1. Planteamiento del problema valor de la energı́a H, viene dado por H= L2 p2r r2 + z2 + − 0,2r4 , 2 2r 2 que resulta de hacer z = pz = 0 en la función hamiltoniana, cuando ésta toma el valor de energı́a H. Sobre la misma, y con Lz = 0, 1, hemos tomado al azar 1000 condiciones iniciales y hemos calculado numéricamente, para cada una de ellas, las imágenes de la aplicación de Poincaré con t < 100. Empezando con una energı́a por debajo de la de escape, H = 0,2, se aprecian en la sección estructuras regulares bien definidas (ver figura 1.3), correspondientes, en general, a movimientos cuasiperiódicos sobre toros invariantes. Cuando el valor de la energı́a aumenta, H = 0,3, apenas quedan estructuras regulares y, aunque las órbitas todavı́a no pueden ser de escape, su movimiento presenta un comportamiento caótico, de forma que la órbita que pasa por un punto de la sección de Poincaré, pasa por un entorno de casi todo punto de la misma, excepción hecha de las zonas de comportamiento regular. Este comportamiento preludia el escape en cuanto hay un canal abierto para el mismo. Y esto puede verse en la figura 1.3 cuando H = 0,32, ligeramente por encima de la energı́a de escape. En concreto, vemos cómo alguna de las trayectorias escapa por el canal abierto, aunque la mayorı́a de las trayectorias ocupan la práctica totalidad de la sección, en un movimiento irregular, no encontrando el canal de escape en el tiempo efectivo. Por tanto, la probabilidad de escape en este caso es esperable que no sea muy alta. Cuando la energı́a aumenta, vemos cómo cada vez más órbitas encuentran el canal de escape, al tiempo que empiezan a aparecer zonas blancas en la sección de Poincaré. Estas zonas corresponden a aquellas órbitas que encuentran el canal de escape muy rápido y por tanto no regresan a la superficie de sección con r < 1,5. Por otra parte, la densidad de puntos sobre la misma disminuye, indicando que los tiempos de escape disminuyen, al tiempo que aumenta la probabilidad de escape. Por último, las secciones de Poincaré muestran claramente que las órbitas que escapan lo hacen con pr > 0 y con valores de pr cada vez mayores. Esto indica que una vez que la órbita empieza a alejarse, lo hace cada vez más rápido. 1.3. Mecanismo de escape 13 Figura 1.6: Secciones de Poincaré con z = 0 y pz > 0 para Lz = 0,1 y diferentes valores de la energı́a. 14 Capı́tulo 1. Planteamiento del problema Capı́tulo 2 Probabilidad de escape por el método de Monte Carlo Como se ha visto, cuando Lz = 0,1, existen tres canales de escape, aunque la energı́a de escape está vinculada al punto de silla E4 . En este capı́tulo consideraremos solamente la posibilidad de escape por el canal que se encuentra en el plano galáctico, asociado al punto de silla E4 . Para ello tomaremos valores de la energı́a comprendidos entre la correspondiente a E4 y la correspondiente a E1,2 , es decir, valores en el intervalo (0,316513, 0,586415). Para estimar la probabilidad aplicaremos el método de Monte Carlo. Dado un nivel de energı́a H, tomaremos un paquete de condiciones iniciales distribuidas de manera uniforme en todo el espacio de configuración, que no es otra cosa que el conjunto L2 1 E = {(r, z, pr , pz ) ∈ R4 | (p2r + p2z ) + z2 + V (r, z) = H, r < r2 , Lz = 0,1}. 2 2r Mediante un método de integración numérica, implementado en la rutina DSolve de M athematica, propagaremos cada una de las condiciones iniciales hasta el valor efectivo de tiempo TF = 100, equivalente a la vida media de una galaxia, estimada en 109 años. Si antes de este periodo de tiempo se ha cruzado la órbita de Lyapunov, diremos que hay escape, mientras que si se alcanza el valor TF , sin cruzar la órbita de Lyapunov, diremos que la órbita ha quedado atrapada. Para saber que se ha cruzado la órbita de Lyapunov hemos establecido un criterio sencillo, asociado al valor de r, ya que si r alcanza un cierto valor crı́tico, habremos sobrepasado la órbita de Lyapunov. Este valor crı́tico lo hemos establecido en rc = 1,2, algo superior al valor de la coordenada r de E4 . Por tanto, toda órbita que, en un momento determinado anterior a TF , alcance un valor de r superior rc , será considerada de escape. 15 16 Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo X pr z r Er,z Spre,pz r z Figura 2.1: Volumen de condiciones iniciales para un nivel de energı́a h = 0,32. En la parte superior como producto de los conjuntos Er,z y Sper ,pz . En la parte inferior dos cortes para pz = 0 y pz = 0,5. De este modo, si N es el número total de condiciones iniciales tomadas en E y NE el total de condiciones iniciales que dan lugar a órbitas de escape, la probabilidad de escape, para el nivel de energı́a H, se obtiene mediante el cociente NE . pe = N Una primera cuestión que debemos resolver es cómo construir el conjunto de N condiciones iniciales dentro de E. En este sentido es importante notar que E puede obtenerse como producto de los siguientes conjuntos L2z + V (r, z) = e ≤ H, r < r2 }, 2r2 = {(pr , pz ) ∈ R2 | p2r + p2z = 2(H − e)}, Er,z = {(r, z) ∈ R2 | Sper ,pz donde el primero es el conjunto de todos los puntos (r, z) en el interior de la curva de velocidad cero, para un nivel de energı́a H, mientras que el segundo es una circunferencia, cuyo radio es función de r y z. Esquemáticamente e podemos ver el conjunto E, como producto de Er,z , Spr,pz en la figura 2.1, donde, además se pueden apreciar diferentes cortes del volumen en el espacio (r, z, pr ), para valores de pz = 0 y pz = 0,5. Con esta descomposición podemos tomar puntos uniformemente distrie buidos en los conjuntos Er,z y Spr,pz para tener la muestra. En concreto, tomamos puntos en un rectángulo que contiene al conjunto Er,z , para luego seleccionar los que realmente están en su interior. Cada punto seleccionado define una circunferencia, de la que se selecciona una colección de puntos igualmente espaciados. Este proceso de construcción de la muestra se puede 2.1. Determinación del tamaño muestral 17 0.6 0.4 z 0.2 0.0 -0.2 -0.4 -0.6 0.2 0.4 0.6 0.8 1.0 1.2 r Figura 2.2: Muestra de puntos igualmente espaciados sobre el conjunto Er,z , cuando H = 0,32 y Lz = 0,1. ver en la figura 2.2, donde se observa la colección de puntos uniformemente distribuidos en un rectángulo, y resaltados en otro color los que pertenecen a Er,z . 2.1. Determinación del tamaño muestral Una vez visto el sistema de construcción de la muestra, la siguiente cuestión es determinar su tamaño. Evidentemente, cuanto mayor sea el tamaño, mejor será la estimación de la probabilidad. Sin embargo, estamos interesados en buscar el tamaño óptimo de la misma, con el fin de evitar cálculos innecesarios. En este sentido, podemos considerar, que para una determinada energı́a y, fijado el valor de Lz , la probabilidad de que una órbita escape es p, de manera que o escapa con probabilidad p o no escapa con probabilidad 1 − p. Es decir, podemos suponer que tenemos una distribución binomial, por lo que se puede estimar el tamaño de la muestra mediante la ecuación [8] TM = z 2 p (1 − p) , ε2 (2.1) que depende de tres factores: 1. El nivel o intervalo de confianza z. Designa la probabilidad de que la muestra seleccionada sea correcta. Un intervalo de confianza del 95 % significa que únicamente en un 5 % de los casos los resultados obtenidos de la muestra resultarı́an incorrectos. El intervalo de confianza más utilizado es del 95 % [2]. Intervalos de confianza más elevados son una 18 Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo TM 8000 6000 4000 2000 0.2 0.4 0.6 0.8 1.0 p Figura 2.3: El tamaño de la muestra,TM , en función de la probabilidad, para un nivel de confianza del 5 % y un error muestral del 1 %. garantı́a de que los resultados obtenidos tengan una menor probabilidad de estar equivocados. Sin embargo, también suponen un importante incremento de los costos de la investigación. Un nivel de confianza del 95 % corresponde a z = 1,96. 2. El error de muestreo ε. Expresa el grado de congruencia entre el valor de los datos recabados del análisis de la muestra, y el valor real que tendrı́an esos mismos datos cuando son extrapolados a la población general. El error de muestreo marca ası́ la diferencia entre las caracterı́sticas de la muestra y las de la población de la cual fue seleccionada dicha muestra [10]. Como ejemplo, cuando una investigación cuantitativa presente un error de muestreo del 3 %, un dato obtenido de un 30 % de la muestra equivale, dentro de la poblacin general, a ese mismo 30 %, pero comprendido en una horquilla de ±3 puntos. Es decir, un 30 % en la muestra se traducirı́a en un 27–33 % del total de la población. En general, el error de muestreo no debe ser superior al 5 % para que los resultados sean realmente informativos y útiles. 3. La varianza de la población. Al tratarse de una distribución binomial dicha varianza es igual a p (1 − p). Como, en general, desconocemos el valor de p, en el peor de los casos podemos tomar p = 0,5, obteniendo de este modo una cota superior del tamaño muestral. Por ejemplo, si queremos determinar el tamaño de la muestra con un nivel de confianza del 95 % (z = 1,96) y un error muestral del 2 %, en el peor de 2.2. Cálculo de la probabilidad para Lz constante 19 p P 0.60 0.04 0.55 0.03 0.50 0.02 0.45 0.01 10000 20000 30000 40000 50000 60000 70000 ã 10 000 30 000 50 000 70 000 100 000 150 000 TM Figura 2.4: Probabilidad de escape en función del tamaño muestral cuando Lz = 0,1. A la izquierda H = 0,32 y a la derecha H = 0,4. los casos el tamaño de la misma será TM = 1,962 0,52 = 2401. 0,022 Si el error muestral se reduce a un 1 %, entonces el tamaño muestral serı́a cuatro veces mayor. En concreto TM = 9604. En el problema que estamos considerando, tomaremos el error muestral del 1 %. Ası́, el tamaño muestral variará en función de la probabilidad de escape, pasando de 0 a 9604 cuando la probabilidad varı́e entro 0 y 0,5, disminuyendo de nuevo el tamaño muestral hasta 0 cuando p = 1. La gráfica de la figura 2.3 reproduce la función (2.1) donde se aprecia la variación del tamaño de la muestra con la probabilidad. Para comprobar de una manera numérica que esta estimación del tamaño muestral es adecuada, hemos calculado la probabilidad de escape para diferentes tamaños de la muestra, hasta valores cercanos a 200000 puntos. Hemos tomado Lz = 0,1 y dos valores de la energı́a diferentes, uno cercano a la energı́a de escape y otro mayor, de manera que en un caso la probabilidad es pequeña, mientras que en el otro es cercana a 0,5. Estos valores son H = 0,32 y H = 0,4. El resultado se ve en la figura 2.4, en la que puede apreciarse cómo a partir de 10000 puntos la probabilidad se mantiene en un rango pequeño de valores. Incluso en el caso en que la probabilidad es cercana a 0,5 muestras con 3000 o 4000 puntos arrojan un valor aceptable de la probabilidad. 2.2. Cálculo de la probabilidad para Lz constante Una vez visto cómo determinar el tamaño muestral nos proponemos ver cómo cambia la probabilidad de escape a medida que la energı́a aumenta, 20 Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo mientras Lz se mantiene constante y que tomaremos igual a 0, 1. Sin embargo, nos encontramos con un problema y es que el tamaño de la muestra depende de la probabilidad de escape, que es justamente lo que queremos determinar. En principio nos interesaremos solo por ver que las estimaciones hechas son correctas y luego propondremos una manera de dar una primera aproximación de la probabilidad, que nos permita refinarla por el método de Monte Carlo, con un tamaño adecuado de la muestra. Como se vio en la sección anterior, tamaños de la muestra suficientemente elevados dan lugar a probabilidades más o menos constantes, o al menos en un rango de variación relativamente pequeño. Teniendo esto en cuenta, tomaremos muestras con un número de puntos suficientemente alto, entre 40000 y 50000, con el fin de obtener un valor de la probabilidad que supondremos como el real. En realidad está afectado de error, pero lo usaremos como base para validar la probabilidad obtenida con tamaños de muestra menores. El valor de la energı́a, el tamaño de la muestra y la probabilidad obtenida aparecen recogidos en la tabla 2.1 Energı́a 0,32 0,34 0,36 0,38 0,40 0,42 0,44 0,46 0,48 0,50 0,52 0,54 0,56 Tamaño Probabilidad 45501 0,035930 41304 0,213418 42573 0,314049 40388 0,424185 41620 0,514248 41686 0,599170 41688 0,675710 41242 0,727414 40932 0,761531 41440 0,774493 44352 0,778051 42141 0,780665 42208 0,817807 Cuadro 2.1: Probabilidad de escape, con Lz = 0,1, para valores crecientes de la energı́a con un tamaño muestral entre 40000 y 50000. Como era de esperar, la probabilidad es una función creciente de la energı́a, ya que la apertura del canal de escape es mayor cuanto mayor es ésta. Además el crecimiento es muy rápido al principio, amortiguándose a 2.2. Cálculo de la probabilidad para Lz constante 21 p 0.8 0.6 0.4 0.2 0.40 0.45 0.50 0.55 H Figura 2.5: Ajuste de la probabilidad de escape mediante mı́nimos cuadrados. En rojo el polinomio de segundo grado obtenido usando todos los puntos. En negro el polinomio obtenido usando los dos extremos y el punto central. medida que la energı́a aumenta. De hecho si la energı́a siguiera aumentando deberı́amos ver cómo la probabilidad se acerca asintóticamente a uno. No obstante, para los valores considerados, por debajo de la energı́a de los puntos E1,2 , la función de probabilidad puede ajustarse bastante bien por el polinomio de segundo grado p(H) = −3,94003 + 17,8975H − 16,8887H 2 , que resulta de aplicar el método de mı́nimos cuadrados al conjunto de datos de la tabla 2.1. Una aproximación similar se obtiene eligiendo tan solo tres puntos de control, con energı́as 0,32, 0,44 y 0,56. En este caso el polinomio es p̄(H) = −4,09126 + 18,4161H − 17,2319H 2 . En la figura 2.5 se ven los polinomios p(H) (en rojo), p̄(H) (en negro) y los puntos en los que se ha calculado la probabilidad. Estos polinomios nos van a servir para estimar a priori la probabilidad de escape para un valor de la energı́a. Esta estimación nos va a determinar, mediante (2.1), el tamaño muestral óptimo para obtener un nuevo valor de la probabilidad de escape refinado usando el método de Monte Carlo. Esto es lo que hemos hecho para los propios puntos de la tabla 2.1, obteniendo como resultado el conjunto de valores de la table 2.2, donde el tamaño de la muestra utilizada no es exactamente el teórico, que aparece en la tercera columna, sino uno aproximado. En la última columna aparece el error relativo respecto al valor obtenido con una muestra grande (tabla 2.1) y que se mantiene dentro del margen de confianza del 5 % que se estableció para el cálculo del tamaño de la muestra. 22 Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo Energı́a 0,32 0,34 0,36 0,38 0,40 0,42 0,44 0,46 0,48 0,50 0,52 0,54 0,56 p̄(H) Tamaño Probabilidad Error relativo 0,035930 1381 0,037013 0,030 0,178194 5626 0,219505 0,030 0,305268 8147 0,317511 0,010 0,418557 9349 0,417941 0,010 0,51806 9591 0,531043 0,030 0,603778 9190 0,614231 0,030 0,675710 8418 0,669305 0,009 0,733857 7503 0,718422 0,010 0,778218 6630 0,761250 0,004 0,808793 5941 0,770982 0,005 0,825583 5532 0,778700 0,007 0,828588 5456 0,771596 0,010 0,817807 5724 0,805948 0,010 Cuadro 2.2: Estimación de la probabilidad de escape mediante p̄(H) y su refinamiento con un tamaño muestral óptimo. En la última columna se recoge el error relativo, tomando como valor de referencia la probabilidad dada en la tabla 2.1. Si el valor de la tercera componente del momento angular se incrementa, el comportamiento observado, respecto a la probabilidad de escape, es similar. La diferencia ahora estriba en el hecho de que los puntos de equilibrio E3 y E4 se van acercando, al tiempo que sus energı́as cambian. Por este motivo, la energı́a de escape se ve afectada, que aumenta con Lz . Además, se vio que si Lz alcanza un valor crı́tico, los puntos de equilibrio E3 y E4 desaparecen, no pudiéndose hablar, en este caso, de un sistema con escape. Como ejemplo, en la figura 2.6 se representa la variación de la probabilidad de escape en función de la energı́a cuando Lz = 0,2. Como puede verse el comportamiento es similar al que aparece en la figura 2.5, con la única diferencia de los rangos de energı́a. Si Lz es mucho mayor, por encima del valor crı́tico, es decir cuando no hay un escape propiamente dicho, todas las órbitas consideradas en una cierta porción del espacio de fases escapan. 2.2.1. Muestra uniforme frente a muestra aleatoria Hasta ahora todas las muestras tomadas han sido uniformes, en el sentido de que los puntos seleccionados en el volumen fásico están igualmente espaciados en r y z, dentro del conjunto Er,z y en θ dentro del conjunto Sper ,pz . Esto permite elegir tamaños muestrales cercanos a un valor prefijado, 2.2. Cálculo de la probabilidad para Lz constante 23 P 0.8 0.6 0.4 0.2 ã 0.4 0.5 0.6 0.7 Figura 2.6: Probabilidad de escape cuando Lz = 0,2. jugando convenientemente con los espaciados. Es ası́ como hemos construido nuestras muestras. Inicialmente se ha elegido un espaciado para r y z dentro de Er,z . Una vez calculado el total de puntos N dentro de este conjunto se han elegido M puntos en Sper ,pz , de manera que N ×M sea un entero próximo al tamaño TM de la muestra y que exceda dicho valor. Este sistema de construcción de muestras puede no ser bueno, sobre todo cuando el tamaño de la misma es pequeño. La cuestión es que si el espaciado en r y z es muy fino, podemos tener muchos puntos en el conjunto Er,z , lo que obliga a tener muy pocos en Sper ,pz . Por tanto no estaremos muestreando convenientemente todo el volumen fásico y la probabilidad aparecerá falseada. En la figura 2.7 se ven dos muestras diferentes en Er,z . La primera es poco densa y requiere de un número de puntos alto en Sper ,pz . Por el contrario, la segunda es tan densa que no requiere más que de un punto en Sper ,pz . No obstante, la primera muestra va a ser más representativa que la segunda, ya que muestrea mejor el total del volumen. Consideremos un ejemplo, con H = 0,32, donde el tamaño de la muestra está en torno a los 1400 puntos y tomemos diferentes espaciados en r y z, haciendo que la densidad de puntos vaya en aumento y observemos qué ocurre. El resultado se ve en la tabla 2.3, en la que puede apreciarse que el aumento en la densidad de la malla en Er,z no contribuye a una mejor estimación de la probabilidad, debido a que el número de puntos en Sper ,pz disminuye, por lo que no tenemos un buen muestreo del volumen. De hecho, solo el valor dado en la primera fila está dentro del intervalo de confianza del 5 %. Por tanto, podemos ver que la elección de la muestra es un factor determinante para obtener una buena estimación de la probabilidad de escape. Por este motivo, y para evitar sesgos, se han construido muestras aleatorias, Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo 0.6 0.6 0.4 0.4 0.2 0.2 0.0 0.0 z z 24 -0.2 -0.2 -0.4 -0.4 -0.6 -0.6 0.2 0.4 0.6 0.8 r 1.0 1.2 0.2 0.4 0.6 0.8 1.0 1.2 r Figura 2.7: Dos muestras de diferente densidad sobre el conjunto Er,z para una energı́a H = 0,32. de manera que minimicen una preferencia por determinados ángulos en el conjunto Sper ,pz . En concreto, hemos tomado ternas aleatorias (r, z, θ), con 0 < r < r2 , −1 < z < 1 y 0 ≤ θ < 2π, seleccionando aquellas para las que el par (r, z) está dentro del conjunto Er,z (ver figura 2.8). Con esta selección mostramos en la tabla 2.4 algunos de los valores que resultan para la probabilidad de escape, con el tamaño de la muestra. Como se ve no siempre se consigue que los valores se ajusten al dato tomado como referencia. No obstante, la dispersión de valores obtenida es menor que para muestras uniformes con diferentes densidades y la media de valores se aproxima al valor de referencia. En cualquier caso, si tomamos muestras aleatorias por encima del lı́mite superior del tamaño muestral en el peor de los casos, es decir cuando la probabilidad es 0,5, la dispersión es mucho menor y los valores obtenidos están, salvo contadas excepciones, dentro del intervalo de confianza del 5 %. Podemos concluir, por tanto, que a pesar de que la tabla 2.2 da unas estimaciones de la probabilidad de escape acordes con lo esperado, el resultado es dependiente de la manera de tomar la muestra. En este sentido, cuando la muestra es uniforme es preciso equilibrar la densidad en los conjuntos Er,z y Sper ,pz para que la muestra sea lo más representativa posible. Por otro lado, si la muestra es aleatoria, es preciso tomar varias muestras para obtener un valor promedio que se acercará al valor de referencia. En cualquier caso, si el tamaño muestral se elige por encima del valor máximo dado por la ecuación (2.1) los valores de probabilidad obtenidos están, ex- 2.2. Cálculo de la probabilidad para Lz constante Puntos en Er,z 77 96 125 173 252 393 702 1569 Puntos en Sper ,pz 20 16 12 8 6 4 2 1 25 Tamaño Probabilidad 1540 0,037013 1536 0,039714 1500 0,050667 1384 0,064306 1512 0,070767 1572 0,099873 1404 0,195157 1569 0,180370 Cuadro 2.3: Estimación de la probabilidad de escape para diferentes muestras uniformes, en función de la densidad de la misma en los conjuntos Er,z y Sper ,pz . ceptuando algunos casos aislados, dentro del intervalo de confianza esperado. Además los resultados mejoran cuando la probabilidad es relativamente alta, lo que significa que, a partir de un cierto nivel de energı́a, la probabilidad dada por la muestra óptima puede tomarse como una buena estimación de la probabilidad de escape. Tamaño muestra 1424 1519 1642 1637 Probabilidad 0,0377219 0,036866 0,033496 0,0403177 Cuadro 2.4: Estimación de la probabilidad de escape para diferentes muestras aleatorias para H = 0,32 y Lz = 0,1. Por último debemos decir que en ningún momento hemos hecho uso de las simetrı́as del problema. En concreto, las condiciones iniciales (r0 , z0 , pr0 , pz0 ), (r0 , −z0 , pr0 , pz0 ), dan lugar a órbitas simétricas respecto al plano z = 0. Es decir, bastarı́a tomar una muestra de la mitad del volumen fásico para estimar la probabilidad. En este sentido, si muestreamos la mitad del volumen, sin modificar el tamaño muestral, nuestra muestra serı́a en realidad dos veces mayor, ayudando a mejorar la representatividad de la misma y, por tanto, la estimación de la probabilidad de escape. 26 Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo 0.6 0.4 z 0.2 0.0 -0.2 -0.4 -0.6 0.2 0.4 0.6 0.8 1.0 1.2 r Figura 2.8: Muestra de puntos tomados al azar, proyectada sobre Er,z , para una energı́a H = 0,32. 2.3. Probabilidad de escape con energı́a fija Otra cuestión que puede ser de interés en el estudio del escape es la influencia de un incremento del momento angular cuando la energı́a se mantiene constante. Debido al aumento de la energı́a de escape con el aumento de Lz , deberemos distinguir entre energı́as bajas y altas. Por ejemplo, si la energı́a elegida es 0,32, el aumento de Lz contribuye a disminuir la probabilidad de escape hasta hacerla cero, debido a que a partir de un cierto valor de Lz las curvas de velocidad cero son cerradas. Además, si seguimos incrementando el valor de Lz llegará un momento en que no existan órbitas con una energı́a tan baja. Para energı́as mayores, el efecto de un incremento de Lz es interesante, ya que tiende a estabilizar, e incluso disminuir, la misma, hasta que se sobrepasa el valor crı́tico de Lz , cuando todas las órbitas escapan. La figura 2.9 nos muestra el comportamiento de la probabilidad de escape para dos valores de la energı́a H = 0,48 y H = 0,58, en donde se aprecia claramente lo que acabamos de decir. Aunque inicialmente se observa un incremento de órbitas que escapan, luego se produce un amortiguamiento, hasta que, una vez superado el valor crı́tico de Lz la probabilidad aumenta hasta que todas las órbitas escapan. En cierto modo, lo que se observa es compatible con un resultado esperado y es que el momento angular actúa como un mecanismo de estabilización. No obstante, como la estructura del flujo fásico, regulada por los puntos de equilibrio, depende en gran medida del valor del momento angular, este 2.3. Probabilidad de escape con energı́a fija 27 p P 1.0 1.0 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.2 0.4 0.6 0.8 L 0.2 0.4 0.6 0.8 L Figura 2.9: Probabilidad de escape para H = 0,48 (izquierda) y H = 0,58 (derecha) en función de Lz . papel estabilizador queda diluido, ya que un aumento excesivo del mismo tiene como resultado la destrucción de zonas de movimiento confinado, que son las que se encuentran en torno al equilibrio de tipo centro, E3 . 28 Capı́tulo 2. Probabilidad de escape por el método de Monte Carlo Capı́tulo 3 Conclusiones En este trabajo se ha estudiado la probabilidad de escape en un sistema hamiltoniano simple de dos grados de libertad, mediante la aplicación del método de Monte Carlo. En concreto se ha estudiado un sistema galáctico que presenta varios canales de escape, aunque solo se ha tenido en cuenta el canal que se encuentra asociado al punto de silla situado en el plano galáctico, para unos ciertos valores de los parámetros del sistema. Las conclusiones más relevantes son las siguientes: Se ha estudiado la dinámica elemental del sistema en función de los parámetros que lo definen, en el sentido de que se han encontrado los puntos de equilibrio y sus propiedades de estabilidad lineal. Este estudio ha permitido determinar la existencia de canales de escape ası́ como la energı́a de escape. También se han estudiado las bifurcaciones, dando como resultado que los canales de escape se ven afectados por la variación de la tercera componente del momento angular. Se ha estudiado el mecanismo de escape, asociado a una órbita inestable de Lyapunov, que se ha determinado en primera aproximación. Se ha obtenido la probabilidad de escape mediante la toma de diferentes muestras uniformes de condiciones iniciales en el volumen fásico. Como resultado se ha visto que, a partir de un cierto número de condiciones iniciales, la probabilidad de escape se mantiene aproximadamente constante. Al mismo tiempo se observa, como era de esperar, que la probabilidad de escape aumenta con el aumento de la energı́a. Bajo la hipótesis de que el escape, para una condición inicial dada, sigue una distribución binomial, se ha determinado el tamaño de una muestra óptima, dentro de unos niveles de confianza preestablecidos. 29 30 Capı́tulo 3. Conclusiones Esto permite hacer cálculos de la probabilidad de escape con costes computacionales menores. Se ha analizado el tipo de muestreo, comparando los resultados ofrecidos por muestras uniformes y muestras aleatorias. Estas últimas son preferibles cuando el tamaño muestral no es muy grande. La variación del momento angular modifica la probabilidad de escape, de manera que un aumento moderado del mismo hace disminuir la probabilidad de escape. Sin embargo, un gran aumento del mismo tiene como resultado un aumento de la probabilidad de escape, que tiende a 1, a medida que nos acercamos al valor crı́tico de Lz en el que se produce una bifurcación silla-nodo. Como trabajo futuro queda pendiente el estudio del escape bajo otras configuraciones de los parámetros, ası́ como estudiar el papel jugado por los otros canales de escape, para energı́as más altas. Bibliografı́a [1] J. Binney, S. Tremaine. Galactic Dynamics, Princeton University Press, New Jersey, 1987. [2] J. Castañeda, L. De la Torre, R. Morán, R. Lara. Metodologı́a de la investigación, McGraw Hill, México, 2002. [3] G. Contopoulos. Order and Chaos in Dynamical Astronomy, SpringerVerlag, Berlin, 2002. [4] R. Cid, S. Ferrer. Geodesia geométrica, fı́sica y por satélites, Instituto Geográfico Nacional, Madrid, 1997. [5] W. A. Heiskanen, H. Moritz. Geodesia Fsica, Instituto Geogrfico Nacional e Instituto de Astronoma y Geodesia. Madrid, 1985. [6] W. Herschel. Astronomical observations and experiments tending to investigate the local arrangement of the celestial bodies in space, and to determine the extent and condition of the Milky Way, Philosophical Transactions of the Royal Society of London, Vol. CVII (107), 302–331, 1817. [7] E.P. Hubble. Cepheids in Spiral Nebulae, Pubs. Amer. Astr. Soc. 5, 261–264, 1925; reprinted in Observatory 48, 139–142, 1925. [8] C. Pérez. Técnicas de muestreo estadı́stico, Ed.Garceta, Madrid, 2010. [9] J.P. Salas. Escape e sistemas hamiltonianos simples: el papel del espacio fase, Anales de Fı́sica 95, 49–55, 2000. [10] N.J. Salkind. Métodos de investigación, Pearson Education, México, 1998. [11] J. Stoer, R. Bulirsch. Introduction to Numerical Analysis, SpringerVerlag, New York, 1980. 31