FÍSICA Acta Cientı́fica Venezolana, 66(2): 95–100, 2015 DETERMINACIÓN DE PARÁMETROS FÍSICOS DE GALAXIAS VÍA AJUSTE ESPECTRAL: DEPENDENCIA CON LA RAZÓN SEÑAL A RUIDO Gladis Magris C.,1,∗ Cecilia Mateu1,2 y Alfredo Mejı́a-Narváez1,3 1 Centro de Investigaciones de Astronomı́a (CIDA), Mérida, Venezuela Instituto de Astronomı́a, UNAM, Ensenada, C.P. 22860, Baja California, México 3 Postgrado de Fı́sica Fundamental, Facultad de Ciencias, ULA, Mérida, Venezuela 2 Recibido: 29/04/2015 Corregido: 16/07/2015 Aceptado: 03/08/2015 RESUMEN Presentamos un análisis de cómo depende la determinación de los parámetros fı́sicos de galaxias con la calidad del espectro (medida a través de la razón señal a ruido en la banda r), usando la técnica de ajuste espectral implementada en cuatro métodos diferentes: DynBaS2D, DynBaS3D, TGASPEX y GASPEX. Utilizamos un conjunto de 21600 espectros sintéticos, correspondientes a 30 realizaciones aleatorias de ruido con 6 valores de la razón señal a ruido, de 120 espectros de galaxias (calculados de un igual número de historias de formación estelar) que cubren todo el rango de colores observado por el Sloan Digital Sky Survey en el universo local. Encontramos que, para espectros con razón señal a ruido ≤ 25 en la banda r, DynBaS3D ofrece la solución más exacta y precisa. Para valores mayores de la razón señal a ruido los tres métodos DynBaS3D, TGASPEX y GASPEX ofrecen soluciones comparables, y solo para espectros de muy alta calidad (SNRr >50) la solución dada por métodos con base ilimitada, como TGASPEX, supera la obtenida por DynBaS3D. Palabras claves: galaxias: contenido estelar, galaxias: estadı́sticas, galaxias: parámetros. RECOVERY OF GALAXY PHYSICAL PARAMETERS VIA SED FITTING: DEPENDENCE ON THE SIGNAL-TO-NOISE RATIO ABSTRACT We present an analysis of the dependence on the signal-to-noise ratio of the accuracy of galaxy parameter extraction via spectral energy distribution fitting. We evaluate four algorithms: DynBaS2D, DynBaS3D, TGASPEX and GASPEX on a set of 21600 synthetic spectra, corresponding to 30 random realizations of noise with 6 values of the signal-to-noise ratio, of 120 galaxy spectra consistently calculated from equal number of star formation histories. Our sample is selected to cover the same color range of nearby galaxies in the Sloan Digital Sky Survey. We find that, for spectra with signal-to-noise ratio ≤ 25 in the r band, DynBaS3D gives the more accurate and precise solution. For higher signal-to-noise ratio, DynBaS3D, TGASPEX and GASPEX offer equivalent solutions. Only for spectra of very high quality (SNRr >50) the solution of TGASPEX is better than DynBaS3D. Keywords: galaxies: stellar content, galaxies: statistics, galaxies: parameters. (SED, por sus siglas en inglés) de las galaxias. Una de las técnicas más utilizadas es el ajuste de la SED Es bien sabido que el estudio de la historia de con modelos de sı́ntesis de poblaciones estelares para la evolución del universo está basada principalmente los cuales se conoce, por construcción, los parámetros en el análisis de la distribución espectral de energı́a INTRODUCCIÓN 96 Magris et al. Frecuencia fı́sicos como la masa, la edad, metalicidad, contenido de polvo y dispersión de velocidad.1–4 En la literatura de los últimos diez años se encuen70000 tran numerosos métodos para el ajuste de espectros y recuperación de parámetros, los cuales han sido desarrollados para el análisis de grandes sondeos de gala60000 xias. Estos algoritmos son exitosos en ajustar el espectro observado; sin embargo, la recuperación de los 50000 parámetros no está exenta de las incertidumbres debidas a las degeneraciones inherentes del problema. 40000 Recientemente, Magris et al.4 presentaron un análisis cuantitativo de los errores en la determinación de parámetros fı́sicos, utilizando tres métodos desarro30000 llados por los autores ası́ como un algoritmo disponible públicamente. Para dicho análisis se utilizaron 120 20000 espectros sintéticos del atlas de espectros de galaxias SSAG4 a los cuales se les añadió ruido aleatorio con 10000 razón señal ruido en la banda r, SNRr, igual a 20. Es de esperar que tanto el ajuste espectral como la asertividad en la recuperación de los parámetros fı́sicos 0 10 20 30 40 50 60 de la galaxia pueden depender de la calidad o tipo de SNRr material observacional (p.ej. intervalo de longitud de onda, resolución espectral, calidad del espectro). Figura 1: Distribución del valor de la SNRr para galaxias Si bien la mayorı́a de los espectros de galaxias del DR7 del SDSS. del Sloan Digital Sky Survey (SDSS)6 tienen una SNRr ≈ 20, hay una gran cantidad de espectros con menor y mayor SNRr (ver Figura 1) para los cuales es necesario estudiar las incertudumbres en los parámetros que se determinan vı́a ajuste espectral. En este trabajo presentamos un estudio de las incertidumbres 3.5 en la determinación de la masa, la edad, metalicidad y la extinción debida al polvo en función de la SNRr 3.0 como una medida de la calidad del espectro observado. MÉTODO Utilizamos 120 espectros sintéticos en el intervalo de longitud de onda 3300–8000 Å, correspondientes a igual número de historias de formación estelar seleccionados por Magris et al.4 A cada espectro añadimos 30 realizaciones aleatorias de ruido gaussiano con sigma igual al promedio del ruido de los datos espectroscópicos de la séptima publicación (DR7) del SDSS (Figura 2), escalado a un valor fijo de SNRr. Exploramos los valores de SNRr = 10, 15, 20, 25, 30 y 50. Para cada uno de los 21600 espectros de la muestra final, evaluamos el desempeño de cuatro modelos: DynBaS2D, DynBaS3D, TGASPEX y GASPEX.4 En estos algoritmos, el espectro modelo Fλmod que mejor ajusta al espectro observado, Fλobs , es aquel que mi- Sigma 2.5 2.0 1.5 1.0 0.5 3000 4000 5000 6000 7000 8000 9000 10000 Longitud de onda (Å) Figura 2: Desviación estándar σ promedio del ruido de las galaxias del DR7 del SDSS. Los valores fueron normalizados a 1 en la longitud de onda efectiva de la banda r. Recuperación de parámetros y la razón señal–ruido 97 −0,7 m . am ijk fλ (ti , Zj ) exp −τV k (λ/5500) m=1 (2) Los coeficientes am ijk dan peso a las poblaciones estelares simples fλm (ti , Zj ) con edad ti y metalicidad Zj , y τV k es el espesor óptico en la banda V del polvo interno de la galaxia. Estas poblaciones son tales que laP masa estelar de la galaxia es simplemenm m te M = m=1 aijk . Utilizamos las SED fλ (ti , Zj ) correspondientes a los modelos de sı́ntesis de poblaciones estelares de la Ref.5 En DynBaS2D y DynBaS3D, Fλmod de descompone en N = 2 o N = 3 componentes, respectivamente, con edades y metalicidades dinámicamente calculadas por dichos algoritmos. TGASPEX es un método con base no restringida; en este caso se resuelve la Ec. (1) para Fλmod con un número de componentes N = 784 (196 edades × 4 metalicidades). Por otro lado, GASPEX describe Fλmod utilizando una base fija de 12 edades elegidas de forma que sean tan linealmente independientes como sea posible. Los detalles de estos modelos se encuentran en la Ref.4 RESULTADOS Y DISCUSIÓN Para cada método calculamos el residuo de la masa (M ), log-edad pesada por masa (MWlogAge), logedad pesada por flujo en la banda r (FWlogAge), logmetalicidad pesada por masa (MWlogZ) y la extinción en la banda V (AV ). En la Figura 3 se puede observar la distribución de los residuos de los parámetros calculados con DynBaS2D, DynBaS3D, TGASPEX y GASPEX para tres valores de referencia de la SNRr iguales a 10, 20 y 50. Resalta que, con el aumento de la SNR, las distribuciones para todos los parámetros se vuelven más angostas (parámetros más precisos), más centradas en el caso de métodos de base fija (parámetros menos sesgados) y menos centradas en el caso de métodos de selección dinámica de la base (parámetros más sesgados). En particular, las distribuciones de los residuos de M y de MWlogAge difieren notablemente DynBaS2D DynBaS3D TGASPEX = N X −0.4 −0.2 0.0 0.2 ∆M/M true 0.4 −0.4 −0.2 0.0 0.2 ∆M W logAge 0.4 −0.4 −0.2 0.0 0.2 ∆F W logAge 0.4 −0.4 −0.2 0.0 0.2 ∆M W logZ 0.4 −0.4 −0.2 0.0 0.2 ∆AV 0.4 −0.4 −0.2 0.0 0.2 ∆M/M true 0.4 −0.4 −0.2 0.0 0.2 ∆M W logAge 0.4 −0.4 −0.2 0.0 0.2 ∆F W logAge 0.4 −0.4 −0.2 0.0 0.2 ∆M W logZ 0.4 −0.4 −0.2 0.0 0.2 ∆AV 0.4 −0.4 −0.2 0.0 0.2 ∆M/M true 0.4 −0.4 −0.2 0.0 0.2 ∆M W logAge 0.4 −0.4 −0.2 0.0 0.2 ∆F W logAge 0.4 −0.4 −0.2 0.0 0.2 ∆M W logZ 0.4 −0.4 −0.2 0.0 0.2 ∆AV 0.4 GASPEX Fλmod DynBaS2D donde σλ es la desviación estándar de la distribución gausiana que caracteriza el error en el flujo del espectro problema a la longitud de onda λ. El espectro modelo viene dado por DynBaS3D (1) TGASPEX , GASPEX i i σλ2 i DynBaS2D i DynBaS3D χ = X (Fλobs − Fλmod )2 TGASPEX 2 GASPEX nimiza la expresión Figura 3: Distribución de residuos obtenidos con GASPEX, DynBaS2D, DynBaS3Dy TGASPEX para la masa total M , log-edad pesada por masa MWlogAge, log-edad pesada por flujo en la banda r FWlogAge, log-metalicidad pesada por masa MWlogZ y la extinción en la banda V (AV ) para espectros problema sintéticos con SNRr = 10, 20 y 50, de arriba hacia abajo. En cada recuadro, la lı́nea a trazos representa la mediana de la distribución, y las lı́neas punteadas corresponden al valor del percentil 16 y 84. La distribución de AV en el recuadro correspondiente a DynBaS3D es la misma que en DynBaS2D. 98 Magris et al. 0.5 Precisión 0.4 ∆M/M true ∆M W logAge ∆F W logAge ∆AV ∆M W logZ SNR=10 0.3 0.2 0.1 DynBaS2D DynBaS3D TGASPEX GASPEX 0.0 0.5 Precisión 0.4 SNR=15 0.3 0.2 0.1 0.0 0.5 Precisión 0.4 SNR=20 0.3 0.2 0.1 0.0 0.5 Precisión 0.4 SNR=25 0.3 0.2 0.1 0.0 0.5 Precisión 0.4 SNR=30 0.3 0.2 0.1 0.0 0.5 Precisión 0.4 SNR=50 0.3 0.2 0.1 0.0 −0.2 −0.1 0.0 0.1 Sesgo 0.2 −0.2 −0.1 0.0 0.1 Sesgo 0.2 −0.2 −0.1 0.0 0.1 Sesgo 0.2 −0.2 −0.1 0.0 0.1 Sesgo 0.2 −0.2 −0.1 0.0 0.1 Sesgo 0.2 Figura 4: Precisión versus sesgo obtenido con DynBaS2D, DynBaS3D, TGASPEX y GASPEX para la recuperación de la masa total M , log-edad pesada por masa, log-edad pesada por flujo, log-metalicidad pesada por masa y extinción en la banda V, AV , para seis valores de la SNRr: de arriba hacia abajo, 10, 15, 20, 25, 30 y 50. Recuperación de parámetros y la razón señal–ruido de un método a otro, no siendo el caso para el resto de los parámetros. Con la finalidad de proveer un análisis cuantitativo, utilizamos la mediana de la distribución de los residuos como una medida del sesgo y su ancho, definido como (P 84 − P 16)/2, como un indicador de la precisión.4 (P 16 y P 84 son los valores por debajo de los cuales se encuentra el 16 % y 84 % de los residuos, respectivamente; en el caso de una distribución gaussiana, esto corresponde a −1σ and +1σ, respectivamente.) Mostramos en la Figura 4 el valor del sesgo y la precisión para todos los parámetros y métodos. El punto (0, 0) en este plano indica una recuperación perfecta. La masa de la galaxia y la edad pesada por masa son los parámetros con mayor incertidumbre (para cualquier modelo), los más sensibles a un cambio en la SNR y, por otro lado, también son los parámetros que están directamente relacionados con la historia de formación estelar, una de las claves para la comprensión de la evolución del Universo. Podemos observar en las Figuras 3 y 4 que DynBaS2D es un método cuyo rendimiento depende poco de la calidad del espectro. Sus soluciones para M y MWlogAge siempre tienen el mismo sesgo (≈ −0,18 y −0,15, respectivamente) y precisión (entre 0.13 y 0.2). Sin embargo, para cualquier valor de la SNR, este método ofrece la recuperación menos sesgada de AV . En el caso de SNRr = 10, DynBaS3D nos da soluciones estadı́sticamente no sesgadas pero poco precisas (precisión = 0.4). A medida que se incrementa la SNR, las soluciones dadas por DynBaS3D son más precisas (menor valor del parámetro precisión) pero más sesgadas, con tendencia a subestimar el valor de M , de MWlogAge y de FWlogAge. TGASPEX y GASPEX ofrecen soluciones estadı́sticamente iguales entre sı́ para todos los parámetros y todo valor de la SNRr (Figuras 3 y 4). En la Figura 4 se aprecia que, para cualquier valor de la SNRr, las soluciones dadas por estos dos métodos tienden a sobreestimar el valor de M y de MWlogAge por un valor de más del 10 % para galaxias con espectros con SNR < 25. Ambos métodos mejoran su desempeño (menor valor del sesgo y de la precisión) con el aumento de la SNR. 99 CONCLUSIONES Presentamos los resultados de un análisis consistente de la dependencia de la recuperación de los parámetros M , MWlogAge, FWlogAge, MWlogZ y AV con la SNR de espectros de galaxias con caracterı́sticas análogas a la del material espectroscópico del SDSS. Utilizamos cuatro métodos: dos métodos en los cuales la edad y metalicidad se elige de forma dinámica hasta un máximo de dos o tres componentes, DynBaS2D y DynBaS3D, respectivamente; un modelo con base fija, extendida a 12 edades ×4 metalicidades, GASPEX; y por último, un método sin restricción en el número de elementos en la base, TGASPEX. Podemos concluir que para cualquier método los espectros con baja SNR ofrecen una determinación pobre de M y MWlogAge. Sin embargo, al incrementar la SNR todos los métodos muestran mejor precisión en la determinación de todos los parámetros. GASPEX y TGASPEX también disminuyen el sesgo, mientras que DynBaS2D y DynBaS3D muestran resultados más sesgados al aumentar la SNR, subestimando M y MWlogAge. DynBaS3D ofrece el mejor desempeño para recuperar M y MWlogAge utilizando espectros con SNRr ≤ 25. Para espectros con SNRr = 30 se observa que la recuperación de los parámetros con cualquier método es equivalente. Para valores mayores de la SNR, las soluciones dadas por GASPEX y TGASPEX son las que muestran la mejor recuperación de los parámetros. Para todos los valores de SNR explorados, DynBaS2D nos da la solución más sesgada de todos los parámetros excepto AV , para el cual DynBaS2D arroja excelente resultados. Los métodos con mayor número de elementos en la base tienden a sobreestimar la masa y la edad pesada por masa para cualquier valor de la SNR. En sı́ntesis, los métodos con dos o tres elementos dinámicamente seleccionados son la mejor opción para espectros de calidad pobre, mientras que para espectros de mayor calidad, las opciones con base extendida, bien sea fija o restringida, tienen un mejor desempeño. REFERENCIAS Los parámetros FWlogAge y MWlogZ se recuperan 1. Cid Fernandes, R., Mateus, A., Sodré, L., Stasińska, G., Gomes, J.M. Semi-empirical con mayor precisión al incrementar la SNR, aunque analysis of Sloan Digital Sky Survey galaxies - I. de forma menos notoria que para M y MWlogAge. 100 Spectral synthesis method. Mon. Not. R. Astron. Soc., 358:363, 2005. 2. Conroy, C., Gunn, J.E., White, M. The propagation of uncertainties in stellar population synthesis modeling. I. The relevance of uncertain aspects of stellar evolution and the initial mass function to the derived physical properties of galaxies. Astrophys. J., 699:486, 2009. 3. Walcher, J., Groves, B., Budavári, T., Dale, D. Fitting the integrated spectral energy distributions of galaxies. Astrophys. Space Sci., 331:1, 2011. 4. Magris C., G., Mateu P., J., Mateu, C., Bruzual A., G., Cabrera-Ziri, I., Mejı́aNarváez, A. On the recovery of galaxy properties from SED fitting solutions. Publ. Astr. Soc. Pac., 127:16, 2015. 5. Bruzual, G., Charlot, S. Stellar population synthesis at the resolution of 2003. Mon. Not. R. Astron. Soc., 344:1000, 2003. 6. Abazajian, K.N., Adelman-McCarthy, J.K., Agüeros, M.A., et al. The Seventh data release of the Sloan Digital Sky Survey. Astrophys. J. Suppl., 182:543, 2009. Gladis Magris, Centro de Investigaciones de Astronomı́a (CIDA), Apartado Postal 264, Mérida 5101A, Venezuela. CE: magris@cida.gob.ve ∗ Correspondencia: Magris et al.