Astronomía Observacional: Incertezas G.L. Baume - 2013 Incertezas 1 Astronomía Observacional: Incertezas G.L. Baume - 2013 Incertezas 1. Introducción 2. Conceptos Básicos 3. Distribuciones 4. Análisis de incertidumbre 5. Tópicos Adicionales Bibliografía To Measure the Sky by F. R. Chromey Practical Statistics for Astronomers by J. V. Wall 1979 Q. J. R. Ast. Soc. 20, 138 – 1996 Q. J. R. Ast. Soc.37, 519 Observational Astrophysics (Apendix B) by P. Lena, F. Lebrun & F. Mignard 2 Astronomía Observacional: Incertezas G.L. Baume - 2013 1. Introducción Dado que las teorías prouestas se basan en los datos astronómicos obtenidos en las observaciones, es necesario tener una idea de que tan confiables son dichos datos El grado de confiabilidad viene dado por la incerteza o error con que se conoce una dada medida “Ninguna cantidad obtenida observacionalmente es realmente util si ella no tiene un error asociado” 3 Astronomía Observacional: Incertezas G.L. Baume - 2014 1. Introducción Ejemplos Velocidad radial de la estrella HD 187085. Medidas con su respectivo error y dos posibles ajustes a los datos http://plus.maths.org/content/hunting-lifealien-worlds Curvas de luz de Kepler-37. Los paneles indican los tránsitos de los planetas Kepler37b (a), Kepler-37c (b) y Kepler-37d (c). http://www.nature.com/nature/journal/v494/n74 38/fig_tab/nature11914_F1.html 4 Astronomía Observacional: Incertezas G.L. Baume - 2013 Incertezas 1. Introducción 2. Conceptos Básicos 3. Distribuciones 4. Análisis de incertidumbre 5. Tópicos Adicionales 5 Astronomía Observacional: Incertezas G.L. Baume - 2014 2. Conceptos Básicos Error absoluto Es la diferencia entre el “valor medido” y el “valor verdadero” (desconocido). Este es una medida de la incerteza con las mismas unidades que el valor medido Ejemplo: El largo de una mesa es de 2.3 ± 0.1 m. Error relativo Este representa el error absoluto como una http://antongerdelan.net/teaching/vis/datar fracción o porcentaje eps/lec-datareps.html Ejemplo: 0.1m/2.3m = 0.04 = 4%. El error en la medida del largo de la mesa es del 4% 6 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Exacto Inexacto Exactitud Indica que tan cerca se encuentra una medida del “valor verdadero” También se la conoce como “error sistemático” Preciso Precisión Impreciso Indica que tan bien se determina una medición. O sea, gran cantidad de dígitos significativos indica gran precisión Tambien se la conoce como “error de repetitividad”, “error aleatorio”, “error interno” o simplemente “ruido”. El error absoluto de una medidia viene dado entonces por la suma del error sistemático y de repetitividad ε Total = ε Sist . + ε Aleat . Nota: El error total tambien se suele conocer como “error externo” 7 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Exacto Inexacto Exactitud: La exactitud en una medida es muy dificil de cuantificar dado que normalmente no se conoce el “valor verdadero” de una medida y es en definitiva la limitación mas seria de todo resultado experimental u observacional Preciso Impreciso La forma de estimar la exactitud seria: • Hacer varias medidas • Utiizar instrumentos diferentes • Utilizar métodos diferentes • Utilizar observadores diferentes y comparar todos los resultados 8 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Exacto Inexacto Precisión La precisión es relativamente facil de cuantificar simplemente comparando distintas medidas Ejemplos: N ∆ max = xmax − xmin ∑ x −x i ∆ medio = ∑ (x 2 i − x) s= N N N ∑ ( xi − x) 2 i =1 Impreciso i =1 N rms = Preciso i =1 Nota N ∑x i N −1 x= i =1 N 9 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Equivocaciones (o no...) Se consideran “equivocaciones” a aquellas medidas extremadamente diferentes del resto del conjunto WR 25 Radial Velocity (km/s) (λ4058) Estas se suelen eliminar del conjunto de datos, aunque esto puede ser peligroso si tales valores no son realmente equivocaciones sino comportamientos reales de la medida bajo estudio Gamen et al. 2006, A&A 460, 777 Diferentes símbolos indican medidas de distintos autores (Línea interestelar) 10 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Población Es el conjunto de “todos” los posibles resultados de una dada medida Muestra Es el conjunto de efectivamente hechas deseada las de mediciones la medida Nota: La población puede ser un conjunto infinito o muy grande dependiendo de su naturaleza, mientras que la muestra es normalmente un número manejable de valores Inferencia estadística Se denomina así a la determinación de propiedades de la “población” a partir del estudio de una “muestra” de ella 11 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplos Población: El peso de cada persona en la Tierra Muestra 1: El peso de cada alumno de un aula Muestra 2: El peso de 100 personas esparcidas aleatoriamente en el mundo Población: Las luminosidades de las estrellas de la Vía Láctea Muestra 1: Las luminosidades de las 100 estrellas más cercanas Muestra 2: Las lumniosidades de 100 estrellas esparcidas al azar en la Vía Láctea Población: Todas las posibles medidas de la magnitud de una estrella Muestra 1: 5 medidas de la magnitud de la estrella Muestra 2: 100 medidas de la magnitud de la estrella 12 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Distribución de probabilidades Toda medida vinculada a una población posee una función distribución asociada (P(x); contínua o discreta) que describe que tan probable es obtener un determinado valor de esa medida Dicha función se denomina: • Función Distribución Normalizada o • Distribución de Probabilidad de la medida De esta forma: • Caso contínuo: P(x) dx = probabilidad de que la medida se encuentre entre x y x+dx • Caso discreto: P(xj) = probabilidad de obtener un valor x = xj 13 Astronomía Observacional: Incertezas G.L. Baume - 2014 2. Conceptos Básicos Valores característicos Para una muestra de una medida con una determinada Distribución de Probabilidad, es posible obtener ciertos valores característicos: Indicadores del valor central: • Valor medio (µ) • Mediana (µ1/2): valor que divide la población exactamente a la mitad • Moda (µmax): valor mas frecuente (probable) de la población Nota: En el caso de una distribución simétrica los tres valores son coincidentes Indicadores de la dispersión • Desviación estándard (σ) µ = lim x σ = lim s N →∞ N →∞ N N ∑ (x ∑x i i x= i =1 N s= − x) 2 i =1 N −1 14 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Valores característicos Valor medio (µ) Ventajas: • Facil de calcular • Funciona bien para simétricas Outliers distribuciones Desventajas: • Sensible a “outliers” (valores alejados de la mayoría) • No es bueno para distribuciones con mas de un pico Error del valor medio Este viene dado por: ex ≈ s N 15 Astronomía Observacional: Incertezas G.L. Baume – 2016 2. Conceptos Básicos Valores característicos Mediana (µ1/2) y Moda (µmax) Outliers Ventajas: • Ambos valores son casi o totalmente insensible a los “outliers” Desventajas: • El cálculo de ambos valores es más complicado que la determinación del valor medio 16 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Otros valores característicos Sesgo (“Skew”) Este indica hacia donde se encuentra desplazada la moda respecto al valor medio Curtosis Este indica que tan concentrada es una distribución alrededor de su valor medio 17 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 1: Combinación de medidas Se ha determinado la distancia al centro de la Vía Láctea utilizando tres métodos diferentes, resultando: Método 1: 8.0 ± 0.3 kpc Método 2: 7.8 ± 0.7 kpc Método 3: 8.25 ± 0.20 kpc El mejor estimador combinado de todas las medidas individuales (yi) viene dado por la “media pesada” (yc ± εc) Russeil et al 2003 N ∑w i yc = i =1 N yi ∑ wi i =1 ε c2 = 1 N ∑ wi i =1 wi = 1 El resultado combinado es: ε i2 d = 8.15 ± 0.16 kpc 18 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Tareas en IRAF Imstatistics Dada una matriz de valores (imagen digital), esta tarea provee una determinada cantidad de parámetros estadísticos Parámetros estadísticos análisis Imagen Matriz 34 22 31 34 33 22 28 18 32 28 16 26 33 20 44 34 70 98 66 99 229 107 67 103 67 33 34 29 22 17 16 25 27 26 23 16 29 28 28 24 37 22 37 38 36 36 32 17 25 26 22 26 25 28 32 24 24 18 24 26 25 25 29 19 14 30 30 20 35 36 39 39 46 102 159 93 69 240 393 248 65 241 363 244 46 85 157 84 30 29 35 24 30 28 20 35 17 19 30 35 28 19 23 37 69 68 42 30 22 30 25 17 20 22 30 24 22 27 23 26 19 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Tareas en IRAF Imstatistics Parámetros estadísticos image: the image name npix: the number of pixels used to do the statistics mean: the mean of the pixel distribution midpt: estimate of the median of the pixel distribution mode: the mode of the pixel distribution stddev: the standard deviation of the pixel distribution skew: the skew of the pixel distribution kurtosis: the kurtosis of the pixel distribution min: the minimum pixel value max: the maximum pixel value image - the image name 20 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Tareas en IRAF Imstatistics Parámetros característicos mean = sum (x1,...,xN) / N y = x - mean variance = sum (y1 ** 2,...,yN ** 2) / (N-1) stddev = sqrt (variance) skew = sum ((y1 / stddev) ** 3,...,(yN / stddev) ** 3) / (N-1) kurtosis = sum ((y1 / stddev) ** 4,...,(yN / stddev) ** 4) / (N-1) - 3 21 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Tareas en IRAF Imcombine Combina varias imágenes (matrices) en una sola, permitiendo elegir como se realiza dicha combinación Los parámetros principales son: o Combine procesamiento Indica la forma en que se combinan los valores de las distintas imágenes Imagen combinada o Reject Indica el criterio de selección de los valores de las distintas imágenes Varias imágenes 22 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Tareas en IRAF Imcombine reject: combine: average: weighted average median: median lmedian: median except use the lower value if only two sum: (weighted) sum quadrature: weighted quadrature average nmodel: weighted quadrature average of noise model values none: No rejection minmax: Reject the nlow and nhigh pixels ccdclip: Reject pixels using CCD noise parameters crreject: Reject only positive pixels using CCD noise parameters sigclip: Reject pixels using a sigma clipping algorithm avsigclip: Reject pixels using an averaged sigma clipping algorithm pclip: Reject pixels using sigma based on percentiles 23 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Herramientas en Python Paquete: scipy.stats describe(a) Computes several descriptive statistics of the passed array. Parameters: a: Input data. Returns: nobs : Number of observations (length of data along axis). minmax: Minimum and maximum value of data array. mean : Arithmetic mean of data along axis. variance : Unbiased variance of the data along axis, denominator is number of observations minus one. skewness : Skewness, based on moment calculations with denominator equal to the number of observations, i.e. no degrees of freedom correction. kurtosis : Kurtosis (Fisher). The kurtosis is normalized so that it is zero for the normal distribution. No degrees of freedom are used. http://docs.scipy.org/doc/scipy/reference/stats.html#module-scipy.stats 24 Astronomía Observacional: Incertezas G.L. Baume - 2013 Incertezas 1. Introducción 2. Conceptos Básicos 3. Distribuciones 4. Análisis de incertidumbre 5. Tópicos Adicionales 25 Astronomía Observacional: Incertezas G.L. Baume - 2016 3. Distribuciones Distribución de Poisson Esta distribución describe el comportamiento de una población resultante en determinados experimentos de conteo (eventos producidos en un dado intervalo de tiempo) Ejemplos: Cantidad de gotas que caen en una baldosa en un segundo Cantidad de autos que pasan por un lugar de la ruta en una hora (lejos de los semáforos) Cantidad de fotones que caen un cierta área de un detector en 10 segundos Cantidad de decaimientos nucleares de una sustancia radioactiva en una hora 26 Astronomía Observacional: Incertezas G.L. Baume - 2016 3. Distribuciones Distribución de Poisson Esta viene dada por la siguiente expresión: Pµ ( n, t ) = µn n! e−µ Pµ(n,t) expresa la probabilidad de tener n eventos en un tiempo t si se sabe que ellos ocurren con una tasa λ [eventos por u. de tiempo] y entonces un valor medio dado por: http://inspirehep.net/record/868729/plots Se puede demostrar que, para esta distribución, la desviación estándard viene dada por: µ =λt σ= µ 27 Astronomía Observacional: Incertezas G.L. Baume - 2016 3. Distribuciones Distribución de Poisson Resultados Ejemplo 1: P12.5 (12 fot ,10 seg ) = 0.1132 Determinar cuantos fotones son recibidos en 10 segundos de una fuente (no variable) a la que le corresponde una tasa media (recibida) es de 1.25 fot/seg. P12.5 (13 fot ,10 seg ) = 0.1089 Planteo Pµ ( n, t ) = µn n! O sea que en una medida de 10 segundos es un poco mas probable medir 12 fotones que 13 fotoenes P12.5 (9 fot ,10 seg ) = 0.0765 ≈ 0.08 e−µ λ = 1.25 fotones / seg . µ = 12.5 fotones O sea que si se hacen 100 observaciones de 10 segundos se detectarán 9 fotones en casi 8 de ellas Entonces, cada observación es una “imagen aleatoria de la realidad” 28 Astronomía Observacional: Incertezas G.L. Baume - 2016 3. Distribuciones Distribución de Poisson Ejemplo 2: O sea: Dterminar el error relativo debido a Poisson si durante un tiempo “t” se cuentan “N” fotones recibidos de una estrella Si N = 10 entonces σ µ = 31.6 % Si N = 100 entonces σ µ = 10 % Planteo Valor medio: Conclusiones µ≈x=N Es importante aumentar el valor de N para disminuir el error relativo Esto se puede hacer: • Aumentando el tiempo de integración • Aumentando el diámetro del telescopio • Haciendo ambas cosas Nota: Seria mejor hacer varias medidas y tomar el promedio de ellas σ = µ1 2 ≈ N Estimación del error: Nota: Se supone que el “error sistemático es nulo Error relativo: 1 σ ≈ µ N 29 Astronomía Observacional: Incertezas G.L. Baume - 2013 3. Distribuciones Distribución de Gauss Esta disstribución describe gran cantidad de poblaciones y es util incluso si la población no la sigue En este caso independientes σ y µ son Distribución normal estándard: Se denomina así cuando µ = 0 y σ = 1 P ( x) = N ( µ , σ ) = http://en.wikipedia.org/wiki/Normal_distribution ( x − µ )2 1 exp − 2 2 σ 2π σ x2 Pstd ( x ) = N (0,1) = 1 −2 e 2π 30 Astronomía Observacional: Incertezas G.L. Baume - 2013 3. Distribuciones Distribución de Gauss Niveles de confiabilidad: El área bajo una gaussiana estándard entre µ – n σ y µ + n σ viene dada por n An = erf 2 http://en.wikipedia.org/wiki/Normal_distribution Resulta entonces que: siendo erf ( x ) = 2 π x ∫e −t 2 dt 0 la denominada “función error” • A1 = 68.3% • A2 = 95.5% • A3 = 99.7% Esta se denomina ”regla de 3 σ.” 31 Astronomía Observacional: Incertezas G.L. Baume - 2013 3. Distribuciones PMAX Distribución de Gauss FWHM: Full width at half maximum PMAX 2 Se denomina así a la separación en x entre dos puntos en los que P ( x, µ , σ ) = 1 PMAX ( x, µ , σ ) 2 El FWHM se puede definir de forma análoga para cualquier función con un pico 32 Astronomía Observacional: Incertezas G.L. Baume - 2013 3. Distribuciones Distribución de Gauss FWHM: Full width at half maximum FWHM / 2 Caso de una pico gaussiano ( x − µ )2 1 exp − 2 2 σ 2π σ P Se plantea entonces que: P ( FWHM / 2) = MAX 2 En este caso: P ( x ) = Entonces 1 1 = 2 2π σ Y considerando el caso de una gaussiana centrada en el origen (µ = 0) resulta que: P ( FWHM / 2) = PMAX = P (0) = − 1 e 2π σ ( FWHM / 2 ) 2 1 e0 = 2π σ 2σ 2 1 2π σ 1/ 2 = e 1 e 2π σ − − ( FWHM / 2 ) 2 2σ 2 ( FWHM / 2 ) 2 2σ 2 ( FWHM / 2) 2 = −2σ 2 ln(1 / 2) FWHM = 2 2 ln 2 σ = 2.355 σ 33 Astronomía Observacional: Incertezas G.L. Baume - 2013 3. Distribuciones Distribución de Gauss y distribución de Poisson La distribución de Poisson tiende a una gaussiana cuando “µ” es elevado En este caso σ y µ ya NO son independientes y tienen la relacion vista para una distribución de Poisson µ=2 σ = 1.41 µ = 10 σ = 3.16 34 Astronomía Observacional: Incertezas G.L. Baume - 2013 3. Distribuciones Distribución Genérica Las expresiones generales de “valor medio” y “dispersión” son: Para una distribución discreta +∞ +∞ ∑ xi P( xi ) µ= ∑ (x i σ 2 = i = −∞ i = −∞ +∞ ∑ P( xi ) − µ ) 2 P ( xi ) +∞ ∑ P( x ) i i = −∞ i = −∞ Para una distribución contínua +∞ ∫ µ= ∫ x P ( x ) dx −∞ +∞ −∞ σ2 ∫ = +∞ −∞ ( x − µ ) 2 P ( x ) dx P ( x ) dx ∫ +∞ −∞ P ( x ) dx 35 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Herramientas en Python Paquete: scipy.stats poisson A Poisson discrete random variable. norm A normal continuous random variable. multivariate_normal A multivariate normal random variable. http://docs.scipy.org/doc/scipy/reference/stats.html#module-scipy.stats 36 Astronomía Observacional: Incertezas G.L. Baume - 2013 Incertezas 1. Introducción 2. Conceptos Básicos 3. Distribuciones 4. Análisis de incertidumbre 5. Tópicos Adicionales 37 Astronomía Observacional: Incertezas G.L. Baume - 2014 4. Análisis de incertidumbre Este se conoce también como “propagación de errores” Es el procedimiento para calcular la incerteza de un valor final que depende de varias medidas, cada una de las cuales con su propia incerteza Varianza de una función G de n variables: G = G(x1, x2, x3,…, xn) 2 ∂G 2 σ xi + covar σ G2 = ∑ ∂ x i =1 i n Nota: Para el caso de variables independientes, los términos de coviarianza se anulan 38 Astronomía Observacional: Incertezas G.L. Baume - 2014 4. Análisis de incertidumbre Ejemplos Para el caso (habitual) de variables independientes se obtienen los siguientes resultados Relacion lineal Cociente Exponentes x = ±a Producto u v Potencias Logaritmos 39 Astronomía Observacional: Incertezas G.L. Baume - 2016 4. Análisis de incertidumbre N imágenes Imagen combinada http://www.astro.keele.ac.uk/astrolab/results/week03/week03.pdf 40 Astronomía Observacional: Incertezas G.L. Baume - 2014 4. Análisis de incertidumbre Ejemplos astronómicos Magnitudes Un error de 0.01 mag corresponde aproximadamente a un error de 1% en el flujo medido Índices de color IC = m2 − m1 El error del índice de color es la suma cuadrática de los errores de las magnitudes individuales σ IC2 = σ m2 1 + σ m2 2 41 Astronomía Observacional: Incertezas G.L. Baume - 2015 Incertezas 1. Introducción 2. Conceptos Básicos 3. Distribuciones 4. Análisis de incertidumbre 5. Tópicos Adicionales 42 Astronomía Observacional: Incertezas G.L. Baume - 2016 5. Tópicos adicionales 5.1. Estadística Chi-cuadrado (χ2) Este es un método para medir: • Si las propiedades de una muestra sigue una determinada fdp • Si las propiedades de una muestra es similar (estadísticamente) a otra muestra [ fobsi − f i ]2 χ =∑ e 2fobsi 2 • Que tan diferentes es determinado conjunto de medidas respecto a un modelo teórico [Oi − Ei ]2 χ =∑ eo2 i 2 Comparación de modelos y datos en el caso del estudio de morfología de galaxias (http://spie.org/x14647.xml? ArticleID=x14647 ) Nota: La estadística χ2 supone que la distribución de las variables es gaussiana 43 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.1. Estadísitca Chi-cuadrado (χ2) Bondad del ajuste: χ2 posee su propia distribución estadística El valor de χ2 y la cantidad de grados de libertad (ν) permiten establecer la confiabilidad del modelo adoptado ν=2 ν=5 ν = 10 Regla aproximada: Un buen ajuste se logra cuando ν − 2ν < χ 2 <ν + 2ν ν=n–p n = cantidad de datos p = cantidad de parámetros (2 para el caso lineal; m y b) 44 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.2. Ajuste de mínimos cuadrados (L-S Fit) Este método minimiza la estadística χ2 en el caso de un ajuste funcional a un conjunto de datos Se tiene un conjunto de pares de valores (xi, yi) y se supone que existe una dependencia lineal entre ellos y=mx+b Se plantea entonces la función χ =∑ 2 [ yi − ( m xi + b)]2 σ i2 donde σi2 es el error de cada uno de los datos 45 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.2. Ajuste de mínimos cuadrados (L-S Fit) Y se buscan los valores de “m” y “b” que minimizan el valor de χ2. Tomando derivadas parciales e igualando a cero resulta entonces que: ∂χ 2 =0 ∂m ∂χ 2 =0 ∂b m= ∑ ( y − y ) ( x − x) ∑ ( x − x) i i 2 i b = y−m x 46 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.2. Ajuste de mínimos cuadrados (L-S Fit) Bondad del ajuste (caso lineal) a) Coeficiente de correlación Este se define como: r= r= ( µ xy σx σy n ∑ xy − (∑ x )(∑ y ) ) n ∑ x − (∑ x ) 2 2 ( ) n ∑ y − (∑ y ) 2 2 Pudiendo ser -1 ≤ r ≤ +1, siendo: • |r| = 1 en el caso de correlación perfecta • r = 0 en el caso de que los datos no tengan correlación alguna Si |r| > 0.8 se considera que la correlación es “fuerte”, mientras que si |r| < 0.3 se considera que la correlación es “debil” 47 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.2. Ajuste de mínimos cuadrados (L-S Fit) Bondad del ajuste (caso lineal) b) Coeficiente de determinación Este viene dado por r2 por (0 ≤ r2 ≤ 1) Este coeficiente brinda una medida de que tan confiable es hacer predicciones a partir del modelo lineal adoptado El coeficiente representa el porcentaje de los datos que están mas cerca del mejor ajuste Ejemplo: Si r = 0.922, entonces r2 = 0.850, esto significa que el 85% de la variación total en y puede explicarse por la relación lineal entre x e y dada por el mejor ajuste. El otro 15% del la variación total en y permanece sin explicación por el modelo lineal 48 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.2. Ajuste de mínimos cuadrados Además del valor numérico del de correlación es coeficiente importante la información que proveen los gráficos ya que con ellos es posible: • Detectar posibles “outliers” • Sugerir un modelo mejor para los datos http://en.wikipedia.org/wiki/Anscombe's_quartet Cuarteto de Anscombe: Este consiste en cuatro conjuntos de datos, todos ellos con las mismas propiedades estadísticas (valores medios, correlación, etc) pero con gráficos con estructuras claramente diferentes 49 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales 5.3. Test de Kolmogorov-Smirnov (K-S Test) Este test permite:: • Comparar la distribución de un conjunto de datos (con n intervalos) con una distribución teórica • Comparar las distribuciones de dos conjunto de datos (con n1 y n2 intervalos) D D 50 Astronomía Observacional: Incertezas G.L. Baume - 2013 2. Conceptos Básicos Ejemplo 2: Herramientas en Python Paquete: scipy.stats ttest_1samp(a, popmean) Calculates the T-test for the mean of ONE group of scores. ttest_ind(a, b) Calculates the T-test for the means of TWO INDEPENDENT samples of scores. ttest_ind_from_stats(mean1, T-test for means of two independent samples from std1, nobs1, ...) descriptive statistics. ttest_rel(a, b) Calculates the T-test on TWO RELATED samples of scores, a and b. kstest(rvs, cdf) Perform the Kolmogorov-Smirnov test for goodness of fit. http://docs.scipy.org/doc/scipy/reference/stats.html#module-scipy.stats 51 Astronomía Observacional: Incertezas G.L. Baume - 2015 5. Tópicos adicionales Kolmogorov-Smirnov test (K-S Test) Procedimiento: Se construyen las correspondientes funciones distribución acumuladas La función distribución acumulada de z viene dada por: Se determina la máxima separación (D) entre ambas distribuciones ∞ Se calcula el parámetro z dado por: z= n D z= para un solo conjunto de datos n1 n2 D n1 + n2 para un par de conjuntos de datos L ( z ) = 1 − 2∑ ( −1) k −1 e − 2 k 2 2 z k =1 Se calcula el grado de confiabilidad a partir de: • Directamente L(z) • una aproximación apropiada a L(z) • Una tabulación de L(z) 52 Astronomía Observacional: Incertezas G.L. Baume - 2015 Incertezas 1. Introducción 2. Conceptos Básicos 3. Distribuciones 4. Análisis de incertidumbre 5. Tópicos Adicionales 53