Incertezas Incertezas

Anuncio
Astronomía Observacional: Incertezas
G.L. Baume - 2013
Incertezas
1
Astronomía Observacional: Incertezas
G.L. Baume - 2013
Incertezas
1. Introducción
2. Conceptos Básicos
3. Distribuciones
4. Análisis de incertidumbre
5. Tópicos Adicionales
Bibliografía
To Measure the Sky by F. R. Chromey
Practical Statistics for Astronomers by J. V. Wall
1979 Q. J. R. Ast. Soc. 20, 138 – 1996 Q. J. R. Ast. Soc.37, 519
Observational Astrophysics (Apendix B)
by P. Lena, F. Lebrun & F. Mignard
2
Astronomía Observacional: Incertezas
G.L. Baume - 2013
1. Introducción
Dado que las teorías prouestas se basan en
los datos astronómicos obtenidos en las
observaciones, es necesario tener una idea
de que tan confiables son dichos datos
El grado de confiabilidad viene dado por la
incerteza o error con que se conoce una
dada medida
“Ninguna
cantidad
obtenida
observacionalmente es realmente
util si ella no tiene un error
asociado”
3
Astronomía Observacional: Incertezas
G.L. Baume - 2014
1. Introducción
Ejemplos
Velocidad radial de la estrella HD 187085.
Medidas con su respectivo error y dos
posibles ajustes a los datos
http://plus.maths.org/content/hunting-lifealien-worlds
Curvas de luz de Kepler-37. Los paneles
indican los tránsitos de los planetas Kepler37b (a), Kepler-37c (b) y Kepler-37d (c).
http://www.nature.com/nature/journal/v494/n74
38/fig_tab/nature11914_F1.html
4
Astronomía Observacional: Incertezas
G.L. Baume - 2013
Incertezas
1. Introducción
2. Conceptos Básicos
3. Distribuciones
4. Análisis de incertidumbre
5. Tópicos Adicionales
5
Astronomía Observacional: Incertezas
G.L. Baume - 2014
2. Conceptos Básicos
Error absoluto
Es la diferencia entre el “valor medido” y el
“valor verdadero” (desconocido).
Este es una medida de la incerteza con las
mismas unidades que el valor medido
Ejemplo:
El largo de una mesa es de 2.3 ± 0.1 m.
Error relativo
Este representa el error absoluto como una
http://antongerdelan.net/teaching/vis/datar
fracción o porcentaje
eps/lec-datareps.html
Ejemplo:
0.1m/2.3m = 0.04 = 4%.
El error en la medida del largo de la mesa es
del 4%
6
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Exacto
Inexacto
Exactitud
Indica que tan cerca se encuentra una
medida del “valor verdadero”
También se la conoce como “error
sistemático”
Preciso
Precisión
Impreciso
Indica que tan bien se determina una
medición. O sea, gran cantidad de dígitos
significativos indica gran precisión
Tambien se la conoce como “error de
repetitividad”, “error aleatorio”, “error
interno” o simplemente “ruido”.
El error absoluto de una medidia viene dado entonces
por la suma del error sistemático y de repetitividad
ε Total = ε Sist . + ε Aleat
.
Nota: El error total
tambien
se
suele
conocer como “error
externo”
7
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Exacto
Inexacto
Exactitud:
La exactitud en una medida es muy dificil de
cuantificar dado que normalmente no se
conoce el “valor verdadero” de una medida
y es en definitiva la limitación mas seria de
todo resultado experimental u observacional
Preciso
Impreciso
La forma de estimar la exactitud seria:
• Hacer varias medidas
• Utiizar instrumentos diferentes
• Utilizar métodos diferentes
• Utilizar observadores diferentes
y comparar todos los resultados
8
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Exacto
Inexacto
Precisión
La precisión es relativamente facil de
cuantificar
simplemente
comparando
distintas medidas
Ejemplos:
N
∆ max = xmax − xmin
∑ x −x
i
∆ medio =
∑ (x
2
i − x)
s=
N
N
N
∑ ( xi − x) 2
i =1
Impreciso
i =1
N
rms =
Preciso
i =1
Nota
N
∑x
i
N −1
x=
i =1
N
9
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Equivocaciones (o no...)
Se consideran “equivocaciones” a aquellas
medidas extremadamente diferentes del
resto del conjunto
WR 25
Radial Velocity (km/s)
(λ4058)
Estas se suelen eliminar del conjunto de
datos, aunque esto puede ser peligroso si
tales
valores
no
son
realmente
equivocaciones
sino
comportamientos
reales de la medida bajo estudio
Gamen et al. 2006, A&A 460, 777
Diferentes símbolos indican
medidas de distintos autores
(Línea interestelar)
10
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Población
Es el conjunto de “todos” los posibles
resultados de una dada medida
Muestra
Es el conjunto de
efectivamente hechas
deseada
las
de
mediciones
la medida
Nota: La población puede ser un conjunto infinito
o muy grande dependiendo de su naturaleza,
mientras que la muestra es normalmente un
número manejable de valores
Inferencia estadística
Se denomina así a la determinación de
propiedades de la “población” a partir del
estudio de una “muestra” de ella
11
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplos
Población: El peso de cada persona en la Tierra
Muestra 1: El peso de cada alumno de un aula
Muestra 2: El peso de 100 personas esparcidas
aleatoriamente en el mundo
Población: Las luminosidades de las estrellas de la Vía Láctea
Muestra 1: Las luminosidades de las 100 estrellas más cercanas
Muestra 2: Las lumniosidades de 100 estrellas esparcidas al azar
en la Vía Láctea
Población: Todas las posibles medidas de la magnitud de una
estrella
Muestra 1: 5 medidas de la magnitud de la estrella
Muestra 2: 100 medidas de la magnitud de la estrella
12
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Distribución de probabilidades
Toda medida vinculada a una población posee una
función distribución asociada (P(x); contínua o
discreta) que describe que tan probable es obtener un
determinado valor de esa medida
Dicha función se denomina:
• Función Distribución Normalizada o
• Distribución de Probabilidad
de la medida
De esta forma:
• Caso contínuo:
P(x) dx = probabilidad de que la medida se encuentre
entre x y x+dx
• Caso discreto:
P(xj) = probabilidad de obtener un valor x = xj
13
Astronomía Observacional: Incertezas
G.L. Baume - 2014
2. Conceptos Básicos
Valores característicos
Para una muestra de una medida con una
determinada Distribución de Probabilidad, es
posible
obtener
ciertos
valores
característicos:
Indicadores del valor central:
• Valor medio (µ)
• Mediana (µ1/2): valor que divide la población
exactamente a la mitad
• Moda (µmax): valor mas frecuente (probable)
de la población
Nota: En el caso de una distribución simétrica los
tres valores son coincidentes
Indicadores de la dispersión
• Desviación estándard (σ)
µ = lim x
σ = lim s
N →∞
N →∞
N
N
∑ (x
∑x
i
i
x=
i =1
N
s=
− x) 2
i =1
N −1
14
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Valores característicos
Valor medio (µ)
Ventajas:
• Facil de calcular
• Funciona bien para
simétricas
Outliers
distribuciones
Desventajas:
• Sensible a “outliers” (valores alejados
de la mayoría)
• No es bueno para distribuciones con
mas de un pico
Error del valor medio
Este viene dado por:
ex ≈
s
N
15
Astronomía Observacional: Incertezas
G.L. Baume – 2016
2. Conceptos Básicos
Valores característicos
Mediana (µ1/2) y Moda (µmax)
Outliers
Ventajas:
• Ambos valores son casi o totalmente
insensible a los “outliers”
Desventajas:
• El cálculo de ambos valores es más
complicado que la determinación del
valor medio
16
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Otros valores característicos
Sesgo (“Skew”)
Este indica hacia donde se encuentra
desplazada la moda respecto al valor medio
Curtosis
Este indica que tan concentrada es una
distribución alrededor de su valor medio
17
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 1:
Combinación de medidas
Se ha determinado la distancia al centro
de la Vía Láctea utilizando tres métodos
diferentes, resultando:
Método 1: 8.0 ± 0.3 kpc
Método 2: 7.8 ± 0.7 kpc
Método 3: 8.25 ± 0.20 kpc
El mejor estimador combinado de todas
las medidas individuales (yi) viene dado
por la “media pesada” (yc ± εc)
Russeil et al 2003
N
∑w
i
yc =
i =1
N
yi
∑ wi
i =1
ε c2 =
1
N
∑ wi
i =1
wi =
1
El resultado combinado es:
ε i2
d = 8.15 ± 0.16 kpc
18
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Tareas en IRAF
Imstatistics
Dada una matriz de valores (imagen digital), esta tarea provee una
determinada cantidad de parámetros estadísticos
Parámetros
estadísticos
análisis
Imagen
Matriz
34
22
31
34
33
22
28
18
32
28
16 26 33
20 44 34
70 98 66
99 229 107
67 103 67
33 34 29
22 17 16
25 27 26
23 16 29
28 28 24
37
22
37
38
36
36
32
17
25
26
22
26
25
28
32
24
24
18
24
26
25 25 29 19
14 30 30 20
35 36 39 39
46 102 159 93
69 240 393 248
65 241 363 244
46 85 157 84
30 29 35 24
30 28 20 35
17 19 30 35
28
19
23
37
69
68
42
30
22
30
25
17
20
22
30
24
22
27
23
26
19
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Tareas en IRAF
Imstatistics
Parámetros estadísticos
image: the image name
npix: the number of pixels used to do the statistics
mean: the mean of the pixel distribution
midpt: estimate of the median of the pixel distribution
mode: the mode of the pixel distribution
stddev: the standard deviation of the pixel distribution
skew: the skew of the pixel distribution
kurtosis: the kurtosis of the pixel distribution
min: the minimum pixel value
max: the maximum pixel value image - the image name
20
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Tareas en IRAF
Imstatistics
Parámetros característicos
mean = sum (x1,...,xN) / N
y = x - mean
variance = sum (y1 ** 2,...,yN ** 2) / (N-1)
stddev = sqrt (variance)
skew = sum ((y1 / stddev) ** 3,...,(yN / stddev) ** 3) / (N-1)
kurtosis = sum ((y1 / stddev) ** 4,...,(yN / stddev) ** 4) / (N-1) - 3
21
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Tareas en IRAF
Imcombine
Combina varias imágenes (matrices) en una sola, permitiendo
elegir como se realiza dicha combinación
Los parámetros principales son:
o Combine
procesamiento
Indica la forma en que se
combinan los valores de las
distintas imágenes
Imagen
combinada
o Reject
Indica el criterio de selección
de los valores de las distintas
imágenes
Varias imágenes
22
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Tareas en IRAF
Imcombine
reject:
combine:
average:
weighted
average
median: median
lmedian:
median
except use the lower
value if only two
sum: (weighted) sum
quadrature: weighted
quadrature average
nmodel:
weighted
quadrature average of
noise model values
none: No rejection
minmax: Reject the nlow and nhigh
pixels
ccdclip: Reject pixels using CCD
noise parameters
crreject: Reject only positive
pixels using CCD noise parameters
sigclip: Reject pixels using a sigma
clipping algorithm
avsigclip: Reject pixels using an
averaged sigma clipping algorithm
pclip: Reject pixels using sigma
based on percentiles
23
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Herramientas en Python
Paquete: scipy.stats
describe(a)
Computes several descriptive statistics of the passed array.
Parameters:
a: Input data.
Returns:
nobs : Number of observations (length of data along axis).
minmax: Minimum and maximum value of data array.
mean : Arithmetic mean of data along axis.
variance : Unbiased variance of the data along axis, denominator
is number of observations minus one.
skewness : Skewness, based on moment calculations with
denominator equal to the number of observations, i.e. no degrees
of freedom correction.
kurtosis : Kurtosis (Fisher). The kurtosis is normalized so that it is
zero for the normal distribution. No degrees of freedom are used.
http://docs.scipy.org/doc/scipy/reference/stats.html#module-scipy.stats
24
Astronomía Observacional: Incertezas
G.L. Baume - 2013
Incertezas
1. Introducción
2. Conceptos Básicos
3. Distribuciones
4. Análisis de incertidumbre
5. Tópicos Adicionales
25
Astronomía Observacional: Incertezas
G.L. Baume - 2016
3. Distribuciones
Distribución de Poisson
Esta distribución describe el comportamiento
de una población resultante en determinados
experimentos de conteo (eventos producidos
en un dado intervalo de tiempo)
Ejemplos:
Cantidad de gotas que caen en una baldosa en
un segundo
Cantidad de autos que pasan por un lugar de la
ruta en una hora (lejos de los semáforos)
Cantidad de fotones que caen un cierta área de
un detector en 10 segundos
Cantidad de decaimientos nucleares de una
sustancia radioactiva en una hora
26
Astronomía Observacional: Incertezas
G.L. Baume - 2016
3. Distribuciones
Distribución de Poisson
Esta viene dada por la siguiente expresión:
Pµ ( n, t ) =
µn
n!
e−µ
Pµ(n,t) expresa la probabilidad de tener n
eventos en un tiempo t si se sabe que
ellos ocurren con una tasa λ [eventos por
u. de tiempo] y entonces un valor medio
dado por:
http://inspirehep.net/record/868729/plots
Se puede demostrar que, para esta
distribución, la desviación estándard
viene dada por:
µ =λt
σ= µ
27
Astronomía Observacional: Incertezas
G.L. Baume - 2016
3. Distribuciones
Distribución de Poisson
Resultados
Ejemplo 1:
P12.5 (12 fot ,10 seg ) = 0.1132
Determinar cuantos fotones son
recibidos en 10 segundos de una
fuente (no variable) a la que le
corresponde una tasa media
(recibida) es de 1.25 fot/seg.
P12.5 (13 fot ,10 seg ) = 0.1089
Planteo
Pµ ( n, t ) =
µn
n!
O sea que en una medida de 10 segundos
es un poco mas probable medir 12 fotones
que 13 fotoenes
P12.5 (9 fot ,10 seg ) = 0.0765 ≈ 0.08
e−µ
λ = 1.25 fotones / seg .
µ = 12.5 fotones
O sea que si se hacen 100 observaciones
de 10 segundos se detectarán 9 fotones
en casi 8 de ellas
Entonces, cada observación es una
“imagen aleatoria de la realidad”
28
Astronomía Observacional: Incertezas
G.L. Baume - 2016
3. Distribuciones
Distribución de Poisson
Ejemplo 2:
O sea:
Dterminar el error relativo debido a Poisson
si durante un tiempo “t” se cuentan “N”
fotones recibidos de una estrella
Si N = 10 entonces σ
µ = 31.6 %
Si N = 100 entonces
σ µ = 10 %
Planteo
Valor medio:
Conclusiones
µ≈x=N
Es importante aumentar el valor
de N para disminuir el error
relativo
Esto se puede hacer:
• Aumentando el tiempo de
integración
• Aumentando el diámetro del
telescopio
• Haciendo ambas cosas
Nota: Seria mejor hacer varias medidas y tomar el
promedio de ellas
σ = µ1 2 ≈ N
Estimación del error:
Nota: Se supone que el “error sistemático es nulo
Error relativo:
1
σ
≈
µ
N
29
Astronomía Observacional: Incertezas
G.L. Baume - 2013
3. Distribuciones
Distribución de Gauss
Esta disstribución describe gran
cantidad de poblaciones y es util
incluso si la población no la sigue
En este caso
independientes
σ
y
µ
son
Distribución normal estándard: Se
denomina así cuando µ = 0 y σ = 1
P ( x) = N ( µ , σ ) =
http://en.wikipedia.org/wiki/Normal_distribution
 ( x − µ )2 
1

exp  −
2
2
σ
2π σ


x2
Pstd ( x ) = N (0,1) =
1 −2
e
2π
30
Astronomía Observacional: Incertezas
G.L. Baume - 2013
3. Distribuciones
Distribución de Gauss
Niveles de confiabilidad:
El área bajo una gaussiana estándard
entre µ – n σ y µ + n σ viene dada
por
 n 
An = erf 

 2
http://en.wikipedia.org/wiki/Normal_distribution
Resulta entonces que:
siendo
erf ( x ) =
2
π
x
∫e
−t 2
dt
0
la denominada “función error”
• A1 = 68.3%
• A2 = 95.5%
• A3 = 99.7%
Esta se denomina ”regla de 3 σ.”
31
Astronomía Observacional: Incertezas
G.L. Baume - 2013
3. Distribuciones
PMAX
Distribución de Gauss
FWHM: Full width at half maximum
PMAX
2
Se denomina así a la separación en x entre dos
puntos en los que
P ( x, µ , σ ) =
1
PMAX ( x, µ , σ )
2
El FWHM se puede definir de forma análoga para
cualquier función con un pico
32
Astronomía Observacional: Incertezas
G.L. Baume - 2013
3. Distribuciones
Distribución de Gauss
FWHM: Full width at half maximum
FWHM / 2
Caso de una pico gaussiano
 ( x − µ )2 
1

exp  −
2
2
σ
2π σ


P
Se plantea entonces que: P ( FWHM / 2) = MAX
2
En este caso: P ( x ) =
Entonces
1 1
=
2 2π σ
Y considerando el caso de una gaussiana
centrada en el origen (µ = 0) resulta que:
P ( FWHM / 2) =
PMAX = P (0) =
−
1
e
2π σ
( FWHM / 2 ) 2
1
e0 =
2π σ
2σ 2
1
2π σ
1/ 2 = e
1
e
2π σ
−
−
( FWHM / 2 ) 2
2σ 2
( FWHM / 2 ) 2
2σ 2
( FWHM / 2) 2 = −2σ 2 ln(1 / 2)
FWHM = 2 2 ln 2 σ = 2.355 σ
33
Astronomía Observacional: Incertezas
G.L. Baume - 2013
3. Distribuciones
Distribución de Gauss y distribución de Poisson
La distribución de Poisson tiende a una gaussiana cuando “µ” es elevado
En este caso σ y µ ya NO son independientes y tienen la relacion vista para una
distribución de Poisson
µ=2
σ = 1.41
µ = 10
σ = 3.16
34
Astronomía Observacional: Incertezas
G.L. Baume - 2013
3. Distribuciones
Distribución Genérica
Las expresiones generales de “valor medio” y
“dispersión” son:
Para una distribución discreta
+∞
+∞
∑ xi P( xi )
µ=
∑ (x
i
σ 2 = i = −∞
i = −∞
+∞
∑ P( xi )
− µ ) 2 P ( xi )
+∞
∑ P( x )
i
i = −∞
i = −∞
Para una distribución contínua
+∞
∫
µ=
∫
x P ( x ) dx
−∞
+∞
−∞
σ2
∫
=
+∞
−∞
( x − µ ) 2 P ( x ) dx
P ( x ) dx
∫
+∞
−∞
P ( x ) dx
35
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Herramientas en Python
Paquete: scipy.stats
poisson
A Poisson discrete random variable.
norm
A normal continuous random variable.
multivariate_normal
A multivariate normal random variable.
http://docs.scipy.org/doc/scipy/reference/stats.html#module-scipy.stats
36
Astronomía Observacional: Incertezas
G.L. Baume - 2013
Incertezas
1. Introducción
2. Conceptos Básicos
3. Distribuciones
4. Análisis de incertidumbre
5. Tópicos Adicionales
37
Astronomía Observacional: Incertezas
G.L. Baume - 2014
4. Análisis de incertidumbre
Este se conoce también como “propagación de errores”
Es el procedimiento para calcular la incerteza de un valor final que depende de varias
medidas, cada una de las cuales con su propia incerteza
Varianza de una función G de n variables:
G = G(x1, x2, x3,…, xn)
2
 ∂G  2
 σ xi + covar
σ G2 = ∑ 
∂
x
i =1 
i 
n
Nota:
Para el caso de variables independientes, los términos de coviarianza se anulan
38
Astronomía Observacional: Incertezas
G.L. Baume - 2014
4. Análisis de incertidumbre
Ejemplos
Para el caso (habitual) de variables independientes se obtienen los siguientes
resultados
Relacion lineal
Cociente
Exponentes
x = ±a
Producto
u
v
Potencias
Logaritmos
39
Astronomía Observacional: Incertezas
G.L. Baume - 2016
4. Análisis de incertidumbre
N imágenes
Imagen
combinada
http://www.astro.keele.ac.uk/astrolab/results/week03/week03.pdf
40
Astronomía Observacional: Incertezas
G.L. Baume - 2014
4. Análisis de incertidumbre
Ejemplos astronómicos
Magnitudes
Un error de 0.01 mag corresponde
aproximadamente a un error de 1%
en el flujo medido
Índices de color
IC = m2 − m1
El error del índice de color es la
suma cuadrática de los errores de las
magnitudes individuales
σ IC2 = σ m2 1 + σ m2 2
41
Astronomía Observacional: Incertezas
G.L. Baume - 2015
Incertezas
1. Introducción
2. Conceptos Básicos
3. Distribuciones
4. Análisis de incertidumbre
5. Tópicos Adicionales
42
Astronomía Observacional: Incertezas
G.L. Baume - 2016
5. Tópicos adicionales
5.1. Estadística Chi-cuadrado (χ2)
Este es un método para medir:
• Si las propiedades de una muestra sigue
una determinada fdp
• Si las propiedades de una muestra es
similar (estadísticamente) a otra muestra
[ fobsi − f i ]2
χ =∑
e 2fobsi
2
• Que tan diferentes es determinado
conjunto de medidas respecto a un
modelo teórico
[Oi − Ei ]2
χ =∑
eo2 i
2
Comparación de modelos y datos en el
caso del estudio de morfología de
galaxias (http://spie.org/x14647.xml?
ArticleID=x14647 )
Nota: La estadística χ2 supone
que la distribución de las variables
es gaussiana
43
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.1. Estadísitca Chi-cuadrado (χ2)
Bondad del ajuste:
χ2 posee su propia distribución estadística
El valor de χ2 y la cantidad de grados de
libertad (ν) permiten establecer la confiabilidad
del modelo adoptado
ν=2
ν=5
ν = 10
Regla aproximada:
Un buen ajuste se logra cuando
ν − 2ν < χ 2 <ν + 2ν
ν=n–p
n = cantidad de datos
p = cantidad de parámetros (2 para el caso lineal; m y b)
44
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.2. Ajuste de mínimos cuadrados (L-S Fit)
Este método minimiza la estadística χ2 en el
caso de un ajuste funcional a un conjunto de
datos
Se tiene un conjunto de pares de valores (xi, yi)
y se supone que existe una dependencia lineal
entre ellos
y=mx+b
Se plantea entonces la función
χ =∑
2
[ yi − ( m xi + b)]2
σ i2
donde σi2 es el error de cada uno de los datos
45
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.2. Ajuste de mínimos cuadrados (L-S Fit)
Y se buscan los valores de “m” y “b” que
minimizan el valor de χ2.
Tomando derivadas parciales e igualando a
cero resulta entonces que:
∂χ 2
=0
∂m
∂χ 2
=0
∂b
m=
∑ ( y − y ) ( x − x)
∑ ( x − x)
i
i
2
i
b = y−m x
46
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.2. Ajuste de mínimos cuadrados (L-S Fit)
Bondad del ajuste (caso lineal)
a) Coeficiente de correlación
Este se define como:
r=
r=
(
µ xy
σx σy
n ∑ xy − (∑ x )(∑ y )
)
n ∑ x − (∑ x )
2
2
(
)
n ∑ y − (∑ y )
2
2
Pudiendo ser -1 ≤ r ≤ +1, siendo:
• |r| = 1 en el caso de correlación perfecta
• r = 0 en el caso de que los datos no
tengan correlación alguna
Si |r| > 0.8 se considera que
la correlación es “fuerte”,
mientras que si |r| < 0.3 se
considera que la correlación
es “debil”
47
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.2. Ajuste de mínimos cuadrados (L-S Fit)
Bondad del ajuste (caso lineal)
b) Coeficiente de determinación
Este viene dado por r2 por (0 ≤ r2 ≤ 1)
Este coeficiente brinda una medida de que tan
confiable es hacer predicciones a partir del
modelo lineal adoptado
El coeficiente representa el porcentaje de los datos que están mas cerca del mejor
ajuste
Ejemplo: Si r = 0.922, entonces r2 = 0.850, esto significa que el 85% de la variación
total
en
y puede explicarse por la relación lineal entre x
e y dada por el mejor ajuste. El otro 15% del la variación total en y permanece sin
explicación por el modelo lineal
48
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.2. Ajuste de mínimos cuadrados
Además del valor numérico del
de
correlación
es
coeficiente
importante la información que proveen
los gráficos ya que con ellos es
posible:
• Detectar posibles “outliers”
• Sugerir un modelo mejor para los
datos
http://en.wikipedia.org/wiki/Anscombe's_quartet
Cuarteto de Anscombe:
Este consiste en cuatro conjuntos de datos, todos ellos con las mismas propiedades
estadísticas (valores medios, correlación, etc) pero con gráficos con estructuras
claramente diferentes
49
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
5.3. Test de Kolmogorov-Smirnov (K-S Test)
Este test permite::
• Comparar la distribución de un conjunto
de datos (con n intervalos) con una
distribución teórica
• Comparar las distribuciones de dos
conjunto de datos (con n1 y n2
intervalos)
D
D
50
Astronomía Observacional: Incertezas
G.L. Baume - 2013
2. Conceptos Básicos
Ejemplo 2: Herramientas en Python
Paquete: scipy.stats
ttest_1samp(a, popmean)
Calculates the T-test for the mean of ONE group of
scores.
ttest_ind(a, b)
Calculates the T-test for the means of TWO
INDEPENDENT samples of scores.
ttest_ind_from_stats(mean1, T-test for means of two independent samples from
std1, nobs1, ...)
descriptive statistics.
ttest_rel(a, b)
Calculates the T-test on TWO RELATED samples
of scores, a and b.
kstest(rvs, cdf)
Perform the Kolmogorov-Smirnov test for goodness
of fit.
http://docs.scipy.org/doc/scipy/reference/stats.html#module-scipy.stats
51
Astronomía Observacional: Incertezas
G.L. Baume - 2015
5. Tópicos adicionales
Kolmogorov-Smirnov test (K-S Test)
Procedimiento:
Se construyen las correspondientes
funciones distribución acumuladas
La función distribución acumulada
de z viene dada por:
Se determina la máxima separación (D)
entre ambas distribuciones
∞
Se calcula el parámetro z dado por:
z= n D
z=
para un solo conjunto
de datos
n1 n2
D
n1 + n2
para un par de
conjuntos de datos
L ( z ) = 1 − 2∑ ( −1) k −1 e − 2 k
2 2
z
k =1
Se
calcula
el
grado
de
confiabilidad a partir de:
• Directamente L(z)
• una aproximación apropiada
a L(z)
• Una tabulación de L(z)
52
Astronomía Observacional: Incertezas
G.L. Baume - 2015
Incertezas
1. Introducción
2. Conceptos Básicos
3. Distribuciones
4. Análisis de incertidumbre
5. Tópicos Adicionales
53
Descargar