Document

Anuncio
Pattern
Recognition
Semestre Agosto-Diciembre 2012
Mediana
• La mediana de una colección de datos ordenados
en orden de magnitud es el valor medio o media
aritmética de los 2 valores medios.
• Ej. 3,4,4,5,6,8,8,8,10 => mediana = 6
• Ej. 5,5,7,9,11,12,15,18 => mediana=(9+11)/2=10
æ N
ö
ç -å f ÷
Mediana = L + ç 2
÷c
ç fmediana ÷
è
ø
L = límite inferior de la clase mediana
N= # total de datos
Σf= suma de frecuancias de todas las clases por debajo de la clase mediana
Fmediana = frecuencia clase mediana
C= tamaño del intervalo de la clase mediana
• Geométricamente la mediana es el valor de X que
corresponde a la vertical que divide un histograma
en 2 parte de igual área.
Moda
• La moda de una serie de números es aquel valor
que se presenta con mayor frecuencia, es decir el
más común.
• La moda puede no existir, o si existe puede nos ser
única.
Media Geométrica (G)
• G de una serie de N números X1 ,X2, X3, …, XN es la
raíz N-ésima del producto de los números.
G =N X1X2 X3, ...,Xn
Media Armónica (H)
H=
1
1 N 1
å
N j =1 X j
Note que:
H £ G£ X
Las tres medias son iguales tos los números X son iguales.
Raíz Cuadrada del
Cuadrado de la Media
(RMS)
• RMS o media cuadrática de una serie de números
X1 ,X2, X3, …, XN se define como:
N
åX
RMS=
j =1
N
2
j
Cuartiles
• Aquellos valores que dividen los datos ordenados
en 4 partes iguales. Estos valores son representados
por: Q1, Q2 y Q3 se llaman primero, segundo y tercer
cuartil, respectivamente. Note que:
• Mediana = Q2
Desviación Estándar y
Otras Medidas de
Dispersión
• Dispersión o variación es el grado en que los dato
numéricos tienden a extenderse alrededor de un
valor medio.
Desviación Media
• De una serie de N números X1 ,X2, X3, …, XN se
define como:
N
DM =
åX
j
j =1
Donde:
X = media aritmética
· = valor absoluto
N
-X
• Si X1, X2, X3, …, Xk se presentan en frecuencias f1, f2,
f3, …, fk reescribimos MD como:
k
DM =
åf
j =1
j
Xj - X
N
Donde:
K
N = å fj
j=1
Note que podemos usar cualquier valor ‘a’ de referencia, pero MD es
mínima respecto a la mediana
k
DM =
åf
j =1
j
Xj - a
N
Rango Semiintercuartílico
o desviación cuartílica
• De una serie de datos se define como:
Rango semiintercuartilico=Q=
Q3 -Q1
2
donde Q1 y Q3 son el primer y tercer cuartil de los datos
Rango entre percentiles
• De una serie de datos viene definido por:
Rango Percentil 10 - 90 = P90 - P10
Donde P10 y P90 son el percentil décimo nonagésimo de los datos
Desviación Típica
• De una serie de N números X1, X2, X3, …, XN se
representa por ‘s’ y se define por:
N
åX
s=
j
-X
2
j =1
N
k
å f j Xj - X
s=
2
j =1
N
Nota: se usa el denominador N-1 cuando N<30
Varianza
• La varianza de un conjunto de datos se define
como el cuadrado de la desviación típica y viene
dada por:
• Varianza = s2
• Nota: s2 = varianza muestral
•
σ2 = varianza poblacional
Propiedades de la
Desviación Típica
• Se puede definir la desviación típica respecto a
algún promedio ‘a’ distinto de la media aritmética.
Sin embargo, es mínima cuando a=media
aritmética.
• Para distribuciones normales resulta que:
• A) el 68.27 % de los datos están comprendidos
entre X  s y X  s
• A) el 95.45 % de los datos están comprendidos
entre X  2s X  2s
• A) el 99.73 % de los datos están comprendidos
entre X  3s X  3s
Dispersión Absoluta y
relativa. Coeficiente de
variación
• La dispersión o variación real determinada por la
desviación típica se la dispersión absoluta (DA).
• La dispersión relativa se define por:
DR 
DA
promedio
• El coeficiente de dispersión o variación se define
por:
s
DR 
X
Variable normalizada o
tipificada
X-X
z
s
Momentos, Sesgo y
Curtosis
• Si X1 ,X2, X3, …, XN son los N valores que toma la
variable X, se define la cantidad:
N
X1r + X2r +... + XNr
X =
=
N
r
åX
r
j
j=1
N
Como el momento de orden ‘r’, respecto al origen si
la media es cero..
• El momento de orden ’r’ respecto a la media se
define como:
å(X - X)
N
r
j
mr =
j=1
N
Sesgo
• Es el grado de asimetría de una distribución
sesgo =
(X - Mediana)
sesgo =
s
X - Moda
s
Coeficiente de sesgo = a3 =
Coeficiente de sesgo int ercuartilico =
m3
m3
=
s3
m32
Coeficiente de sesgo = (a3 )2
(Q3 - Q2 ) - (Q2 - Q1 )
(Q3 - Q1 )
Curtosis
• El grado de Apuntamiento de una distribución
Coeficiente de curtosis = a4 =
m4
m3
=
s4
m24
Descargar