Pattern Recognition Semestre Agosto-Diciembre 2012 Mediana • La mediana de una colección de datos ordenados en orden de magnitud es el valor medio o media aritmética de los 2 valores medios. • Ej. 3,4,4,5,6,8,8,8,10 => mediana = 6 • Ej. 5,5,7,9,11,12,15,18 => mediana=(9+11)/2=10 æ N ö ç -å f ÷ Mediana = L + ç 2 ÷c ç fmediana ÷ è ø L = límite inferior de la clase mediana N= # total de datos Σf= suma de frecuancias de todas las clases por debajo de la clase mediana Fmediana = frecuencia clase mediana C= tamaño del intervalo de la clase mediana • Geométricamente la mediana es el valor de X que corresponde a la vertical que divide un histograma en 2 parte de igual área. Moda • La moda de una serie de números es aquel valor que se presenta con mayor frecuencia, es decir el más común. • La moda puede no existir, o si existe puede nos ser única. Media Geométrica (G) • G de una serie de N números X1 ,X2, X3, …, XN es la raíz N-ésima del producto de los números. G =N X1X2 X3, ...,Xn Media Armónica (H) H= 1 1 N 1 å N j =1 X j Note que: H £ G£ X Las tres medias son iguales tos los números X son iguales. Raíz Cuadrada del Cuadrado de la Media (RMS) • RMS o media cuadrática de una serie de números X1 ,X2, X3, …, XN se define como: N åX RMS= j =1 N 2 j Cuartiles • Aquellos valores que dividen los datos ordenados en 4 partes iguales. Estos valores son representados por: Q1, Q2 y Q3 se llaman primero, segundo y tercer cuartil, respectivamente. Note que: • Mediana = Q2 Desviación Estándar y Otras Medidas de Dispersión • Dispersión o variación es el grado en que los dato numéricos tienden a extenderse alrededor de un valor medio. Desviación Media • De una serie de N números X1 ,X2, X3, …, XN se define como: N DM = åX j j =1 Donde: X = media aritmética · = valor absoluto N -X • Si X1, X2, X3, …, Xk se presentan en frecuencias f1, f2, f3, …, fk reescribimos MD como: k DM = åf j =1 j Xj - X N Donde: K N = å fj j=1 Note que podemos usar cualquier valor ‘a’ de referencia, pero MD es mínima respecto a la mediana k DM = åf j =1 j Xj - a N Rango Semiintercuartílico o desviación cuartílica • De una serie de datos se define como: Rango semiintercuartilico=Q= Q3 -Q1 2 donde Q1 y Q3 son el primer y tercer cuartil de los datos Rango entre percentiles • De una serie de datos viene definido por: Rango Percentil 10 - 90 = P90 - P10 Donde P10 y P90 son el percentil décimo nonagésimo de los datos Desviación Típica • De una serie de N números X1, X2, X3, …, XN se representa por ‘s’ y se define por: N åX s= j -X 2 j =1 N k å f j Xj - X s= 2 j =1 N Nota: se usa el denominador N-1 cuando N<30 Varianza • La varianza de un conjunto de datos se define como el cuadrado de la desviación típica y viene dada por: • Varianza = s2 • Nota: s2 = varianza muestral • σ2 = varianza poblacional Propiedades de la Desviación Típica • Se puede definir la desviación típica respecto a algún promedio ‘a’ distinto de la media aritmética. Sin embargo, es mínima cuando a=media aritmética. • Para distribuciones normales resulta que: • A) el 68.27 % de los datos están comprendidos entre X s y X s • A) el 95.45 % de los datos están comprendidos entre X 2s X 2s • A) el 99.73 % de los datos están comprendidos entre X 3s X 3s Dispersión Absoluta y relativa. Coeficiente de variación • La dispersión o variación real determinada por la desviación típica se la dispersión absoluta (DA). • La dispersión relativa se define por: DR DA promedio • El coeficiente de dispersión o variación se define por: s DR X Variable normalizada o tipificada X-X z s Momentos, Sesgo y Curtosis • Si X1 ,X2, X3, …, XN son los N valores que toma la variable X, se define la cantidad: N X1r + X2r +... + XNr X = = N r åX r j j=1 N Como el momento de orden ‘r’, respecto al origen si la media es cero.. • El momento de orden ’r’ respecto a la media se define como: å(X - X) N r j mr = j=1 N Sesgo • Es el grado de asimetría de una distribución sesgo = (X - Mediana) sesgo = s X - Moda s Coeficiente de sesgo = a3 = Coeficiente de sesgo int ercuartilico = m3 m3 = s3 m32 Coeficiente de sesgo = (a3 )2 (Q3 - Q2 ) - (Q2 - Q1 ) (Q3 - Q1 ) Curtosis • El grado de Apuntamiento de una distribución Coeficiente de curtosis = a4 = m4 m3 = s4 m24