Juan Carlos Colonia P. RESUMEN DE DATOS LAS MEDIDAS RESUMEN ¿Que son? • Las medidas resumen comúnmente llamados estadísticas son valores descriptivos de un conjunto de datos. ¿Cual es su utilidad? • Permiten resumir la información proveniente de un conjunto de datos pasando de una visión detallada a una idea general preservando sus características esenciales. ¿Por que resumir datos? •Para simplificar la información facilitando la comprensión de los mismos. •Facilitar el análisis comparativo. LAS MEDIDAS RESUMEN Medidas de Tendencia Central, Posición o Localización: Describen el valor alrededor del cual se distribuyen las observaciones. • Media • Mediana • Moda Medidas de Dispersión, Variabilidad o Escala: Miden la variabilidad de un conjunto de datos alrededor de un valor central. • Varianza • Desviación Estándar • Coeficiente de variación MEDIDAS DE DISPERSIÓN MEDIDAS DE DISPERSIÓN La dispersión de un conjunto de datos es variabilidad que presenta debido a que los datos no suelen ser constantes. Las Medidas de Dispersión son valores que indican variabilidad de los datos respecto a un punto de referencia alrededor del cual se concentran o agrupan los datos. Las principales Medidas de Dispersión son: La Varianza La Desviación Estándar El Coeficiente de Variación LA VARIANZA Es el promedio del cuadrado de las desviaciones de los valores de los datos respecto a la media de los mismos. Se simboliza por S2 o V X . 1 n 2 S xi x n i 1 2 La varianza es una buena medida de variabilidad debido a que si muchas de las diferencias son grandes o pequeñas, el valor de la varianza será grande o pequeño. LA VARIANZA Para calcular la varianza: Se calcula diferencia entre cada una de las observaciones y la media de todas las observaciones (desviación). Se elevan al cuadrado todas desviaciones Se halla el promedio de dichas desviaciones elevadas al cuadrado LA VARIANZA Ejemplo s 2 1.42 s 2 0.02 1.63 2 ....... 4.75 1.63 25 2 LA VARIANZA Cuando se tiene datos agrupados en tablas de frecuencia con intervalos la varianza se calcula: k 1 2 2 s k xi x f i i 1 f i i 1 Donde x i representa: La marca de clase de cada intervalo, si se trabaja con tablas de frecuencia con intervalos Los distintos valores de la variable, si se trabaja con tablas de frecuencia sin intervalos CALCULO DE LA VARIANZA PARA DATOS AGRUPADOS EN INTERVALOS k s2 x x i 1 i f i 0.48 1.67 8 1.44 1.67 8 ... 4.32 1.67 1 2 s fi k i 1 2 2 s 2 1.2 2 8 8 5 3 1 2 LA DESVIACIÓN ESTÁNDAR Es la raíz cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en que se midieron originalmente. Se simboliza S . 1 n 2 S xi x n i 1 LA DESVIACIÓN ESTÁNDAR Ejemplo s 2 1.42 s 1.19 EL COEFICIENTE DE VARIACIÓN El coeficiente de variación, denotado CV es el cociente entre la desviación estándar y la media de los datos. Permite comparar la variabilidad entre dos o mas conjuntos de datos de una misma variable ó la variabilidad existente entre variables diferentes. El coeficiente de variación se expresa en porcentaje. s cv 100% x LA DESVIACIÓN ESTÁNDAR Ejemplo x 1.63 s 1.19 1.19 cv 73% 1.63