Medidas de Dispersión Medidas de Dispersión: se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas. Las más usuales son el desvío estándar y la varianza Medidas de Dispersión • Rango: Corresponde a la diferencia entre el dato mayor y el dato menor. 𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑦𝑜𝑟 − 𝑋𝑚𝑒𝑛𝑜𝑟 • Deviación (d) es asociada a un valor x1 de la variable con respecto de la media aritmética x, se define como al diferencia entre 𝑑 = 𝑥𝑖 − 𝑥 Desviación media: es la media aritmética de los valores absolutos de las desviaciones de los datos respecto a la media aritmética 𝑥. Se puede interpretar como la distancia promedio de los datos y la media aritmética. Se calcula usando la siguiente formula 𝐷𝑚 = 𝑛 𝑖=1 𝑥𝑖 −𝑥 𝑛 datos desagrupados La desviación estándar . Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media. Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el nombre de desviación estándar, o desviación típica y es representada por la siguiente fórmula: . La Varianza El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la manera de simbolizarla es. Por lo mismo, la desviación estándar puede definirse como la raíz cuadrada de la varianza 8 cms. Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos tienen la misma base). ¿Existe alguna variación respecto de su altura entre estos rectángulos? ¿Cuál es el promedio de la altura de estos rectángulos? 8+8+8+8+8+8+8+8+8 9 = 72 =8 9 10 cms 6 cms 8 cms. El quinto rectángulo y el octavo rectángulo en un acto de rebeldía cambiaron su altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el octavo rectángulo, de color azul, mide 6 centímetros? ¿Cuál es el nuevo promedio de estos 9 rectángulos? 8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 9 = 72 =8 9 ... ¡el mismo promedio! Pero... ¿ha habido variación? 10 cms 6 cms 8 cms. El rectángulo rojo tiene +2 centímetros sobre el promedio, y el rectángulo azul tiene –2 centímetros bajo el promedio. Los otros rectángulos tienen cero diferencia respecto del promedio. Si sumamos estas diferencias de la altura respecto del promedio, tenemos 0+0+0+0+2+0+0–2+0 =0 Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin embargo, ante nuestros ojos, sabemos que hay variación. 10 cms 6 cms 8 cms. Una forma de eliminar los signos menos de aquellas diferencias que sean negativas, esto es de aquellos mediciones que estén bajo el promedio, es elevar al cuadrado todas las diferencias, y luego sumar... 02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8 Y este resultado repartirlo entre todos los rectángulos, es decir lo dividimos por el número de rectángulos que es 9 02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 9 8 = 0,89 9 10 cms 6 cms 8 cms. Se dice entonces que la varianza fue de 0,89 Observemos que las unidades involucradas en el cálculo de la varianza están al cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados. De manera que se define 0,89 0,943 La raíz cuadrada de la varianza se llama desviación estándar 10 cms 6 cms 8 cms. Que la desviación estándar haya sido de 0,943 significa que en promedio la altura de los rectángulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centímetros. Es claro que esta situación es “en promedio”, puesto que sabemos que los causantes de la variación fueron los rectángulos quinto y octavo. Esta variación hace repartir la “culpa” a todos los demás rectángulos que se “portaron bien”. La desviación estándar mide la dispersión de los datos respecto del promedio 10 cms 8 cms. 8 cms.8 cms. 8 cms. 8 cms. 7 cms. 6 cms 4 cms ¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos? En primer lugar debemos calcular el promedio 8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8 = 7,44 9 Luego debemos calcular la varianza 10 cms 8 cms. 8 cms. 8 cms. 8 cms. 7 cms. 8 cms. 6 cms 4 cms 0,56 0,56 2,56 0,56 -0,44 -1,44 -3,44 0,56 0,56 7,44 Promedio 0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 9 Este es el valor de la varianza = 22,2224 9 = 2,469 10 cms 8 cms. 8 cms. 8 cms. 8 cms. 7 cms. 8 cms. 6 cms 4 cms 7,44 Promedio Si la varianza fue de 2,469, entonces la desviación estándar es de... 2, 469 1,57 Lo que significa que, en promedio, los rectángulos se desviaron más o menos (más arriba o más abajo) en 1,57 centímetros. MEDIDAS DE DESVIACION PARA DATOS AGRUPADOS. Rango: Cuyos datos están agrupados en intervalos, corresponde a la diferencia entre limite superior del ultimo intervalo y el limite inferior del primer intervalo. La varianza 𝑆 2 : de una muestra de tamaño n, cuyos datos están agrupados en N intervalos con frecuencia f1,f2,f3,…..fn y marcas de clase MC1, MC2, MC3…..,MCn, se calcula de la siguiente manera. 𝑓1 (𝑀𝑐1 − 𝑥)2 +𝑓2 (𝑀𝑐2 − 𝑥)2 + ⋯ … … + 𝑓𝑛 (𝑀𝑐𝑛 − 𝑥)2 2 𝑆 = 𝑛 La desviación estándar (S)=de un conjunto de datos agrupados en intervalos corresponde a la raíz cuadrada de la varianza y su unidad de medida es la misma que la de la variable estudiada. LA DESVIACION ESTANDAR INDICA QUE TAN DISPERSOS ESTAN LOS DATOS CON RESPECTO A LA MEDIA. PROPIEDADES DE LA VARIANZA Y LA DESVIACION ESTANDAR. • Ambos números son un numero no negativo. • La 𝜎 2 𝑦 𝑙𝑎 𝜎 son cero cuando los datos son todos iguales. • Si a cada dato de una muestra se aumenta o disminuye en una constante K,las desviación estándar y la varianza originales no cambia. • Si a cada uno de los datos de una muestra se multiplica por una constante K. entonces las nueva 𝜎 𝑦 𝜎 2 son 𝐾 𝜎 y 𝐾 2 𝜎 2 respectivamente. • 𝜎 2 = 𝑥 2 − (𝑥)2 • 𝜎2 = 𝜎 ⟺ 𝜎 = 0 𝑜 𝜎 = 1 • 𝜎2 < 𝜎 ⇔ 0 < 𝜎 < 1 • 𝜎2 > 𝜎 ⇔ 𝜎 > 1 Coeficiente de variación: El coeficiente de variación corresponde a la razón existente entre a desviación estándar y la media aritmética, y se denota como CV. El coeficiente de variación se calcula mediante 𝜎 𝐶𝑉 = 𝑥 El CV no tiene unidad de medida, por lo que permite la comparación de variables sin importar sus magnitudes, ni lo que representan. El CV se puede escribir como porcentaje, lo que representa el grado de variabilidad de la desviación estándar. Desviacion Media Es la media aritmética de los valores absolutos de las desviaciones de los datos respecto a la media aritmética. Se puede interpretar como la distancia promedio de los daros y la media aritmética. Se calcula usando la formula 𝐷𝑀 = 𝑛 𝑖=1 𝑥𝑖 − 𝑥 𝑛 Para datos agrupados en clases se tiene 𝑛 𝑖=1 𝑓𝑖 𝑀𝐶𝐼 − 𝑥 𝐷𝑀 = 𝑛 Ejemplo: La siguiente tabla muestra la duración de unas baterías alcalinas Duración (horas) Frecuencia [40-45[ 22 [45-50[ 16 [50-55[ 10 [55-60[ 8 a) ¿Calcular la duración promedio de una pila? a) ¿Calcular la desviación estándar y la varianza? Ejercicios 1) Calcula el rango y la desviación media y la desviación estándar de la venta de electrodomésticos realizadas en una tienda durante 10 días 72-63-84-60-72-80-90-81-78-78. 2) En la tabla se muestran las notas de 30 estudiantes en una prueba de matemáticas. Calcula la varianza y la desviación estándar. Notas de los estudiantes en un examen de matemáticas Nota f 2,0 − 3,0 2 3,0 − 4,0 5 4,0 − 5,0 8 5,0 − 6,0 10 6,0 − 7,0 5 Los carabineros de una ciudad controlaron la rapidez de algunos automóviles que trasladaban por una autopista y obtuvieron los siguientes datos: Rapidez (km/h) Cantidad de autos 70,80 8 70,80 21 70,80 57 70,80 10 70,80 4 a) Calcule el rango, la desviación estándar. Interpreta los resultados En la tabla se muestran os notas de 30 estudiantes en una prueba de matemática Notas de estudiantes en examen de matemática Nota f [2,0-3,0[ 2 [3,0-4,0[ 5 [4,0-5,0[ 8 [5,0-6,0[ 10 [6,0-7,0[ 5 a) Calcular la desviación estándar e interprétala COMPARACION DE MUESTRAS Cuando se tienen dos o mas muestras, se pueden comparar sus características utilizando las medias de tendencia central de posición y las de dispersión, y a partir de ellas obtener conclusiones. Nota: Nos es necesario que las muestras sean del mismo tamaño. Ejemplo Una estación de bencina reporto las siguientes distribuciones de frecuencia, la que relaciona la cantidad de litros de bencina vendidas aun grupo de clientes en un día lunes en dos locales diferentes. LOCAL A Cantidad de gasolina (litros) Cantidad de ventas 0,5 110 5,10 157 10,15 204 15,20 88 20,25 85 25,30 56 ANALICE Utilice la media y la varianza para determinar cual de los dos locales les va mejor. LOCAL B Cantidad de gasolina (litros) Cantidad de ventas 0,5 90 5,10 172 10,15 190 15,20 125 20,25 86 25,30 37