.CAPITULO IV Medidas de variabilidad • análisis del concepto de variabilidad Las medidas de variabilidad que estudiaremos en este capitulo se refieren a contestar es esta medida representante? Gran pregunta: Por que dos distribuciones con igual medida de posición pueden ser distintas como consecuencias de su diferente variabilidad? 4.4.5.6.6, y 9.9.5.1.1 ambas tienen mismo promedio que es 5 pero es evidente Es evidente que la distribución A es mas variable, mas dispersa, y se llega a la media aritmética con desvíos de gran magnitud. B tiene menos variabilidad por ello esta mas concentrada. Las medidas de variabilidad tienen por objeto medir la magnitud de los desvíos de los valores de la variable con respecto al valor central de la distribución. Osea la Medida. de Variable. Define cuan semejante o cuan distinto son cada uno de los valores, de la variable con respecto al valor central. Las medidas de variabilidad son también medidas de grado de representatividad de las medidas de tendencia central. Si fueran notas de alumnos veremos que el primero es de un nivel 5 y es parejo y no lo es así el segundo quien tiene picos altos y otros bajos. La variabilidad es la característica mas importante de la distribución. Ya que ser constituye en un eficaz test de validación referido al nivel de significación de las medidas de posición. Las distintas medidas de Variabilidad están dirigidas a mensurar los desvíos con respecto a un valor central, grlte. la media aritmética. Las que mas estudiaremos es : • La varianza o variancia. • La dispersión o desviación Standard • El desvío medio • La semidesviacion intercuartilica Las tres primeras se refieren a la media aritmética. En cambio la ultima trata de analizar el espacio existente entre el tercer y el primer cuartil obteniendo así una medida diferente no relacionada con la media aritmética. A diferencia del capitulo anterior veremos que recurriremos a la Variancia y a la Dispersión. Mientras que el desvío medio trata de evitar la compensación calculando los desvíos en valores absolutos. 1 Sin darle bola al signo. • La varianza La varianza resulta ser el promedio cuadrado de las distancias entre la media aritmética y cada uno de los valores de la variable. Varianza de un distribución es la Media Aritmética de los desvíos cuadrados de los valores de la variable con respecto a la media aritmética de esa distribución. Se debe calcular si o si la Media y del posterior calculo de los desvíos. Peso en Grms 800−900 Q de paquetes 20 900−1000 50 1000−1100 50 1100−1200 20 Calculamos la media aritmética. PM Xi (peso gramos) .fi (Q de paquetes) 20 800−900 Xi−950 1000 Xi−950 *fi 1000 −1 −20 0 0 1 50 2 40 50 900−1000 50 1000−1100 20 1100−1200 140 De aquí sale X=950+100*70=1000Gms 140 Después de esto hacemos el otro cuadro. PM 850 X peso en gramos 800−900 .fi cantidad de Xi−1000 paquetes 20 −150 950 900−1000 50 1050 1000−1100 1150 1100−1200 (Xi−1000) (Xi−1000)*fi 22.500 450.000 −50 2.500 125.000 50 50 2.500 125.000 20 −150 22.500 450.000 2 140 1.150.000 Aplicando la formula la varianza resulta ser: =1.150.000= 8.214.29 140 1.2− Propiedades de la Varianza • Unidad de medida de la variable es el cuadro de la unidad de medida de la variable. • La varianza de una constante es =0 Ya que como es un constante todos los desvíos respecto a si misma es cero C) La varianza de una suma de variables es igual a la suma de la varianza de las variables dadas. Si y solo si las Variables son independientes. • la varianza de una constante mas una variable es = a la varianza de la Variable. La varianza es invariable con respecto a un cambio de origen de trabajo Demostración: • la varianza del producto de una variable por una constante e igual a la varianza de la variable por el cuadrado de la constante. 3− Dispersión surge en consecuencia de solucionar la obtención de la medida expresada en el cuadro de la unidad de medida de la variable con lo que resulta compleja su interpretación. Sea pues, la raíz cuadrada de la anterior. Las dispersión que surge esta expresada en la misma unidad de medida que la Vble, y será así de mas fácil interpretación. La varianza de 8.214.29grs.2, la dispersión será la raíz cuadrada o sea 90.43grs Propiedades de la dispersión • Es la misma unidad de media de la variable. • La disp. De una constante es = 0 • La disp. De una suma de variables no es igual a la suma de las dispersiones de las variables • La disp de una variable mas cuna K, es igual a la dispersión de la variable. • La disp del producto de una variable por K, es = a esa constante por la dispersión de la variable. 4 LA DISPERSION COMO MEDIDA DE LA REPRESNETATIVIDAD DE LA MEDIA ARITMETICA 3 La Media Aritmética tendrá mas valor como centro de gravedad, esto es, será mas representativa la distribución cuanto menor sea la si dispersión. Osea los valores se hallan cerca de la Media Aritmética. Dado dos distribuciones que tienen igual Media Aritmética, gozara de mayor representatividad, la Media de aquella distribución para la que la dispersión es menor. Teorema de BIENAYME−CHEBYCHEV Dice que la probabilidad de encontrar desvíos con respecto a la Media Aritmética, que en valores absolutos sean inferiores o iguales a K veces la dispersión, es siempre mayor que: 1− 1 k Osea: K = Ctte. Cualquiera Resulta evidente que cuanto mayor sea el valor de dispersión que corresponde a una distribución dad, mas grandes serán los desvíos para mantener constante la mencionada probabilidad. Como vemos en los gráficos notamos que en ambos buscamos la probabilidad del 75 % pero en una es mas grande que en la otra. 5− coeficiente de Variación A veces resulta útil analizar a la dispersión en términos de porcentuales con respecto a la media aritmética. Pero si las medias no fueran iguales a efectos de hacer esta comparación deberemos calcular el coeficiente de variación. 6− Desvío Medio Es otra medida de variabilidad. Que elimina la compensación de los desvíos calculándolos en valores absolutos, o sea. Este caso no presenta propiedades relevantes, por lo general la distribución es aproximadamente normal, se comprueba que : No puede calcualarse en intervalos abiertos. 7−Semi Desviación intercuartilica. Otra forma de medir la desviación de una distribución, consiste en el calculo de la semi desviación intercuartilica, la cual es: En donde Q3−Q1 es la diferencia entre el tercer y el primer cuartil y por lo tanto, será indicando la amplitud de un intervalo dentro del cual se encuentra la mitad de la población. 4 A Mayor dispersión mayor la distancia intercuartilica y viceversa. Se usa cuando se presentan intervalos abiertos. El COEFICIENTE DE VARIACION es el porcentaje que la dispersión representa con respecto al valor de la Media Aritmética 5