Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. ¿Qué es la desviación estándar o típica y como se representa? La desviación estándar o desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación estándar se representa por σ Desviación estándar para datos agrupados Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Desviación estándar para datos agrupados La desviación estándar será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. Si a todos los valores de la variable se les suma un número la desviación estándar no varía. Si todos los valores de la variable se multiplican por un número la desviación estándar queda multiplicada por dicho número. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones estándar se puede calcular la desviación estándar total. Si todas las muestras tienen el mismo tamaño: Si las muestras tienen distinto tamaño: Observaciones sobre desviación la estándar 1. La desviación estándar, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas. 2. En los casos que no se pueda hallar la media tampoco será posible hallar la desviación estándar. 3. Cuanta más pequeña sea la desviación estándar mayor será la concentración de datos alrededor de la media. ¿Qué es el coeficiente de variación media? Diga cuál es el criterio de decisión. El coeficiente de variación, también denominado como coeficiente de variación de Pearson, es una medida estadística que nos informa acerca de la dispersión relativa de un conjunto de datos. Fórmula del coeficiente de variación Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su mejor comprensión. X: variable sobre la que se pretenden calcular la varianza σx: Desviación típica de la variable X. | x̄ |: Es la media de la variable X en valor absoluto con x̄ ≠ 0 El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo del manual o la fuente utilizada. Su fórmula es la siguiente: El coeficiente de variación se utiliza para comparar conjuntos de datos pertenecientes a poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el valor de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida de dispersión que elimine las posibles distorsiones de las medias de dos o más poblaciones. ¿Qué es el coeficiente de variación media? Diga cuál es el criterio de decisión. El coeficiente de variación es una medida de dispersión relativa (libre de unidades de medida), que se define como el cociente de la desviación estándar entre la media aritmética. Su fórmula es la siguiente: Donde: σ: desviación estándar de la población. μ: media de la población. s: desviación estándar de la muestra. x̄: media de la muestra. Para la población y para la muestra, aunque tengan notación diferente, el coeficiente de variación se obtiene dividiendo la desviación estándar entre la muestra. Algunos autores, expresan el coeficiente de variación de forma porcentual. En ese caso, solo multiplicamos la fórmula por el 100% El coeficiente de variación se suele usar para comparar el grado de dispersión de dos o más conjuntos de datos; incluso si tienen medidas diferentes. Es de gran utilidad cuando se necesita comparar las dispersiones de dos conjuntos de datos cuyas medias son muy diferentes. De dos conjuntos de datos, el más homogéneo es el que tiene menor coeficiente de variación. ¿Qué es el coeficiente de asimetría? Diga cuál es el criterio de decisión. Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico. 1.1) TIPOS DE ASIMETRÍA La asimetría presenta las siguientes formas: Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la mediana a su vez es menor que la moda, en símbolos Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta de la simetría. Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una distribución es simétrica cuando su media aritmética, su mediana y su moda son iguales, en símbolos Md=Mo Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda. También se dice que una distribución es simétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y éste a valor de la mediana a su vez es mayor que la moda, en símbolos 1.2) MEDIDAS DE ASIMETRÍA Coeficiente de Karl Pearson Donde: = media aritmética. Md = Mediana. s = desviación típica o estándar. Nota: El Coeficiente de Pearson varía entre -3 y 3 Si As < 0 ? la distribución será asimétrica negativa. Si As = 0 ? la distribución será simétrica. Si As > 0 ? la distribución será asimétrica positiva. Medida de Yule Bowley o Medida Cuartílica Donde: = Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres. Nota: La Medida de Bowley varía entre -1 y 1 Si As < 0 ? la distribución será asimétrica negativa. Si As = 0 ? la distribución será simétrica. Si As > 0 ? la distribución será asimétrica positiva. Medida de Fisher Para datos sin agrupar se emplea la siguiente fórmula: Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula: Para datos agrupados en intervalos se emplea la siguiente fórmula: Donde: = cada uno de los valores; n = número de datos; = media aritmética; f = frecuencia absoluta = cubo de la desviación estándar poblacional; xm = marca de clase El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa generalmente en términos porcentuales. El coeficiente de variación es una medida de dispersión relativa (libre de unidades de medida), que se define como el cociente de la desviación estándar entre la media aritmética. Su fórmula es la siguiente: Propiedades Puesto que tanto la desviación estándar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medición. Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la variabilidad de dos conjuntos de datos. Métodos de cálculo 3.1) Para una población se emplea la siguiente fórmula: 3.2) Para una muestra se emplea la siguiente fórmula: Donde: σ: desviación estándar de la población. μ: media de la población. s: desviación estándar de la muestra. x̄: media de la muestra.