Medidas de dispersión

Anuncio
MEDIDAS DE DISPERSION Un promedio puede ser engañoso a menos que sea identificado y vaya acompañado por otra información que informe las desviaciones de los datos respecto a la medida de tendencia central seleccionada. La variación o dispersión de un conjunto se refiere a la variedad que exhiben las observaciones, si todos los valores son iguales no hay dispersión, si no todos los valores son iguales existe dispersión de los datos. La dispersión será pequeña cuando los valores estén próximos entre si y será muy grande si los valores se hayan ampliamente diseminados. La variabilidad de un conjunto puede medirse a través de las siguientes medidas: Rango, Desviación media, Varianza, Desviación estándar y el Coeficiente de variación, de estos los mas usados son la varianza, desviación estándar y el coeficiente de variación. RANGO El rango es también llamado recorrido o amplitud, se define como la diferencia entre los valores máximo y mínimo de un conjunto de observaciones, ya sea población o muestra, se representa por la letra R mayúscula y su ecuación es: R = XN ‐ Xn Ejemplo: Un constructor para asegurarse de la calidad de la obra tomo seis muestras de concreto y obtuvo los siguientes resultados en resistencia en Kgr/cm: 358, 369, 363, 358, 336, 341. R = 369 – 336 = 33 En una distribución de frecuencias la amplitud se define como la diferencia entre el límite superior de la última clase y el límite inferior de la primera clase. El Rango no solo es la medida de dispersión más simple sino también la mas bruto, porque tiene los defectos de ser influenciada por un valor no usual en la muestra. No es una medida de variación de los datos intermedios con relación al valor típico, es muy sensible al tamaño de la muestra pues tiende a cambiar en forma no proporcional respecto a esta. Debido a su fácil cálculo es usada comúnmente en ingeniería y en informes médicos. DESVIACION MEDIA Fue la medida de dispersión mas usada hasta fines del siglo XIX, cuando fue desplazada por otras medidas de variación. Aun cuando haya caído en desuso es conveniente estudiarla debido a que facilita la comprensión de la desviación estándar. La desviación media se define como la desviación media de las desviaciones de los datos de una variable con respecto a su media y se expresa en las mismas unidades de la variable de que se trate, su modelo matemático es: Σ (Xi – X) DM = ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ n Por ejemplo: Tenemos el conjunto 5, 10, 15, 20, 25, 30, 35, que tiene como media aritmética un valor igual a 20, tenemos las siguientes desviaciones: Xi ‐ X = d 5 ‐ 20 = ‐15 10 ‐ 20 = ‐10 15 ‐ 20 = ‐5 20 ‐ 20 = 0 25 ‐ 20 = 5 30 ‐ 20 = 10 35 ‐ 20 = 15 Σ d = 0 y DM = 0 / 7 = 0 Observemos que los valores mayores que la media tienen desviaciones positivas y los valores menores tienen desviaciones negativas, asimismo que para este caso la sumatoria de las desviaciones es igual a 0 y por tanto la desviación media es también igual a 0. Para calcular la Desviación media para datos resumidos en una distribución de frecuencias, las desviaciones que se consideran son los desvíos de las marcas de clase respecto a la media aritmética y se utiliza la ecuación: (
Σ fi Xi − x
DM =
n
)
Ejemplo: CLASES 60‐62 63‐65 66‐68 69‐71 72‐74 TOTAL fi 5 18 42 27 8 100 Mi 61 64 67 70 73 d ‐ 6.5 ‐ 3.5 ‐ 0.5 2.5 5.5 ‐ 2.5 fi ∙ d 32.5 63.0 21.0 67.5 44.0 228.0 228 .0
DM =
= 2 .28
100
VARIANZA La varianza es la suma de los cuadrados de los desvíos de los datos, entre el número total de observaciones menos uno, siendo su modelo matemático: Σ ( Xi − x )
=
n −1
2
s
2
Para datos donde se incluye el número de veces que el mismo se repite: Σ ( Xi − x ) fi
=
n −1
2
s
2
El porque utilizar como divisor n – 1 es debido a que la varianza así definida tiene mejores propiedades teóricas. La varianza tiene una gran aplicación en análisis estadístico avanzado pero que tiene el inconveniente de que sus unidades son las mismas que la variable al cuadrado. Para datos agrupados el modelo matemático para calcular la varianza es: Σ (mi − x ) fi
s2 =
n −1
2
DESVIACIÓN ESTANDAR La desviación estándar es por sus propiedades algebraicas la medida de dispersión mas usada, también recibe el nombre de desviación típica. Es la medida de dispersión que trabaja con las mismas unidades que la variable en cuestión. Para datos originales el modelo matemático es: Σ ( Xi − x )
n −1
2
s=
Si se incluye el número de veces que el mismo valor se repite el modelo cambia a: Σ ( Xi − x ) fi
n −1
2
s=
O bien para datos agrupados: Σ (mi − x ) fi
n −1
2
s =
Ejemplo de calculo de varianza y desviación estándar para datos originales. d d2
Xi ‐ x 5 ‐ 20 ‐ 15 225
10 ‐ 20 ‐ 10 100
15 ‐ 20 ‐ 5 25
20 ‐ 20 0 0
25 ‐ 20 5 25
30 ‐ 20 10 100
35 ‐ 20 15 225
700 s2 =
700
= 116.67 6
s =
116 . 67 = 10 . 8
s2 =
29,658.80
= 375.42 79
Ejemplo: El tabular siguiente contiene los salarios de 80 empleados del Ingenio El Molino de Menchaca. Obtenga la varianza y la desviación estándar. CLASES fi mi d d2 fi 49.50 ‐ 60.50 8 55 ‐36.6 10,716.48
60.50 ‐ 71.50 11 66 ‐25.6 7,208.96
71.50 ‐ 82.50 14 77 ‐14.6 2,984.24
82.50 ‐ 93.50 17 88 ‐3.6 220.32
93.50 ‐ 104.50 15 99 7.4 821.40
104.50 ‐ 115.50 10 110 18.4 3,385.60
115.50 ‐ 126.50 5 121 29.4 4,321.80
TOTALES 80 29,658.80
s =
COEFICIENTE DE VARIACIÓN 375 . 42 = 19 . 38
El coeficiente de variación es un índice exento de unidades expresado en porcentaje, sirve para comparar distribuciones y así determinar cual tiene más o menos variabilidad aun cuando las unidades sean diferentes. El modelo matemático usado para determinar el coeficiente de variación es: ⎛s⎞
C
V
=
⎜ ⎟(100 ) ⎝x⎠
Ejemplo 1: Sea un conjunto con una media aritmética de 86.60 y una desviación estándar igual a 19.38 Calcule el coeficiente de variación del conjunto. ⎛ 19 .38 ⎞
CV = ⎜
⎟(100 ) = 22 .38 % 86
.
60
⎝
⎠
Ejemplo 2: Un conjunto de datos tiene una media aritmética de 76.17 y una desviación estándar igual a 8.2 Calcule el coeficiente de variación. ⎛ 8 .2 ⎞
CV = ⎜
⎟ (100 ) = 10 .76 % ⎝ 76 .17 ⎠
CALCULO DE LAS MEDIDAS DE VARIABILIDAD PARA DATOS NO AGRUPADOS. Si retomamos el ejemplo de los empleados de la cadena de Moteles Candida, que estudiaron un curso de primeros auxilios, tenemos: Xi fi d2
d2 * fi Xi ‐
= d x
12 13 14 15 16 17 18 19 20 1 1 2 3 5 7 3 2 1 Σ 25 12 – 16.4 = ‐ 4.4 13 – 16.4 = ‐ 3.4 14 – 16.4 = ‐ 2.4 15 – 16.4 = ‐ 1.4 16 – 16.4 = ‐ 0.4 17 – 16.4 = 0.6 18 – 16.4 = 1.6 19 – 16.4 = 2.6 20 – 16.4 = 3.6 Σ ‐ 3.6 19.36 11.56 5.76 1.96 0.16 0.36 2.56 6.76 12.96 Σ ( Xi − x ) fi
s2 =
n −1
2
s2 =
85 .8
= 3.58 24
19.36 11.56 11.52 5.88 0.80 2.52 7.68 13.52 12.96 Σ 85.8 Σ( Xi − x) fi
s=
n −1 2
s =
3 . 58 = 1 . 89
⎛s⎞
CV = ⎜ ⎟(100 ) ⎝x⎠
⎛ 1 .89 ⎞
CV = ⎜
⎟(100 ) = 11 .52 % 16
.
4
⎝
⎠
CALCULO DE LAS MEDIDAS DE VARIABILIDAD PARA DATOS AGRUPADOS EN UNA TABLA DE DISTRIBUCION DE FRECUENCIAS. Los datos corresponden a la estatura de 150 alumnos de la Escuela Preparatoria No.2 en Santiago Ixcuintla, Nayarit en el periodo escolar 2002‐2003. Con la información calcule las medidas de variación. d2
d2 * fi CLASES fi Mi = d mi ‐
x
149‐154 155‐160 161‐166 167‐172 173‐178 179‐184 185‐190 191‐196 TOTAL 12 31 39 35 22 9 1 1 150 151.5 157.5 163.5 169.5 175.5 181.5 187.5 193.5 151.5 – 165.9 = ‐ 17.5 157.5 – 165.9 = ‐ 11.5 163.5 – 165.9 = ‐ 5.5 169.5 – 165.9 = 0.5 175.5 – 165.9 = 6.5 181.5 – 165.9 = 12.5 187.5 – 165.9 = 18.5 193.5 – 165.9 = 24.5 306.25 132.25 30.25 0.25 42.25 156.25 342.25 600.25 x=
24 ,885 . 0
= 165 . 9
150
s2 =
12 ,241 .50
= 85 .16 149
3,675.00 4,099.75 1,179.75 8.75 929.50 1,406.25 342.25 600.25 12,241.50 s =
85 . 16 = 9 . 23
⎛ 9 .23 ⎞
CV = ⎜
⎟ (100 ) = 5 .6 % 165
.
9
⎝
⎠
Descargar