Sesion 03 Medidas de Dispersion

Anuncio
Juan Carlos Colonia P.
RESUMEN DE DATOS
LAS MEDIDAS RESUMEN
¿Que son?
• Las medidas
resumen
comúnmente
llamados
estadísticas son
valores
descriptivos de
un conjunto de
datos.
¿Cual es su
utilidad?
• Permiten resumir
la información
proveniente de
un conjunto de
datos pasando
de una visión
detallada a una
idea general
preservando sus
características
esenciales.
¿Por que resumir
datos?
•Para simplificar
la información
facilitando la
comprensión de
los mismos.
•Facilitar el
análisis
comparativo.
LAS MEDIDAS RESUMEN
Medidas de Tendencia Central, Posición o Localización:
Describen el valor alrededor del cual se distribuyen las observaciones.
• Media
• Mediana
• Moda
Medidas de Dispersión, Variabilidad o Escala:
Miden la variabilidad de un conjunto de datos alrededor de un valor central.
• Varianza
• Desviación Estándar
• Coeficiente de variación
MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN



La dispersión de un conjunto de datos es variabilidad que
presenta debido a que los datos no suelen ser constantes.
Las Medidas de Dispersión son valores que indican
variabilidad de los datos respecto a un punto de
referencia alrededor del cual se concentran o agrupan los
datos.
Las principales Medidas de Dispersión son:
 La Varianza
 La Desviación Estándar
 El Coeficiente de Variación
LA VARIANZA

Es el promedio del cuadrado de las desviaciones de
los valores de los datos respecto a la media de los
mismos. Se simboliza por S2 o V  X  .
1 n
2
S    xi  x 
n i 1
2

La varianza es una buena medida de variabilidad
debido a que si muchas de las diferencias son
grandes o pequeñas, el valor de la varianza será
grande o pequeño.
LA VARIANZA
Para calcular la varianza:
 Se calcula diferencia entre cada una de las observaciones
y la media de todas las observaciones (desviación).
 Se elevan al cuadrado todas desviaciones
 Se halla el promedio de dichas desviaciones elevadas al
cuadrado
LA VARIANZA
Ejemplo
s 2  1.42
s
2
0.02  1.63


2
 .......   4.75  1.63
25
2
LA VARIANZA
Cuando se tiene datos agrupados en tablas de frecuencia
con intervalos la varianza se calcula:
k
1


2
2
s  k
   xi  x  f i 
 i 1

f
 i
i 1
Donde x i representa:
 La marca de clase de cada intervalo, si se trabaja con
tablas de frecuencia con intervalos
 Los distintos valores de la variable, si se trabaja con
tablas de frecuencia sin intervalos
CALCULO DE LA VARIANZA PARA DATOS
AGRUPADOS EN INTERVALOS
k
s2 
 x  x 
i 1
i
f
i
0.48  1.67  8  1.44  1.67  8   ...   4.32  1.67  1


2
s
fi
k
i 1
2
2
s 2  1.2
2
8  8  5  3 1
2
LA DESVIACIÓN ESTÁNDAR
Es la raíz cuadrada positiva de la varianza. Mide la
variabilidad de los datos en las unidades en que se midieron
originalmente. Se simboliza S .
1 n
2
S
 xi  x 

n i 1
LA DESVIACIÓN ESTÁNDAR
Ejemplo
s 2  1.42
s  1.19
EL COEFICIENTE DE VARIACIÓN



El coeficiente de variación, denotado CV es el cociente
entre la desviación estándar y la media de los datos.
Permite comparar la variabilidad entre dos o mas
conjuntos de datos de una misma variable ó la
variabilidad existente entre variables diferentes.
El coeficiente de variación se expresa en porcentaje.
s
cv  100% 
x
LA DESVIACIÓN ESTÁNDAR
Ejemplo
x  1.63
s  1.19
1.19
cv 
 73%
1.63
Descargar