capítulo ii: medidas estadísticas de tendencia

Anuncio
2013
Estadística Aplicada a la Administración
CAPÍTULO II: MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL Y DISPERSIÓN
Los datos individuales pueden ser sintetizados mediante medidas de tendencia central y de dispersión.
1.1. MEDIDAS DE TENDENCIA CENTRAL
En el capítulo anterior, nos referimos a la clasificación, ordenación y presentación de datos estadísticos,
limitando el análisis de la información a la interpretación porcentual de las distribuciones de frecuencia, es así
como, el análisis estadístico propiamente dicho, parte de la búsqueda de parámetros sobre los cuales pueda
recaer la representación de toda la información.
Supóngase que Pedro obtiene 32 puntos en una prueba de lectura. La calificación por sí misma tiene
muy poco significado a menos que usted conozca cuál es el total de puntos que obtiene una persona
promedio al participar en esa prueba, cuál es la calificación menor y mayor que se obtiene, y cuán variadas
son esas calificaciones. Es decir que para que una calificación tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios estadísticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para
interpretar las calificaciones que se obtienen en una prueba. Digamos por ejemplo que la calificación promedio
en la prueba que hizo Pedro fue de 20 puntos. De ser así podemos decir que la calificación de Pedro se ubica
notablemente sobre el promedio. Pero si la calificación promedio fue de 60 puntos, entonces la conclusión
sería muy diferente, dado que se ubicaría muy por debajo del promedio de la clase.
En resumen, el propósito de las medidas de tendencia central sirven para: a) Mostrar en qué lugar se
ubica la persona promedio o típica del grupo. b) Sirve como un método para comparar o interpretar cualquier
puntaje en relación con el puntaje central o típico. c) Sirve como un método para comparar el puntaje obtenido
por una misma persona en dos diferentes ocasiones. d) Sirve como un método para comparar los resultados
medios obtenidos por dos o más grupos.
Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la
información, son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su interpretación
no debe hacerse aisladamente de las medidas de dispersión, ya que la representatividad de ellas está
asociada con el grado de concentración de la información. Las principales medidas de tendencia central son:
MEDIDA
Media aritmética
Mediana
Moda
DEFINICIÓN
Es el promedio aritmético de todos los datos o valores.
Es el dato o valor que divide por la mitad la serie de datos ordenados creciente o
decrecientemente, es decir, es el valor central de la serie.
La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia dentro de
una distribución). Una información puede tener una moda y se llama unimodal, dos modas y
se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la
información no posea moda.
1.2. CÁLCULO ANALÍTICO DE LAS MEDIDAS DE TENDENCIA CENTRAL: FÓRMULAS
Para calcular una determinada medida de posición puede haber diversas fórmulas. La elección de la
fórmula adecuada dependerá de la forma en que estén organizados los datos individuales. En principio, los
datos pueden estar organizados de tres maneras:
1) Datos no agrupados. Cuando se recolecta información, generalmente se obtienen datos
desordenados, frente a lo cual convendrá ordenarlos en forma creciente o decrecientemente.
3) Datos agrupados por frecuencia. Es obtener o agruparlos los datos por frecuencias.
4) Datos agrupados por intervalos. Es obtener o agruparlos los datos por intervalos.
La estadística va agrupando los datos siguiendo el orden anterior. Cuanto más avance en este proceso,
1
Prof. Jesús Timaure
2013
Estadística Aplicada a la Administración
más habrá logrado sintetizar y organizar los datos individuales.
En el siguiente cuadro se sintetizan las diversas reglas o fórmulas para calcular las medidas de posición,
según como estén organizados los datos individuales y según los niveles de medición que admiten. Nótese
que en algunos casos no es posible especificar ninguna fórmula, y entonces el cálculo se hará siguiendo la
regla indicada para los mismos.
.
Medida de
tendencia C
Datos no
agrupados
Media
aritmética
(promedio)
 x 
Datos agrupados por frecuencia
f
x
n
Datos agrupados por intervalos
 ( X .f )
f
x
 ( Xi .f )
f
Cuando n es impar
Me 
Mediana
Cuando n es par
Me 
Moda
(n  1)
2
f
Fmediana=
2
n
(+1)
2
Valor que más se
repite
 fa 
Valor con la mayor frecuencia
 f


 Facum.ant. 
 * Rmedina
Me  LRi   2


Fmediana




 F mod al  Fanterior 
 * R mod al
Mo  LRi  
 2 F mod al  Fant  Fsig  
1.3. DEFINICIONES BÁSICAS
Límites del intervalo.- Todo intervalo debe quedar definido por dos límites: un límite inferior y un límite
superior.
Punto medio del intervalo (Xi = X ): Es el valor que resulta de la suma de los intervalo superior e inferior,
es decir, el punto medio del intervalo se calcula sumando ambos límites y dividiendo el resultado por dos. El
punto medio del intervalo sirve para calcular la media aritmética.
Rango: Es la diferencia entre los valores máximo y mínimo de la variable, también utilizado para cada
intervalo, se llama también amplitud.
Desvió: Es la suma de las diferencias de los datos con respecto a la media aritmética, la cual dará como
resultado cero. Formula para datos no agrupados Di  X  X y para agrupados por intervalo: Di  Xi  X
1.4. MEDIDAS ESTADÍSTICAS DE POSICIÓN
Anteriormente, vimos lo referente a las medidas de tendencia central, las cuales, a su vez, son también
medidas de posición ya que, de todas maneras ocupan un lugar dentro de la información. Nos ocuparemos
ahora de ciertos parámetros posicionales muy útiles en la interpretación porcentual de la información.
MEDIDA
Cuartiles
Quintiles
Deciles
Centiles
DEFINICIÓN
Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro partes
iguales, el primer cuartil (Q1) deja el 25% de la información por debajo de él, seguidamente el
segundo cuartil (Q2), al igual que la mediana, divide la información en dos partes iguales, y por
último el tercer cuartil (Q3) deja el 75% por debajo de sí. Se necesita, entonces calcular tres
cuartillas ya que la cuarta queda automáticamente determinada.
Los quintiles o quintillas dividen la información en cinco partes iguales, agrupándolas en
porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro
parámetros.
Similarmente, los deciles o decillas dividen la información en diez partes iguales, en
cantidades porcentuales de 10 en 10.
Obviamente los centiles dividen la información en 100 partes, lo cual facilita la interpretación
porcentual de una distribución de frecuencias.
2
Prof. Jesús Timaure
2013
Estadística Aplicada a la Administración
1.5. CÁLCULO ANALÍTICO DE LAS MEDIDAS DE POSICIÓN: FÓRMULAS
Datos no agrupados:
Cuando n es par: k*n/r
Cuando n es impar: k(n+1)/r
En general para calcular cualquier percentil de datos agrupados:
r: Número de partes en que se divide la información
k: Orden del percentil k = 1,2,.....,r-1
n: Número de observaciones
1.6. MEDIDAS ESTADÍSTICAS DE DISPERSIÓN
Llamadas también medidas de variabilidad o de variación, son datos estadísticos que informan acerca
del grado de dispersión o variabilidad de los datos individuales de una muestra o una población, respecto de
una variable. En otras palabras, indican el grado de homogeneidad o de heterogeneidad del conjunto de los
datos. Por ejemplo, en dos informaciones con igual media aritmética, no significa este hecho, que las
distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus
datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmética, y mediana que los valores 49, 50,51; sin
embargo, para la primera información la media aritmética, se encuentra muy alejada de los valores extremos 5
y 95, cosa que no ocurre con la segunda información que posee igual media aritmética y mediana, vemos
entonces que la primera información es mas heterogénea o dispersa que la segunda.
En general, las medidas de dispersión más utilizadas sirven para la medición de variables en el nivel
cuantitativo. En el siguiente cuadro se especifican las definiciones principales de las medidas de dispersión.
MEDIDA
DESVIACIÓN MEDIA
VARIANZA
DESVIÓ ESTÁNDAR
COEFICIENTE DE
VARIACIÓN
DEFINICIÓN
Es el promedio de las desviaciones de todos los valores respecto de la media aritmética
Es el promedio de los cuadrados de las desviaciones con respecto a la media aritmética
Es la raíz cuadrada de la varianza
Es el cociente entre el desvío estándar y la media aritmética
1.7. CÁLCULO ANALÍTICO DE LAS MEDIDAS DE DISPERSIÓN: FÓRMULAS
Medida de
dispersión
Datos no agrupados
Desviación
media
Desvío
estándar
D
m

Datos agrupados por frecuencia
 (Di )
f
D
Es la raíz cuadrada de la
2
varianza (S )
S 
2
Varianza
 (Di
f
CV 
Coeficiente de
variación
Intervalos
f
Totales
n=
2
)
3

 (Di )
f
2
S 
2
 f .(Di
f
CV 
Xi
D
Es la raíz cuadrada de la varianza (S )
S
X
fa↑
m
Datos agrupados por intervalos
F(Xi)
2
)

 (Di )
f
2
Es la raíz cuadrada de la varianza (S )
S 

2
S
X
Lri
m
 f .(Di
f
CV 
Lrs
Di
Prof. Jesús Timaure
f(Di)
2
)

S
X
Di2
f(Di2)
Descargar