USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

Anuncio
USO DE LAS MEDIDAS DE TENDENCIA CENTRAL
Cuál será la medida de tendencia central que se debe usar, teniendo un conjunto de
observaciones?, para responder a este cuestionamiento, se debe tomar en cuenta la
necesidad de considerar dos factores muy importantes uno es la escala de medición, que
tiene que ser ordinal o numérica; y otra, la forma de distribución de las observaciones,
porque se tiene que saber si la distribución de las observaciones se desvía a la izquierda o a
la derecha de la media. Si hay observaciones distantes en una sola dirección se trata de una
distribución sesgada. Si los valores distantes son pequeños se sesga a la izquierda, sesgo
negativo. Si los valores distantes son grandes se sesga a la derecha, sesgo positivo
media
media
izquierda
derecha
Mediana
sesgo negativo
Mediana
sesgo positivo
media
Mediana
Distribuciones simétricas
Las siguientes reglas deben considerarse al decidir cual medida se aplicará a las
observaciones del trabajo de investigación. La media se usa para datos numéricos y
distribuciones simétricas, es decir sin ningún tipo de sesgo, y es sensible a los valores
absolutos. La mediana se emplea para datos ordinales o para datos numéricos con
distribución sesgada, porque no es sensible a la variación de los extremos. El modo se utiliza
para distribuciones bimodales ( dos observaciones que se repiten el mismo numero de
veces en la distribución ). Una forma de saber la forma que tiene la distribución de
observaciones es la siguiente: Si la media y la mediana son iguales la distribución es
simétrica ( se usa la media). Si la media es mayor que la mediana, la distribución está
sesgada a la derecha. Si la media es menor que la mediana la distribución está sesgada a la
izquierda ( en los últimos dos casos, se usa la mediana).
MEDIDAS DE DISPERSIÓN
Cuando se tiene una serie de mediciones de observaciones realizadas en una
investigación no basta con presentar la media o la mediana según sea el caso. Desde luego
que la información no es despreciable, pero se requiere lograr información mas objetiva, por
ejemplo saber como es la variación de dichas observaciones, es decir, como se dispersan, o
se sitúan en el área bajo la curva.
Varias son las medidas estadísticas, que se utilizan para dar una idea clara de cómo
es la dispersión o variación de las observaciones. Entre otras, el rango, extensión o
amplitud, la desviación estándar, el coeficiente de variación, percentiles y el rango o
amplitud intercuartil .
La diferencia entre la observación mas grande y la mas pequeña es lo que se
denomina rango, lo primero que se tiene que hacer es organizar los datos, por ejemplo en
una grafica de tronco y hoja o bien una lista en orden ascendente o descendente. Se hace la
operación aritmética y se obtiene un número que es el rango, esta información o número
obtenido es poco útil, por lo cual muchos autores al mencionar y exponer el rango, anotan los
valores mínimo y máximo de la lista de observaciones, lo cual tiene mayor utilidad, porque
nos indica de alguna forma como están dispersos los datos o más bien cual es la amplitud de
la dispersión de las observaciones. Por ejemplo
23,34,33,32,35,36,28,27,30 ( primero ponerlos en orden)
23,27,28,30,32,33,34,35,36
En el primer caso, el rango sería = ( 36 – 23 = 13)
En el segundo caso se pondría: rango = 23 a 36, esta información tendría mayor utilidad para
describir la amplitud de los datos
Cuando se tienen intervalos en una tabla de frecuencias, se hace un cálculo aproximado
usando el limite inferior del intervalo de clase menor y el limite superior del intervalo de clase
mas alto. En el ejemplo de abajo sería 3.0 a 7.9
Intervalos
3.0 – 3.9
4.0 – 4.9
5.0 – 5.9
6.0 – 6.9
7.0 – 7.9
Una medida de dispersión, muy útil y por lo tanto comúnmente utilizada es la
desviación estándar.
Es una medida de cómo se dispersan los datos alrededor de su media. Partimos del
hecho de que se pudiera medir que tanto se desvía de la media, cada una de las
observaciones. Se sumarían todas estas mediciones y se dividirían entre el número de ellas,
para formar una analogía de la media. Es decir una desviación media, luego entonces tendría
como fórmula
 ( X – X ) / n. Sin embargo si sumamos todas las desviaciones el resultado
será siempre igual a cero. Entonces se pueden hacer dos cosas, una sumar los valores
absolutos de las desviaciones ( sin signos, por ejemplo el valor absoluto de 3 es I3I, y de –3
es I –3 I entonces es igual a 3 el número con barras verticales) o bien elevando al cuadrado
las desviaciones antes de sumarlas ( se quitan los signos) entonces quedaría la fórmula, así
 I X – X I / n, sin embargo ésta fórmula, no es útil para hacer inferencias. Por lo tanto se usa
la segunda opción que es elevar al cuadrado las desviaciones antes de sumarlas y se extrae
la raíz cuadrada para volver al estado original de medición de las observaciones. El
denominador también se modifica, para producir una estimación más precisa de la
desviación estándar verdadera de la población, queda n – 1, para que no se tenga el
resultado de cero( que es en otras operaciones lo que se conoce como grados de libertad)
Pacientes
X
X–X
(X – X)2
1
0.13
0.01
0.0001
2
0
-0.12
0.0144
3
-0.18
-0.30
0.0900
4
-0.15
-0.27
0.0729
5
0.11
-0.01
0.0001
6
0.43
0.31
0.0961
7
0.41
0.29
0.0841
8
-0.12
-0.24
0.0576
9
0.06
-0.06
0.0036
10
0.06
-0.06
0.0036
11
-0.19
-0.31
0.0961
12
0.39
0.27
0.0729
13
0.30
0.18
0.0324
14
0.18
0.06
0.0036
15
0.11
-0.01
0.0001
16
0.94
0.82
0.6724
17
-0.07
-0.19
0.0361
18
-0.23
-0.35
0.1225
total
2.18
1.4586
La varianza es el resultado obtenido, antes de extraer la raíz cuadrada
La raíz cuadrada = 0.2929 que es la desviación estándar( DE )
La variación o desviación de los datos del paciente 16 es casi la mitad del resultado
total, si se elimina, la DE es igual a 0.22, lo que demuestra la importancia de que una o más
desviaciones sean muy distantes de la media.
Un aspecto relevante es que la desviación de la media indica por ejemplo que 2 DE
abarcan casi las tres cuartas partes de todos los datos (75%), es decir 2DE de la media.
En una distribución simétrica 67% de las observaciones quedan entre la media y 1DE
95% quedan entre 2DE, y 99.7% se agrupan entre 3DE.
Otra medida útil para la dispersión relativa de los datos es el coeficiente de variación
es la desviación estándar dividida entre la media por 100%, es una medida de la variación
relativa con respecto a la media, y se usa cuando se comparan dos escalas de medición
diferentes, este coeficiente las estandariza. La fórmula es: CV = (DE / X) 100%. Los valores
del resultado indican que tan grande o pequeña es la variación, si es pequeña se puede
utilizar adecuadamente por ejemplo una prueba diagnostica.
Descargar