USO DE LAS MEDIDAS DE TENDENCIA CENTRAL Cuál será la medida de tendencia central que se debe usar, teniendo un conjunto de observaciones?, para responder a este cuestionamiento, se debe tomar en cuenta la necesidad de considerar dos factores muy importantes uno es la escala de medición, que tiene que ser ordinal o numérica; y otra, la forma de distribución de las observaciones, porque se tiene que saber si la distribución de las observaciones se desvía a la izquierda o a la derecha de la media. Si hay observaciones distantes en una sola dirección se trata de una distribución sesgada. Si los valores distantes son pequeños se sesga a la izquierda, sesgo negativo. Si los valores distantes son grandes se sesga a la derecha, sesgo positivo media media izquierda derecha Mediana sesgo negativo Mediana sesgo positivo media Mediana Distribuciones simétricas Las siguientes reglas deben considerarse al decidir cual medida se aplicará a las observaciones del trabajo de investigación. La media se usa para datos numéricos y distribuciones simétricas, es decir sin ningún tipo de sesgo, y es sensible a los valores absolutos. La mediana se emplea para datos ordinales o para datos numéricos con distribución sesgada, porque no es sensible a la variación de los extremos. El modo se utiliza para distribuciones bimodales ( dos observaciones que se repiten el mismo numero de veces en la distribución ). Una forma de saber la forma que tiene la distribución de observaciones es la siguiente: Si la media y la mediana son iguales la distribución es simétrica ( se usa la media). Si la media es mayor que la mediana, la distribución está sesgada a la derecha. Si la media es menor que la mediana la distribución está sesgada a la izquierda ( en los últimos dos casos, se usa la mediana). MEDIDAS DE DISPERSIÓN Cuando se tiene una serie de mediciones de observaciones realizadas en una investigación no basta con presentar la media o la mediana según sea el caso. Desde luego que la información no es despreciable, pero se requiere lograr información mas objetiva, por ejemplo saber como es la variación de dichas observaciones, es decir, como se dispersan, o se sitúan en el área bajo la curva. Varias son las medidas estadísticas, que se utilizan para dar una idea clara de cómo es la dispersión o variación de las observaciones. Entre otras, el rango, extensión o amplitud, la desviación estándar, el coeficiente de variación, percentiles y el rango o amplitud intercuartil . La diferencia entre la observación mas grande y la mas pequeña es lo que se denomina rango, lo primero que se tiene que hacer es organizar los datos, por ejemplo en una grafica de tronco y hoja o bien una lista en orden ascendente o descendente. Se hace la operación aritmética y se obtiene un número que es el rango, esta información o número obtenido es poco útil, por lo cual muchos autores al mencionar y exponer el rango, anotan los valores mínimo y máximo de la lista de observaciones, lo cual tiene mayor utilidad, porque nos indica de alguna forma como están dispersos los datos o más bien cual es la amplitud de la dispersión de las observaciones. Por ejemplo 23,34,33,32,35,36,28,27,30 ( primero ponerlos en orden) 23,27,28,30,32,33,34,35,36 En el primer caso, el rango sería = ( 36 – 23 = 13) En el segundo caso se pondría: rango = 23 a 36, esta información tendría mayor utilidad para describir la amplitud de los datos Cuando se tienen intervalos en una tabla de frecuencias, se hace un cálculo aproximado usando el limite inferior del intervalo de clase menor y el limite superior del intervalo de clase mas alto. En el ejemplo de abajo sería 3.0 a 7.9 Intervalos 3.0 – 3.9 4.0 – 4.9 5.0 – 5.9 6.0 – 6.9 7.0 – 7.9 Una medida de dispersión, muy útil y por lo tanto comúnmente utilizada es la desviación estándar. Es una medida de cómo se dispersan los datos alrededor de su media. Partimos del hecho de que se pudiera medir que tanto se desvía de la media, cada una de las observaciones. Se sumarían todas estas mediciones y se dividirían entre el número de ellas, para formar una analogía de la media. Es decir una desviación media, luego entonces tendría como fórmula ( X – X ) / n. Sin embargo si sumamos todas las desviaciones el resultado será siempre igual a cero. Entonces se pueden hacer dos cosas, una sumar los valores absolutos de las desviaciones ( sin signos, por ejemplo el valor absoluto de 3 es I3I, y de –3 es I –3 I entonces es igual a 3 el número con barras verticales) o bien elevando al cuadrado las desviaciones antes de sumarlas ( se quitan los signos) entonces quedaría la fórmula, así I X – X I / n, sin embargo ésta fórmula, no es útil para hacer inferencias. Por lo tanto se usa la segunda opción que es elevar al cuadrado las desviaciones antes de sumarlas y se extrae la raíz cuadrada para volver al estado original de medición de las observaciones. El denominador también se modifica, para producir una estimación más precisa de la desviación estándar verdadera de la población, queda n – 1, para que no se tenga el resultado de cero( que es en otras operaciones lo que se conoce como grados de libertad) Pacientes X X–X (X – X)2 1 0.13 0.01 0.0001 2 0 -0.12 0.0144 3 -0.18 -0.30 0.0900 4 -0.15 -0.27 0.0729 5 0.11 -0.01 0.0001 6 0.43 0.31 0.0961 7 0.41 0.29 0.0841 8 -0.12 -0.24 0.0576 9 0.06 -0.06 0.0036 10 0.06 -0.06 0.0036 11 -0.19 -0.31 0.0961 12 0.39 0.27 0.0729 13 0.30 0.18 0.0324 14 0.18 0.06 0.0036 15 0.11 -0.01 0.0001 16 0.94 0.82 0.6724 17 -0.07 -0.19 0.0361 18 -0.23 -0.35 0.1225 total 2.18 1.4586 La varianza es el resultado obtenido, antes de extraer la raíz cuadrada La raíz cuadrada = 0.2929 que es la desviación estándar( DE ) La variación o desviación de los datos del paciente 16 es casi la mitad del resultado total, si se elimina, la DE es igual a 0.22, lo que demuestra la importancia de que una o más desviaciones sean muy distantes de la media. Un aspecto relevante es que la desviación de la media indica por ejemplo que 2 DE abarcan casi las tres cuartas partes de todos los datos (75%), es decir 2DE de la media. En una distribución simétrica 67% de las observaciones quedan entre la media y 1DE 95% quedan entre 2DE, y 99.7% se agrupan entre 3DE. Otra medida útil para la dispersión relativa de los datos es el coeficiente de variación es la desviación estándar dividida entre la media por 100%, es una medida de la variación relativa con respecto a la media, y se usa cuando se comparan dos escalas de medición diferentes, este coeficiente las estandariza. La fórmula es: CV = (DE / X) 100%. Los valores del resultado indican que tan grande o pequeña es la variación, si es pequeña se puede utilizar adecuadamente por ejemplo una prueba diagnostica.