Jesús Eduardo Pulido Guatire, marzo 2010 Medidas de Variabilidad y Posición. Cuando trabajamos el aspecto denominado Medidas de Tendencia Central se observó que tanto la media como la mediana y la moda proporcionan un solo valor cada una, el cual es descriptivo de un conjunto de valores que toma una determinada variable; aun cuando la información contenida en una medida de tendencia central puede ser suficiente en algunos casos, hay muchas situaciones en las cuales se requiere describir otras características, atributos o cualidades que se registran en un archivo de datos. Dicho en otros términos para describir una distribución de frecuencias se necesita, por lo menos, de otra medida que posibilite cuantificar la variación de los datos ya que “Una medida de variabilidad es un número que nos indica el grado de dispersión en un conjunto de datos. Si este valor es pequeño (respecto de la unidad de medida) entonces hay una gran uniformidad entre los datos. Por el contrario, un gran valor nos indica poca uniformidad” (Chao, 1993; p. 49). Entre las medidas de dispersión absoluta de mayor uso tenemos la amplitud total o rango, desviación típica y la varianza. Amplitud total o rango. La amplitud total o recorrido de una variable está definida por la diferencia entre su valor más alto y el mínimo. Se utiliza cuando sólo se necesita hacer una comparación rápida entre dos distribuciones; no es muy confiable debido a su inestabilidad ya que puede variar considerablemente de una distribución a otra. Su resultado se fundamenta únicamente en dos de sus valores extremos, los demás datos no interviene en el cálculo. A continuación se muestra la magnitud con la cual varían los valores que toman las variables Yi y Zi. 1 Yi Zi 10 11 12 13 14 2 2 3 4 5 El rango para Yi = 14 – 10 = 4 y para Zi su rango = 5 – 2 = 3; los resultados indican claramente que los valores que tomó la variable Yi están más separados que los de la variable Zi, el espacio ocupado por Yi es equivalente a 4 unidades, lo cual es un indicador de la existencia de una mayor variabilidad con respecto a la de los valores tomados por la variable Zi, expresado en términos de dispersión; cuanto más grande es el rango mayor es la dispersión de los datos en una distribución. Desviación Típica o Estándar S La desviación típica mide el grado en que las puntuaciones de la variable se aleja de su media aritmética; ejemplo, determinar la desviación típica de la siguiente distribución de frecuencias (Calificaciones en Inglés) X f 10 11 12 13 14 2 4 8 3 2 19 Para obtener la desviación típica nos vamos a apoyar en la siguiente ecuación s= modo: SC= SC . La Suma de Cuadrados (SC) se obtiene del siguiente n fX 2 - fX 2 Seguidamente se prepara una tabla con todos n los componentes de esta fórmula. SC= 2.735 - X f X2 fX2 fX 10 11 12 13 14 2 4 8 3 2 100 121 144 169 196 19 200 484 1152 507 392 2.735 20 44 96 39 28 227 2272 19 SC= 2.735 - 2 51.529 19 SC = 2.735 – 2.712,05 S= 22,95 19 SC= 22, 95 S= 1,2078= 1,09 puntos La media de la distribución en estudio es 11,95 puntos ( X 227 ) 19 Interpretación. Las calificaciones obtenidas por los alumnos en inglés se alejan del promedio (11,95) en 1,09 puntos; dicho en otros términos, los alumnos lograron un promedio de 11,95 puntos en inglés con una dispersión de 1,09 puntos. La desviación típica presenta una gran utilidad cuando se analiza conjuntamente con la media aritmética en una distribución normal; veamos los siguientes casos: a. La 68% (el intervalo comprendido entre la media más y menos una desviación estándar contiene aproximadamente el 68% de los casos en estudio). b. La 2 95% (el intervalo comprendido entre la media más y menos dos desviaciones estándares contiene aproximadamente el 95% de los casos en estudio). c. La 3 99% (el intervalo comprendido entre la media más y menos tres desviaciones estándares contiene aproximadamente el 99% de los casos en estudio). Medidas de Posición. Cuando trabajamos la mediana se hizo con el propósito de encontrar un valor que permitiera localizar la posición de algún caso con relación a otros que están ordenados de manera ascendente o descendente. En ese preciso instante se inició el estudio de las medidas de posición, puesto que se dividió la distribución en dos partes iguales, pero igualmente puede dividirse en cuatro (cuartiles) en diez (deciles) o en cien partes iguales (percentiles). Los cuartiles son tres y se representan por Q1, Q2, y Q3, respectivamente. El Q1, significa que por debajo de su valor se encuentra el 25% de los casos en la 3 distribución que se esté analizando; el Q2 es igual a la mediana y bajo el Q3 se encuentra el 75% de los casos. De igual modo, el percentil es el punto por debajo del cual se encuentra un determinado porcentaje de casos, por ejemplo, el percentil ochenta (P80) es el punto por debajo del cual se encuentra el 80% de los casos en la distribución. El percentil veinticinco (P25) es igual al cuartil uno (Q1), el percentil cincuenta (P50) es igual a la mediana e igual al cuartil dos (P50 = Me = Q2) y el percentil setenta y cinco es igual al cuartil tres (P75 = Q3). En el caso de datos agrupados en distribuciones de frecuencia el cálculo de los percentiles se hace mediante un procedimiento análogo al KN faanterior i utilizado para la mediana: Pk = Xri + 100 fi Donde: K = Es el percentil que se desea determinar. N = Es la suma de las frecuencias absolutas de la distribución fi N . Los demás componentes de la fórmula ya fueron estudiados en la mediana. Apoyándonos en la distribución de las calificaciones obtenidas por los alumnos en la prueba de Física vamos a ilustrar el cálculo del percentil 25 (P25), el P65 y completaremos el estudio de esta distribución con el cálculo del Rango y la Desviación Típica. Xi 10 11 12 13 14 15 16 fi fa 1 2 1 2 2 2 1 11 1 3 4 6 8 10 11 4 Pasos para determinar un determinado percentil: 1. Localizar la fila que contiene al percentil, en nuestro caso el P25; P25 = 25 * 11 = 2,75; el P25 está ubicado en la fila 2 de la distribución de 100 frecuencias porque la frecuencia acumulada es 3 y ésta contiene a 2,75. 2. Una vez localizada la fila podemos localizar el Límite Real Inferior (Xri), el cual es 10,5 (se le quitó media unidad a 11), la frecuencia acumulada anterior (1), la frecuencia absoluta que contiene al P25 (2) y el intervalo que en nuestro caso es 1 (11-10= 1; 12 – 11= 1; …; 16 – 15 = 1). 3. Se aplica la ecuación P25 = 10,5 + 2,75 1 *1 2 P25 = 10,5 – 0,875 P25 = 9,62. Utilizando el mismo procedimiento se determinó el P65 y se obtuvo un resultado de P65 = 12,92. El rango viene dado por la diferencia entre la calificación más alta y la menor que alcanzaron los estudiantes, en nuestro caso es Rango = 16 – 10 = 6 La Desviación Típica se determinó utilizando el proceso descrito anteriormente y se obtuvo el siguiente resultado S = 1,83 Los resultados de la distribución de las calificaciones obtenidas por los 11 estudiantes en la prueba de Física se reportan en el siguiente cuadro. Estadísticos Resultados N 11 Media 13,09 Mediana 13,25 Moda 11 Desv. Típica 1,83 Rango 6 P25 9,62 P65 12,92 Asimetría Negativa Interpretación. Al analizar los resultados de la tabla se observa que la distribución de las calificaciones obtenidas por los 11 alumnos en la prueba de 5 Física es asimétrica negativa, que su calificación promedio fue de 13,09 puntos con una dispersión de 1,83; que la mitad de los estudiantes obtuvo calificaciones por debajo de 13,25 puntos; que entre el estudiante que logró la mayor calificación y el obtuvo la menor hay una diferencia de 6 puntos. Que el 40% de los estudiantes logró calificaciones que están comprendidas entre 9,62 y 12,92 puntos. Referencia Bibliográfica. Chao, L. (1994). Estadística para las ciencias administrativas. (3ª ed). México: McGraw-Hill. 6