Instituto Tecnológico de Celaya Departamento de Ingeniería química Medidas de tendencia central y variabilidada para datos agrupados Media (media aritmética) ( X ) Con anterioridad hablamos sobre la manera de determinar la media de la muestra. Si hay muchos valores u observaciones; la sumatoria se vuelve tediosa y conviene clasificar o agrupar los datos antes de calcular la media. Al clasificar los datos, las observaciones individuales pierden su identidad, esto se explica porque el analista no tiene mayor interés en los valores de las observaciones originales, porque no guarda un registro de los mismos o simplemente porque nunca los tuvo a la mano, pues los obtuvo ya clasificados. Al calcular la media a partir de datos agrupados, se supone que todos los valores que caen en un intervalo de clase particular están localizados en el punto medio del intervalo (marca de clase). Para encontrar la media, se multiplica cada marca de clase por la frecuencia correspondiente, se suman estos productos y se dividen entre la suma de las frecuencias (número total de observaciones). Donde: k ∑M• f i X= i =1 n i es la marca de clase f i es la frecuencia absoluta de la clase k es el número de clase Mi M ediana ( m~ ) Los datos vendrán en intervalos en el siguiente histograma de frecuencias acumuladas se ilustra la mediana. Con datos agrupados la mediana se localizara en uno de los intervalos de clase. La clase en la que cae la mediana se llama la clase de la mediana y se hace la suposición de que los valores individuales de la esta clase se distribuyen uniformemente sobre la clase. Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química El lugar que ocupa la mediana en el ordenamiento se obtiene mediante la formula: Una vez localizado el lugar de la mediana se hace el calculo de la mediana: Lugar de la mediana = n + 0.5 2 n +1 − (F + 1) C ~ = Lm~ + 2 m f m~ Donde: Lm~ es el límite inferior de la clase que contiene la mediana n es el número total de datos F es la suma de todas las frecuencias, pero sin incluir la clase mediana Moda (Mo) El cálculo de la moda para distribuciones cuantitativas continuas requiere de algunos cálculos: Se debe localizar la clase modal, que será aquella que tenga la mayor frecuencia. ∆1 Mo = LMo + C ∆1 + ∆ 2 Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Donde: Departamento de Ingeniería química LMo es el límite inferior de la clase modal. ∆ 1 es la frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por debajo de ella. ∆ 2 es la frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella. C es el intervalo de la clase modal. Ejemplo Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma: Linderos 45-55 6 6 55-65 10 16 65-75 19 35 75-85 11 46 85-95 4 50 Medidas de posición no centrales Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Ejemplo Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos del ejemplo anterior. Los deciles y centiles se calculan de igual manera, aunque haría falta distribuciones con mayor número de datos. 1º cuartil: es el valor 1.22 cm, ya que por debajo suya se sitúa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2º cuartil: es el valor 1.26 cm, ya que entre este valor y el 1º cuartil se sitúa otro 25% de la frecuencia. 3º cuartil: es el valor 1.28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia. Además, por encima suya queda el restante 25% de la frecuencia. Nota: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones. Rango ( R ) [o recorrido, también se le conoce como amplitud o intervalo] El rango es la diferencia entre el límite superior de la ultima clase y el límite inferior de la primera clase. R = Ls (Ultima clase) - L i ( primera clase) Donde: Ls es el límite superior de la ultima clase Li es el límite inferior de la primera clase Varianza ( s ) 2 Autor: Rosalba Patiño Herrera Agosto del 2002 Instituto Tecnológico de Celaya Departamento de Ingeniería química Muestra: Desviación estándar ( S ) Autor: Rosalba Patiño Herrera Población: s = s2 Agosto del 2002