Métodos Estadísticos 1.2.Medidas de tendencia central y de dispersión de datos agrupados UNIDAD I. ESTADÍSTICA DESCRIPTIVA Objetivo de la unidad: El alumno describirá el comportamiento de los datos empleando diagramas de tallo, histogramas, polígonos y las medidas de tendencia central, de dispersión para el análisis estadístico de un proceso. 1.2. MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN DE DATOS AGRUPADOS A continuación se describen los objetivos del presente tema: Saber: Describir el método de cálculo la media, mediana, moda, varianza, desviación estándar y coeficiente de variación de datos agrupados. Hacer: Calcular la media, mediana, moda, varianza, desviación estándar y coeficiente de variación de datos agrupados. Medidas de tendencia central a analizar En este tema veremos las siguientes medidas de tendencia central: media o promedio, mediana y moda. A continuación las describimos: La media En datos agrupados se multiplica la cantidad de veces que se repiten los datos en la marca de clase. Media de la muestra: ∑ x= n i =1 xi f i n ∑ Media de la población: µ = N i =1 ; Por ejemplo se tienen los siguientes datos para el tiempo de vida de cierta marca de focos. Intervalo en horas Inferior Superior [ 1200 1300 ) [ 1300 1400 ) [ 1400 1500 ) [ 1500 1600 ] Marca de clase Frecuencia 5 15 20 5 Determine la vida media de los focos dados los datos anteriores, en este ejercicio se requiere la participación de los alumnos. Mediana La mediana para datos agrupados se calcula de la siguiente forma: n 2 − F(Me) Me = Li + I f(Me) Donde: Li= Límite inferior de la clase mediana (la clase que contiene a la mediana) n = Tamaño total de la muestra (frecuencia total) F(Me) = Frecuencia acumulada de la clase inmediatamente anterior a la mediana. f(Me) = Frecuencia absoluta de la clase de la mediana I = Ancho del intervalo xi f i N Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books Elaboró: MC. Marcel Ruiz Martínez 1 Métodos Estadísticos 1.2.Medidas de tendencia central y de dispersión de datos agrupados Ejemplo: Calcule la mediana de las puntuaciones de un examen de admisión, dados en la siguiente tabla. Intervalo en horas Inferior Superior [ 150 190 ) [ 190 230 ) [ 230 270 ) [ 270 310 ) [ 310 350 ] Frecuencia relativa 10 30 30 20 10 Frecuencia Absoluta 10 40 70 90 100 Entonces: n 100 = = 50 2 2 La posición 50 queda en el intervalo 3 de la frecuencia absoluta [230270), por lo tanto la ecuación queda: 50 − 40 Me = 230 + 40 = 243.3 30 Esto significa que el 50% de los estudiantes obtuvo un puntaje mayor que 243.3 y el otro 50% un puntaje menor. Moda. Ejemplo: Calcule la moda de las puntuaciones de un examen de admisión, dados en la siguiente tabla. Intervalo en horas Inferior Superior [ 150 190 ) [ 190 230 ) [ 230 270 ) [ 270 310 ) [ 310 350 ] Frecuencia relativa 10 20 30 25 15 La moda es el punto de mayor concentración, puede ser la mejor medida de tendencia central cuando la distribución es muy asimétrica, es decir existan pocos valores muy altos o muy bajos que obliguen a otra medida como la media a tomar valores fuera del centro de los datos. En este caso la sustitución para detectar la moda del conjunto de datos anteriores es: 10 Mo = 230 + 40 = 256.6 10 + 5 En la siguiente figura se muestra la relación empírica entre las medidas de tendencia central vistas: media mediana moda. De una distribución o frecuencia la moda se puede calcular de la siguiente forma: D1 Mo = Li + I D1 + D 2 Li = Límite inferior de la clase modal (la clase que contiene la moda) I = Ancho del intervalo de la clase modal D1= Diferencia entre la frecuencia modal y la premodal D2= Diferencia entre la frecuencia modal y la postmodal Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books Elaboró: MC. Marcel Ruiz Martínez 2 Métodos Estadísticos Medidas de dispersión o variación 1.2.Medidas de tendencia central y de dispersión de datos agrupados x= ∑x f n En este tema estudiaremos las siguientes medidas de dispersión: varianza, desviación estándar, rango, coeficiente de variación. Varianza Para el cálculo de la varianza de datos agrupados se utiliza la siguiente fórmula: ∑ (x i − x )f i σ2 = n Ejemplo: Para la siguiente distribución de frecuencias determine la varianza: Intervalo de clase Frecuencia Inferior Superior fi [ 20 40 ) 10 [ 40 60 ) 30 [ 60 80 ) 20 [ 80 100 ) 20 [ 100 120 ) 20 Solución: Se calcula la marca de clase, así como los siguientes elementos intermedios. Intervalo de clase Frecuencia Marca de clase Inferior Superior (x i − x )2 f i xi fi* xi fi [ 20 40 ) 10 30 300 17,640 [ 40 60 ) 30 50 1,500 14,520 [ 60 80 ) 20 70 1,400 80 [ 80 100 ) 20 90 1,800 6,480 [ 100 120 ) 20 110 2,200 28,800 Σ 7,200 67,600 = i i ∑ (x σ2 = 7200 = 72 100 − x )f i i n = 67,600 = 676 100 Desviación estándar. La desviación estándar se define como la raíz cuadrada de la varianza, por lo cual la ecuación para su cálculo se define como: σ = σ2 Por sustitución también puede definirse como: ∑ (x σ= i − x )f i n Coeficiente de variación. Al igual que en el caso del tema anterior la ecuación del coeficiente de variación para datos agrupados es la misma: σ (100% ) µ CV = La importancia de la desviación, estándar, de la varianza, el rango y el coeficiente de variación se debe a que nos ofrece una visión de la dispersión de los datos, lo cual sirve para poner en contexto la exactitud de las medidas de tendencia central. Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books Elaboró: MC. Marcel Ruiz Martínez 3 Métodos Estadísticos 1.2.Medidas de tendencia central y de dispersión de datos agrupados EJEMPLO: Medidas de dispersión y tendencia central. Para los siguientes datos de puntuaciones en un examen de admisión determine las medidas de tendencia central y dispersión vistas en clase: Intervalo en horas Inferior Superior [ 150 190 ) [ 190 230 ) [ 230 270 ) [ 270 310 ) [ 310 350 ] Frecuencia relativa 10 20 30 25 15 Calcule las siguientes medidas de tendencia central y de dispersión vistas. 1. Media 2. Mediana 3. Moda 4. Desviación estándar 5. Varianza 6. Coeficiente de variación. Archivo en EXCEL. Puede usar la siguiente liga para descargar el archivo de EXCEL que le servirá de apoyo para resolver el ejercicio anterior. http://marcelrzmut.comxa.com/MetodosEstadisticos/12TallerBasicoCalculoMedidasDatAgrup.xls Práctica 1.2. Medidas de tendencia central y de dispersión de datos agrupados. Se realiza un muestreo de la contaminación de cromo hexavalente en el agua de una laguna, a continuación se muestran las concentraciones en partes por millón de dicho contaminante. Intervalo en ppm Frecuencia relativa Inferior Superior [ 15 19 ) 5 [ 19 23 ) 10 [ 23 27 ) 15 [ 27 31 ) 12 [ 31 35 ] 16 Calcule las siguientes medidas de tendencia central y de dispersión vistas para datos agrupados. 1. Media 2. Mediana 3. Moda 4. Rango 5. Desviación estándar 6. Varianza CONDICIÓN IMPORTANTE: No usar el mismo archivo de Excel que se ofreció como taller, hacer uno original por sí mismo. Entrega tus resultados en forma de PRÁCTICA DE EJERCICIOS, siguiendo las rúbricas indicadas en la dirección: http://marcelrzm.comxa.com/Rubricas/Rubricas.htm Enviar el documento final por correo electrónico a las siguientes direcciones: marcelrzm@hotmail.com; marcelusoacademico@hotmail.com; marcelrzm@yahoo.com.mx y marcelrz2002@yahoo.com.mx Colocar en ASUNTO: “Práctica 1.2. Medidas de tendencia central y de dispersión de datos agrupados”. Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books Elaboró: MC. Marcel Ruiz Martínez 4