Medidas de Variabilidad Trabajo a realizar de este tema: En Excel 2003 hoja 1, prepara un(os) cuadro(s) sinópticos o mapas conceptuales o mapas mentales que sinteticen éste capítulo. En la hoja 2 y en la hoja 3 del mismo libro de Excel resuelve los problemas 8 y 15 que están al final de este tema. Los ejercicios 5 y 9 los realizarás a mano y los entregarás en sobre conforme al protocolo indicado. Anota las fórmulas empleadas en ambos trabajos. El nombre del archivo deberá ser: 05 MEDIDAS D VARIABILIDAD APELLIDO NOMBRE Se calificará de la siguiente manera: + Ortografía (2 puntos) Protocolo de envío: + Asunto: mal anotado el 100% del trabajo + Nombre (1 punto) + Comentario (2 punto) + Nombre del archivo (1 punto) + Versión diferente a 2003 (7 puntos) En el trabajo solución, tanto en Excel como el trabajo escrito: Comentario o conclusión del trabajo (2 punto) Ortografía: (1 punto) Nombre Universidad Carrera Materia Tema Fecha (La ausencia total o de alguna parte restará 1 punto) A continuación, y sin dejar hoja en blanco, el desarrollo del trabajo (1 punto menos de no cumplirlo). Se calificará la realización de las síntesis. MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 1 Medidas de Variabilidad ¿Qué son las medidas de variabilidad? Rango Desviación media La varianza y la desviación estándar Coeficiente de variación Rango intercuartilar Problemas ¿Qué son las medidas de variabilidad? La puntuación media en una distribución es importante en muchos contextos de investigación. Pero también lo es otro conjunto de estadísticos que cuantifican que tan variables, o que tan dispersas, tienden a ser las puntuaciones. ¿Las puntuaciones varían mucho, o tienden a tener valores muy similares. A veces, la variabilidad en las puntuaciones es la cuestión central en una investigación. La variabilidad es un concepto cuantitativo, de modo que nada de esto se aplica a las distribuciones de datos cualitativos. Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una medida de variabilidad pequeña indica que los datos están agrupados muy cerca, digamos, de la media. La media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una gran medida de variabilidad indica que la media no es muy representativa de los datos. Una segunda razón para estudiar la variabilidad de una serie de datos es para comparar como están esparcidos los datos en dos o más distribuciones. Por ejemplo, la calificación promedio de dos estudiantes, A = {90, 80, 75, 75 } y B = {90, 55, 85, 90 }, es de 80. Basados en esto podríamos pensar que sus calificaciones son idénticas. Pero si revisamos el detalle de sus calificaciones vemos que esta conclusión no es correcta. Hay muchas medidas de variabilidad intuitivamente atractivas, pero poco utilizadas, como el rango, la desviación media y la desviación cuartilar. De lejos, las medidas de variabilidad más ampliamente utilizadas son las que tienen que ver con cómo extender los resultados a partir de la media. Estas son la desviación estándar (s), y la varianza (s² o "var"). MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 2 Rango La forma más sencilla de medir la variabilidad es el rango. Es la diferencia entre los más altos y más bajos valores en un conjunto de datos no agrupados. En la forma de una ecuación: Rango = valor más alto - valor más bajo El rango tiene la ventaja de ser fácil de calcular y entender. Ejemplo: Las calificaciones de cinco estudiantes de estadística son: 8, 8, 10, 6, y 8. ¿Cuál es el rango de las calificaciones? Rango = valor más alto - valor más bajo = 10 - 6 = 4 Rango para datos agrupados Para estimar el rango de una distribución de frecuencia se resta el límite inferior del intervalo de clase más chico del límite superior del intervalo de clase más grande Ejemplo: Una muestra de las edades del público de un concierto se encuentra distribuida de la siguiente manera: Edades Número de personas 15 - 19 2 20 - 24 1 25 - 29 4 30 - 34 15 35 - 39 10 40 - 44 5 45 - 49 3 Rango = mayor limite superior - menor límite inferior = 49 - 15 = 34 (Valor absoluto de un número a = | a | es el número a sin su signo.) MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 3 Desviación media (Dm) La desviación media mide la cantidad promedio que varían los datos respecto a su media. La definición es: Desviación media es la media aritmética de los valores absolutos de las desviaciones de los datos respecto a su media. La fórmula de la desviación media para datos no agrupados (Dm) es: Dm = Σ| X - | n Ejemplo: Las calificaciones de cinco estudiantes de estadística son: 8, 8, 10, 6, y 8. ¿Cuál es la desviación media de las calificaciones? X X- |X - 8 0 0 8 0 0 10 +2 2 6 -2 2 8 0 0 Σ=4 X=8 Dm = Σ| X n MEDIDAS DE VARIABILIDAD | | = 4 = 0.8 5 0500 MEDIDAS D VARIABILIDAD.doc 4 Desviación media para datos agrupados En el caso de que los datos se encuentren agrupados en una distribución de frecuencia la fórmula es : Dm = Σf | X - | n Ejemplo: Se tienen los siguientes datos agrupados: LI LS X F FX |X–X| F|X–X| 15 19 17 2 34 17.12 34.24 20 24 22 1 22 12.12 12.12 25 29 27 4 108 7.12 28.48 30 34 32 15 480 2.12 31.80 35 39 37 10 370 2.88 28.80 40 44 42 5 210 7.88 39.40 45 49 47 3 141 12.88 38.64 n =40 ΣfX = 1365 = Σfx n Dm = = 1365 Σ 213.48 = 34.12 40 213.48 5.337 40 Ventajas y Desventajas de la desviación media La desviación media tiene dos ventajas. Utiliza para su cómputo todos los elementos de la serie de datos y es facil de entender. MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 5 La varianza (σ2 ó S2) y la desviación estándar (σ ó S) Concepto de varianza y desviación estándar La varianza y la desviación estándar sirven para cuantificar la variabilidad de una muestra midiendo su dispersión alrededor de la media. La definición es la siguiente: 2 Varianza. (σ ó S2) (σ = sigma) Es la media aritmética de las desviaciones cuadradas de los datos respecto a la media. Desviación estándar. (σ ó S) Es la raíz cuadrada de la varianza. Varianza y Desviación Estándar para datos no agrupados Las fórmulas de la varianza de una población y de una muestra son ligeramente diferentes. Las fórmulas son: σ 2= (Σx)2 Σx2 - (Σx)² Σx2 - N n S2= N n-1 varianza de una población varianza de una muestra Las desviaciones estándar de la población y muestra se calculan simplemente sacando la raíz cuadrada a la respectiva varianza. desviación estándar de una población σ = σ2 desviación estándar de una muestra MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc S= S2 6 Ejemplo El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la varianza y la desviación estándar de las observaciones muestreadas? X 85.4 85.3 84.9 85.4 84.0 Σx= 425.0 Σx 2 (Σx)2 n S2= = 36126.42 - S= S2 = (425)2 5 n-1 X2 7293.16 7276.09 7208.01 7293.16 7056.00 2 Σx = 36126.42 = 0.355 5-1 0.355 = 0.5958 Varianza y Desviación Estándar para datos agrupados Si los datos están agrupados en una distribución de frecuencia, la varianza y la desviación estándar de la muestra se pueden aproximar sustituyendo Σfx² en Sx² y Σfx en Sx. Las fórmulas quedarían de la siguiente manera: σ 2= (Σfx)2 Σfx2 - Σfx2 - N S2= N varianza de una población desviación estándar de una población n n-1 varianza de una muestra σ = σ2 desviación estándar de una muestra MEDIDAS DE VARIABILIDAD (Σfx)2 0500 MEDIDAS D VARIABILIDAD.doc S= S2 7 Ejemplo: 2 Calcular la varianza (σ ó S2) y la desviación estándar (σ ó S) de la siguiente distribución de frecuencia del número de meses de duración de una muestra de 40 baterías para coche. duración de las baterías (meses) Número de baterías 15 - 19 2 20 - 24 1 25 - 29 4 30 - 34 15 35 - 39 10 40 - 44 5 45 - 49 3 Primeramente, calculamos la marca de clase, para después calcular los productos fX y fx2 para proceder finalmente a calcular las sumatorias ΣfX y Σfx2 y aplicar las fórmulas. LI LS X F FX FX2 15 19 17 2 34 588 20 24 22 1 22 484 25 29 27 4 108 2916 30 34 32 15 480 15360 35 39 37 10 370 13690 40 44 42 5 210 8820 45 49 47 3 141 6627 n =40 ΣfX = 1365 Σfx2 = 48475 Σfx 2 (Σfx)2 n S2= 48475 = n-1 40 = 48.573 40 - 1 S= MEDIDAS DE VARIABILIDAD (1365)2 S2 = 48.573 = 6.969 0500 MEDIDAS D VARIABILIDAD.doc 8 Coeficiente de variación El coeficiente de variación se define como la razón de la desviación estándar entre la media aritmética. C.V. = σ x ( 100 ) Ventajas El coeficiente de variación es útil cuando pretende comparar la variabilidad de dos o más conjuntos de datos expresados en diferentes unidades de medición, pues el resultado será señalado en porcentajes. Desventajas Cuando el valor de la media es cercano a cero, el coeficiente de variación es muy sensible a pequeños cambios en la media, limitando su utilidad A diferencia de la desviación estándar este no puede ser utilizado para elaborar intervalos de confianza para la media. 1 Interpolación es la construcción de nuevos puntos partiendo del conocimiento de un conjunto discreto de puntos. MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 9 Problemas Para cada uno de los siguientes problemas calcule : (a) el rango (b) la desviación media r (c) la varianza (d) la desviación estánda (e) el coeficiente de variación 1. Los resultados siguientes representan las calificaciones del examen final de un curso de estadística elemental. 23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 52 10 64 75 78 25 80 98 81 67 41 71 83 54 64 72 88 62 74 43 60 78 89 76 84 48 84 90 15 79 34 67 17 82 69 74 63 80 85 61 2. El gerente de una firma especializada en renta de condominios para vacacionistas, quiere saber como están distribuidas los montos de las rentas mensuales de los departamentos de la firma. Seleccionó una muestra de departamentos cuyas muestras son mostradas abajo. Rentas mensuales de los condominios 1170 1207 1581 1277 1305 1472 1077 1319 1537 1849 1332 1418 1949 1403 1744 1532 1219 896 1500 1671 1471 1399 1041 1379 821 1558 1118 1533 1510 1760 1826 1309 1426 1288 1394 1545 1032 1289 695 803 1440 1421 1329 1407 718 1457 1449 1455 2051 1677 1119 1020 1400 1442 1593 1962 1263 1788 1501 1668 1352 1340 1459 1823 1451 1138 1592 982 1981 1091 MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 10 3. Los siguientes datos representan la duración de la vida en meses de 30 bombas de combustible similares. 24 36 4 40 16 15 18 6 30 60 3 72 66 78 3 28 67 72 15 3 18 48 71 22 57 9 54 4 12 72 4. Los siguientes datos representan la duración de la vida, en segundos, de 50 moscas sometidas a un nuevo atomizador en un experimento de laboratorio controlado. 17 20 10 9 23 13 12 19 18 24 12 14 6 9 13 6 7 10 13 7 16 18 8 13 3 32 9 7 10 11 13 7 18 7 10 4 27 19 16 8 7 10 5 14 15 10 9 6 7 15 5. Se aplicó una encuesta donde se les pide indicar el número de amigos o parientes que visitan cuando menos una vez al mes. Los resultados son los siguientes: 3 5 2 3 3 4 1 8 4 2 4 2 5 3 3 3 0 3 5 6 4 3 2 2 6 3 5 4 14 3 5 6 3 4 2 4 9 4 1 4 2 4 3 5 0 4 3 5 7 3 5 6 2 2 MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 11 6. Una compañía de cambio de aceite tiene varias sucursales en la zona metropolitana. El número de cambios de aceite en la sucursal de la calle Roble en los pasados 20 días son: 66 98 55 62 79 59 51 90 72 56 70 62 66 80 94 79 63 73 71 85 7. El gerente local un negocio de comida rápida esta interesado en el número de veces que un cliente compra en su tienda durante un periodo de dos semanas. Las respuestas de los 51 clientes fueron: 5 3 3 1 4 4 5 6 4 2 6 6 6 7 1 1 14 1 2 4 4 4 5 6 3 5 3 4 5 6 8 4 7 6 5 9 11 3 12 4 7 6 5 15 1 1 10 8 9 2 12 8. El presidente de una agencia de viajes, quiere información sobre las edades de la gente que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero el año pasado reveló estas edades: 77 18 63 84 38 54 50 59 54 56 36 26 50 34 44 41 58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 45 66 83 71 63 58 61 71 60 9. Una cadena de tiendas de artículos deportivos al servicio de esquiadores principiantes, planea hacer un estudio de cuanto gasta un esquiador principiante en su primera compra de equipo. Una muestra de recibos de sus cajas registradoras reveló esas compras iniciales. 140 82 265 168 90 114 172 230 142 86 125 235 212 171 149 156 162 118 139 149 132 105 162 126 216 195 127 161 135 172 220 229 129 87 128 126 175 127 149 126 121 118 172 126 MEDIDAS DE VARIABILIDAD 0500 MEDIDAS D VARIABILIDAD.doc 12 10.- Se conduce un estudio de los efectos de fumar sobre los patrones de sueño. La medición que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos datos: 69 56 22 28 41 28 47 53 48 30 34 13 52 34 60 25 21 37 43 23 13 31 29 38 26 36 30 11. Un banco seleccionó una muestra de 40 cuentas de cheques de estudiantes. Abajo aparecen sus saldos de fin de mes. 404 74 234 149 279 215 123 55 43 321 87 234 68 489 57 185 141 758 72 863 703 125 350 440 37 252 27 521 302 127 968 712 503 498 327 608 358 425 303 203 12.- Una compañía de luz seleccionó una muestra de 20 clientes residenciales. Los siguientes datos son las cuentas que se les facturó el mes pasado: 54 48 58 50 25 47 75 46 60 70 67 68 39 35 56 66 33 62 65 67 13.- Una muestra de suscriptores de una compañía telefónica reveló los siguientes números de llamadas recibidas en la última semana. 52 43 30 38 30 42 34 46 32 18 41 5 MEDIDAS DE VARIABILIDAD 12 0500 MEDIDAS D VARIABILIDAD.doc 46 39 37 13 14. A los solicitantes del puesto de ensamblador de una empresa mueblera se les aplica una prueba. La prueba consiste en tomar el tiempo que tardan en ensamblar cierto mueble. La siguiente es una distribución de frecuencia los tiempos registrados por una muestra de 42 solicitantes. Tiempo (minutos) Número de solicitantes 1-3 4 4-6 8 7-9 14 10 - 12 9 13 - 15 5 16 - 18 2 15. La siguiente es una distribución de frecuencia de una muestra de los pagos realizados en un estacionamiento del centro de la ciudad el sábado pasado Cantidad pagada ($) Número de clientes MEDIDAS DE VARIABILIDAD 5-9 2 10 - 14 7 15 - 19 15 20 - 24 28 25 - 29 14 30 - 34 9 35 - 39 3 40 - 44 2 0500 MEDIDAS D VARIABILIDAD.doc 14