Guía de Ejercicios Solemne N°1 Estadística Descriptiva y Probabilidad Profesores: Catalina Reyes, Montserrat Soto, Jorge Rozas, Claudio Aguilar. Ayudantes: Mónica Aravena, Jeziel Curiqueo, Andrés Celedon, Esteban Terán, José Ignacio Larraín. Ejercicios con soluciones 1. La siguiente información reporta la cantidad de cuentas de ahorro abiertas según monto por en dos sucursales del “Banco Patito Amarillo” durante el mes de diciembre del año 2016. De la sucursal “Ñuñork” se recopiló la siguiente información: Monto ahorrado (en Millones de pesos) 𝑁𝑖 [5 – 10[ 4 [10 -15[ 10 [15 – 20[ 18 [20 – 25[ 27 [25 – 30[ 36 [30 – 35] 40 De la sucursal “La Flower” el promedio de los montos ahorrados de las cuentas abiertas es de 13.783.800, con un coeficiente de variación de 0,24 y un total de 50 cuentas abiertas. a. Indique el monto ahorrado total entre las sucursales mencionadas al 31 de Diciembre. R: 825 + 689,19 = 1514,19 b. En enero del año 2017, se abrió una nueva sucursal “Saint Mikel” reporta a finales de dicho mes en promedio de montos ahorrados de las cuentas abiertas de 9,7265 y con una desviación atípica de 6,3945. Dicha sucursal cuenta con 35 cuentas abiertas. ¿Cuál de las dos sucursales abiertas a diciembre tiene el monto menos homogéneo a finales del 2016? ¿y a finales de enero considerando la apertura de Saint Mikel? R: Saint Mikel porque tiene mayor CV, c. En la sucursal La Flower, un importante cliente ingresó el domingo 1ero de Enero de 2017. A pesar que está un día después de su fecha de corte de análisis, a su parecer afectará considerablemente sus estadísticas y prefiere no dejarlo fuera. Este cliente tiene $42.345.000 pesos chilenos en su cuenta. Responda nuevamente a la pregunta c) considerando la nueva información. R: El nuevo CV de La Flower sería 𝐶𝑉 = 0,3583. Saint Mikel sigue siendo el más heterogéneo. d. Estas cuentas fueron ofrecidas hasta el 2016 sin costo, pero para este año se va a considerar un cobro anual basado en las cifras de cierre al primer día del año. Se va a cobrar un fijo de $12.500 pesos y un variable del 1,5% de cada cuenta. Indique la nueva media y varianza de cada sucursal. Ñuñork: Esperanza: $20,3033; Varianza: $52,8427 La Flower: Esperanza: $14,1154; Varianza: $25,6239 SaintMikel: Esperanza: $9,5681; Varianza: $39,6721 e. Por políticas de la empresa, se decide eliminar las cuentas de ahorro inferiores a 10.000.000 y superiores a 30.000.000 de la sucursal de “Ñuñork” Indique cuál es el porcentaje de cartera de clientes que se mantiene en dicha sucursal. R: El porcentaje de clientes que se mantiene en dicha sucursal es 81,81 – 9,09 = 72,72%. f. Entre las sucursales de Ñuñork y La Flower con datos de parte d), calcule la varianza global del ahorro en las cuentas, e indique si es mayor la variabilidad generada entre las sucursal o dentro de estas R: 𝑖𝑛𝑡𝑟𝑎𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝐺𝑙𝑜𝑏𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝐺𝑙𝑜𝑏𝑎𝑙 2. = = 37,5882 47,0209 9,4327 47,0209 ∗ 100 = 79,94% Mayor variabilidad dentro de las sucursales ∗ 100 = 20,06% El proyecto de Transantiago considera algunas medidas para la licitación del transporte público, en cuanto al uso de la locomoción colectiva, para lo cual se observó el número de personas que diariamente utiliza este medio de movilización en un paradero del sector oriente de Santiago, a la hora de mayor movimiento (desde las 17.30 a las 20.00), obteniéndose los siguientes resultados Rango de Cantidad de Personas 100 160 161 220 221 280 281 340 341 400 401 460 461 520 521 580 a. c. 8 15 26 40 30 12 7 2 140 Si el número medio de personas que se movilizan es mayor de 300, entonces es necesario asignar seis unidades de transporte, en cualquier otro caso sólo se asignarían cuatro. De acuerdo a la información obtenida: i. ¿Cuántas unidades de transporte deben asignarse? R: 6 unidades ii. b. N° de días Determine el tipo de asimetría de la distribución de datos. Interprete su resultado. R: asimetría a la izquierda ¿Durante cuantos días el número de personas que se movilizan oscila entre 250 y 380? R: 73 días. Si para el próximo año se espera un incremento de 7,5% del número de personas que se movilizan en las horas de mayor movimiento, ¿En cuánto se altera la dispersión relativa? R: Se mantiene el CV original. 3. Tenemos dos grupos de 95 trabajadores, el 45% son obreros con un sueldo promedio de 240.000 y una desviación de 50.000 el resto son empleados administrativos con un sueldo promedio de 460.000 y una desviación de 60.000 .Calcule la varianza total de todos los trabajadores de la empresa: 𝑋𝑇 = 0,45 ∗ 240 + 0,55 ∗ 460 = 361 Un promedio total de 361.000 2 𝑆𝐼𝑁𝑇𝑅𝐴 = 0,45 ∗ 502 + 0,55 ∗ 602 = 3.105 2 𝑆𝐼𝑁𝑇𝐸𝑅 = 0,45 ∗ (240 − 361)2 + 0,55 ∗ (460 − 361)2 = 11.979 Varianza total = 15.084.000.000 4. a) El responsable en control industrial de la empresa CLR somete a un control de fiabilidad 110 baterías idénticas de una maquinas y anota su duración (tiempo hasta que se descargue) en horas. La información obtenida se presenta a continuación. Duración ( en horas) Nº de Baterias 200-300 4 300-400 25 400-500 60 500-600 19 600-700 2 Si se quiere garantizar a las baterías que tengan una duración de a lo más una y media desviaciones estándar por sobre la media, ¿Qué porcentaje de las baterías están garantizadas? 𝑋 = 440,9051 𝑆𝑥 = 78,4546 𝑋 + 1,5 ∗ 𝑆𝑥 = 558,587 558,587 = 500 + 110 ∗ 𝑘 100 − 89 ∗ ⇒ 𝑘 = 91,03% 100 19 El 91,03% de las baterías serán garantizadas. b) La empresa ADA, de la competencia tiene en el mercado baterías de similares condiciones, al tomar una muestra de baterías de igual tamaño se obtuvo que la duración media fue de 400 2 horas y una varianza de 6400 horas Para competir con la empresa CLR, la empresa ADA decide utilizar una tecnología que permite aumentar la duración de cada batería en 70 horas. Después de aplicada la nueva tecnología ¿en cuál de estas empresas resulta más homogénea la duración de las baterías? EMPRESA N Promedio Desv. Estándar CLR ADA (después de la modificación 110 80 440,9051 470 78,4546 80 Coeficiente de Variación 17,70 17,02 Las baterías de la empresa ADA después de la modificación tienen duración más homogéneas que las baterías de la empresa CLR. Ejercicios propuestos: 5. El jefe de producción de una industria de alimentos enlatados se ve enfrentado a lo siguiente: debido a problemas financieros de la empresa, debe tomar la decisión de descartar una de las dos máquinas en funcionamiento en la fábrica, basándose en el peso de las latas de conserva. De la Máquina 1, se obtuvo la siguiente información: Peso (gr) N° de latas 176-186 5 186-196 20 196-206 50 206-216 20 216-226 5 En tanto, para la Máquina 2, de una producción de 80 latas se ha obtenido: 80 2 2 ∑80 𝑖=1 𝑥𝑖 = 16120 𝑔𝑟𝑠 ; ∑𝑖=1 𝑥𝑖 = 3248300 𝑔𝑟𝑠 , donde xi es peso el i-ésimo producto a. Determine la(s) variable(s) involucrada(s) y clasifíquela(s). b. Se ha decidido descartar aquella máquina cuyo envasado sea más heterogéneo, ¿cuál se debe rechazar? c. Si se consideran inaceptables aquellos productos, con peso mayor a 210 o menor a 190 gr. ¿Cuál es el porcentaje de latas, envasadas por la Máquina 1, que presentan un peso aceptable? d. 6. ¿Qué porcentaje de latas de la Máquina 1 se encuentra sobre el cuarto quintil?, interprete Para verificar el efecto de un nuevo pesticida a un cultivo de café, selecciono una muestra de 49 matas y se les midió su altura en centímetros después de 3 meses de haber sido plantadas y regadas con el producto. a. ¿Qué medida de tendencia central representa mejor el comportamiento de los datos? ¿Por qué? b. Para el agrónomo el pesticida utilizado fue exitoso si la altura mínima de las matas es de 28 cm. ¿Qué porcentaje de matas estarían en esta categoría? c. Calcule y analice la dispersión relativa de la altura. d. Calcule la intravarianza e intervarianza para la altura de las matas, considerando la primera categoría hasta 30,5 centímetros y la segunda sobre este valor. 7. CCU realizó un estudio con el fin de identificar la cantidad de dinero que venden en bebidas ciertos locales de la capital. La siguiente tabla de frecuencias indica la cantidad de millones de pesos que los locales comercializadores venden en bebidas anualmente. Se consideró una muestra de 92 locales. a. Indique los límites del intervalo que contiene al 20% de los datos centrales. b. Analice el porcentaje de variabilidad, interprete. 8. Un curso Universitario de 80 alumnos debe evaluar a su profesor, para esto le ponen una nota individual que puede estar entre 0 a 10. a. Qué tipo de simetría tiene esta distribución de notas? Justifique su respuesta con medidas cuantitativas adecuadas. ¿Entre que intervalo se encuentran el 30% de las notas centrales? b.