IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS I CORRECCIÓN EJERCICIO BLOQUE DE ESTADÍSTICA Fecha: 28/01/11 1.- Una compañía discográfica ha recopilado la siguiente información sobre el número de conciertos dados, durante el verano, por 15 grupos musicales y las ventas de discos de estos grupos (expresados en miles de CDs): Conciertos(Y) CDs (x) [1,5) [5,10) [10, 20) [10, 30) [30, 50) [50,70) 3 1 0 0 4 2 0 0 5 a) ¿Qué representa el 4 que aparece en la tabla? Solución: este valor indica que cuatro grupos musicales que realizaron entre 30 y 50 conciertos a lo largo del verano, vendieron entre 5 y 10 mi CDs. b) Haz la distribución marginal de Y. Calcula P60 e interpreta su significado. Solución: La distribución marginal de Y es la siguiente: Conciertos (Y) fi [10, 30) [30, 50) [50,70) TOTAL Fi 4 6 5 4 10 15 15 Para hallar el P60 debemos primero localizar en qué intervalo se encuentra: P60 se encuentra en el intervalo [30, 50). Para calcularlo utilizamos la siguiente expresión: Es decir, el 60% de los grupos musicales realizó menos de 47 (ó 47) conciertos a lo largo del verano. 2.- Una compañía de seguros ha registrado durante unos días el número de vehículos (X) que circulan por una autopista, y el número de accidentes (Y) que ocurren en ella, obteniendo la tabla: Nº de vehículos en miles (X) 15 18 10 8 20 Nº de accidentes (Y) 4 7 2 2 9 a) ¿Es razonable suponer que existe correlación lineal entre ambas variables? ¿Cómo puede expresarse esa correlación? Solución: Si observamos los datos de la tabla, podemos observar que cuanto mayor es el número de vehículos que circulan por la autopista, mayor es el número de accidentes que se producen. Para comprobar si la correlación que existe es lineal o no, realizaremos el diagrama de dispersión: IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS I 10 9 Nº de accidentes 8 7 6 5 4 3 2 1 0 0 5 10 15 20 25 Nº de vehículos (miles) Parece existir una correlación lineal positiva y fuerte. Para medir la fuerza de dicha correlación debemos hallar el coeficiente de correlación lineal de Pearson. Con ayuda de la calculadora calculamos la media y desviación típica de ambas variables, obteniendo los siguientes resultados: Para hallar la covarianza utilizaremos esta tabla: Nº de vehículos (miles) 15 18 10 8 20 Nº de accidentes 4 7 2 2 9 TOTAL fij 1 1 1 1 1 5 xi.yj.fij 60 126 20 16 180 402 = El coeficiente de correlación lineal es: r= El valor de r confirma lo expuesto anteriormente: entre ambas variables existe una correlación lineal fuerte y positiva, cuanto mayor es el número de vehículos que circula por la autopista, mayor es el número de accidentes que ocurren. b) ¿Cuál de las dos variables presenta mayor dispersión? Solución: Para comparar la dispersión entre ambas variables vamos a calcular el coeficiente de variación de Pearson. IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS I La variable que presenta mayor dispersión es Y (nº de accidentes) c) Halla Q3 para la variable Y e interpreta su significado. Solución: Nº de accidentes 2 4 7 9 TOTAL fi 2 1 1 1 5 Fi 2 3 4 5 Por lo tanto Q3= 7 accidentes, es decir, el 75% de accidentes ocurridos en la autopista es inferior (o igual) a 7. d) Si ayer circularon 14 mil vehículos, ¿cuántos accidentes podemos esperar que se produzcan en la autopista? Valora la fiabilidad de tu estimación. Solución: Para responder a la pregunta necesitamos hallar la recta de regresión de Y sobre X: y y y 4,8 y 12, 24 4, 5782 x xy x2 12, 24 4, 5782 ( x x) ( x 14,2) 12,24 14,2 4,8 4,5782 y = 0,584x – 3,493 Si ayer circularon 14 mil vehículos, x= 14, cabe esperar que se hayan producido y = 0,584·14 – 3,493 = 4,683≈5 accidentes. Aunque el valor de r es alto y la estimación se ha realizado para un valor próximo a los considerados para hallar la recta, la fiabilidad de nuestra predicción no es muy buena porque el número de valores a partir de los cuales hemos hallado la recta de regresión es muy bajo (sólo 5). 3.- La siguiente tabla muestra las toneladas de una serie de residuos urbanos recogidos en las Islas en los últimos años. Imagina que eres periodista y tienes que escribir un artículo con esta información. Vidrio Papel y cartón Plásticos (excepto embalajes) 2008 2007 2006 2005 2004 24.266 20.298 20.414 18.237 18.475 72.907 80.668 76.863 60.548 26.512 6.604 3.638 3.720 6.051 7.146 Fuente: Instituto Canario de Estadística (ISTAC) IES LILA Curso 10/11 1º BACH. MÁT. APLICADAS I Solución: Para hacer el comentario correctamente hay que explicar - qué información aparece en la tabla. - cuál es la fuente de información. - cuál de los tres residuos se recoge en mayor cantidad y cuál menos. - la tendencia que se observa a lo largo de los años en cada residuo y en general. - qué residuo ha experimentado mayor variación en estos años.