SOLUCIONES EJERCICIOS DISTRIBUCIONES BIDIMENSIONALES Ejercicio nº 1.Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el número de horas que dedicaron a estudiar la semana antes del examen y la nota obtenida en la prueba. La información se recoge en la siguiente tabla: Representa los datos mediante una nube de puntos e indica cuál de estos valores te parece más apropiado para el coeficiente de correlación: 0,92; 0,44; 0,92; 0,44. Solución: Observando la representación, vemos que el coeficiente de correlación es positivo y bajo. Por tanto, r 0,44. Ejercicio nº 2.Se ha realizado una encuesta preguntando por el número de personas que habitan el hogar familiar y el número de habitaciones que tiene la casa. La tabla siguiente recoge la información obtenida: Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución: Medias: 27 x 4,5 6 19 y 3,17 6 Desviaciones típicas: 127 x 4,5 2 0,92 0,96 6 y 63 3,17 2 0,45 0,67 6 Covarianza: 88 xy 4,5 3,17 0,40 6 xy 0,40 Coeficiente de correlación: 0,40 r 0,62 r 0,62 0,96 0,67 Hay una relación positiva, aunque no demasiado fuerte, entre las variables. Ejercicio nº 3.Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La siguiente tabla nos da los seis primeros pares de datos obtenidos: a) Halla la recta de regresión de Y sobre X. b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación? (Sabemos que r 0,97). Solución: a) Medias: 81 13,5 6 394 y 65,67 6 x Varianza de X: 1211 x2 13,52 19,58 6 Covarianza: 5986 xy 13,5 65,67 111,12 6 Coeficiente de regresión: xy 111,12 myx 2 5,68 19,58 x Ecuación de la recta de regresión de Y sobre X: y 65,67 5,68 x 13,5 y 5,68 x 11,01 b) yˆ 12 5,68 12 11,01 yˆ 12 57,15 céntimosde euro Como la correlación es alta, r 0,97, y x 12 queda dentro del intervalo de valores que tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12 céntimos de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color. Ejercicio nº 4.La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene recogida en la siguiente tabla: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 990 165 6 1065 y 177,5 6 Desviaciones típicas: 163900 x 165 2 91,67 9,57 6 x y 189175 177,5 2 22,92 4,79 6 Covarianza: 175900 xy 165 177,5 29,17 6 Coeficientes de regresión: 29,17 y sobre x myx 0,32 91,67 29,17 x sobre y mxy 1,27 22,92 Rectas de regresión: y sobre x y 177,5 0,32 x 165 y 0,32x 124,7 x sobre y x 165 1,27 y 177,5 x 1,27y 60,43 y Representación: x 60,43 1,27 y 0,79x 47,58 b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy 29,17 próximas.Comprobamos que el coef iciente de correlación es: r 0,636 9,57 4,79 Ejercicio nº 5.Se ha medido el número medio de horas de entrenamiento a la semana de un grupo de 10 atletas y el tiempo, en minutos, que han hecho en una carrera, obteniendo los siguientes resultados: Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado para el coeficiente de correlación: 0,71; 0,71; 0,45; 0,32. Solución: A la vista de la representación, observamos que el coeficiente de correlación, r, es negativo y relativamente alto. Por tanto, r 0,71. Ejercicio nº 6.En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene (para el número 42) y su precio, en euros. La información obtenida se recoge en esta tabla: Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución: Medias: 3800 x 633,33 6 370 y 61,67 6 Desviaciones típicas: 2408.050 x 633,33 2 234,78 15,32 6 26000 61,67 2 530,14 23,02 6 Covarianza: 234650 xy 633,33 61,67 50,87 xy 50,87 6 Coeficiente de correlación: 50,87 r 0,14 r 0,14 15,32 23,02 La relación entre las variables es muy débil. Podemos decir que no están relacionadas. y Ejercicio nº 7.En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de 1º de bachillerato en Matemáticas y en Inglés, obteniéndose la información que se recoge en la siguiente tabla: a) Halla la recta de regresión de Y sobre X. b) Calcula ŷ 5, 5. ¿Es fiable esta estimación? (Sabemos que r 0,87). Solución: a) Medias: 37,2 6,2 6 35,5 y 5,92 6 Varianza de X:+ 232,54 x2 6,22 0,32 6 Covarianza: 223 xy 6,2 5,92 0,46 6 Coeficiente de regresión: xy 0,46 myx 2 1,44 0,32 x x Ecuación de la recta de regresión de Y sobre X: y 5,92 1,44 x 6,2 y 1,44 x 3 b) yˆ 5, 5 1,44 5,5 3 4,92 Sí es fiable la estimación, puesto que la correlación es fuerte, r 0,87, y x 5,5 está dentro del intervalo de valores que estamos considerando. Por tanto, estimamos que si la nota de Matemáticas es 5,5, la de Inglés será muy probablemente 4,9. Ejercicio nº 8.En una academia para aprender a conducir se han estudiado las semanas de asistencia a clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que se apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 27 4,5 6 37 y 6,17 6 Desviaciones típicas: 151 x 4,5 2 4,92 2,22 6 x y 247 6,17 2 3,1 1,76 6 Covarianza: 184 xy 4,5 6,17 2,9 6 Coeficientes de regresión: 2,9 y sobre x myx 0,59 4,92 2,9 x sobre y m xy 0,94 3,1 Rectas de regresión: y sobre x y 6,17 0,59 x 4,5 y 0,59 x 3,52 x sobre y x 4,5 0,94 y 6,17 x 4,5 0,94y 5,80 x 0,94y 1,3 x 1,3 0,94y y Representación: x 1,3 0,94 y 1,06x 1,38 b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy próximas. Con los datos obtenidos comprobamos que el coeficiente de correlación es: r 0,74 Ejercicio nº 9.Las notas de 10 alumnos y alumnas de una clase en Matemáticas y en Física han sido las siguientes: Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado para el coeficiente de correlación: 0,23; 0,94; 0,37; 0,94. Solución: Viendo la representación, observamos que el coeficiente de correlación es positivo y alto. Por tanto, r 0,94. Ejercicio nº 10.Se ha medido la potencia (en kW) y el consumo (litros/100 km) de 6 modelos distintos de coches, obteniéndose los siguientes resultados: Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución: Medias: 504 x 84 6 54,9 y 9,15 6 Desviaciones típicas: 43072 x 84 2 122,67 11,08 6 510,67 9,15 2 1,39 1,18 6 Covarianza: 4666,6 xy 84 9,15 9,17 xy 9,17 6 Coeficiente de correlación: 9,17 r 0,70 r 0,70 11,08 1,18 Hay una relación positiva y relativamente alta entre las variables. y Ejercicio nº 11.Se ha medido el peso, en kilogramos, y el volumen, en litros, de distintos tipos de maletas, obteniendo los resultados que se recogen en esta tabla: a) Halla la recta de regresión de Y sobre X. b) Calcula yˆ 120. ¿Es fiableesta estimación? (Sabemosque r 0,79). Solución: a) Medias: 590 98,33 6 40 y 6,67 6 x Varianza de X: 58166 x2 98,33 2 25,54 6 Covarianza: 3946,5 xy 98,33 6,67 1,89 6 Coeficiente de regresión: xy 1,89 myx 2 0,07 25 ,54 x Ecuación de la recta de regresión de Y sobre x: y 6,67 0,07 x 98,33 y 0,07 x 0,21 b) yˆ 120 0,07 120 0,21 8,19 Como x 120 está alejado del intervalo que estamos considerando, la estimación no es fiable. Ejercicio nº 12.Un grupo de seis atletas ha realizado pruebas de salto de longitud y de altura. Las dos se han puntuado en una escala de 0 a 5. Los resultados obtenidos han sido los siguientes: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 25 4,17 6 23 y 3,83 6 Desviaciones típicas: 107 x 4,17 2 0,44 0,67 6 x y 91 3,83 2 0,498 0,71 6 Covarianza: 98 xy 4,17 3,83 0,36 6 Coeficientes de regresión: 0,36 y sobre x myx 0,82 0,44 0,36 x sobre y mxy 0,72 0,498 Rectas de regresión: y sobre x y 3,83 0,82 x 4,17 x sobre y x 4,17 0,72 y 3,83 y 0,82x 0,41 x 0,72y 1,41 x 1,41 y 1,39x 1,96 0,72 Representación: y b) La correlación entre las dos variables no es demasiado fuerte, pues las dos rectas no están muy 0,36 próximas.Comprobamos que el coef iciente de correlación es: r 0,76 0,67 0,71 Ejercicio nº 13.Se han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos. Las siguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de ellas: Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las variables? Solución: Medias: 23 3,83 6 20 y 3,33 6 Desviaciones típicas: x 95 3,83 2 1,16 1,08 6 70 y 3,33 2 0,58 0,76 6 Covarianza: 77 xy 3,83 3,33 0,079 σ xy 0,079 6 Coeficiente de correlación: 0,079 r 0,096 r 0,096 1,08 0,76 La relación entre las variables es prácticamente nula. x Ejercicio nº 14.Se ha estudiado en distintas marcas de yogures naturales el porcentaje de grasa que contenían, así como las kilocalorías por envase. Estos son los resultados obtenidos en seis de ellos: a) Halla la recta de regresión de Y sobre X. b) Calcula yˆ 2, 5 e yˆ 10. ¿Son válidas estas estimaciones? (Sabemos que r 0,85). Solución: a) Medias: 14,2 2,37 6 373 y 62,17 6 x Varianza de X: 35,06 x2 2,37 2 0,23 6 Covarianza: 904,9 xy 2,37 62,17 3,47 6 Coeficiente de regresión: xy 3,47 myx 2 15,1 0,23 x Ecuación de la recta de regresión de Y sobre X: y 62,17 15,1 x 2,37 y 15,1x 26,38 b) yˆ 2, 5 15,1 2,5 26,38 64,13 kcal yˆ 10 15,1 10 26,38 177,38 kcal Como la correlación es alta, r 0,85, es razonable hacer estimaciones dentro del intervalo de datos. Para un porcentaje del 2,5 de grasa, las kilocalorías serán, aproximadamente, 64,13. Sin embargo, la segunda estimación no es válida porque x 10 está muy alejado del intervalo de datos que hemos considerado. Ejercicio nº 15.Se ha preguntado en seis familias por el número de hijos y el número medio de días que suelen ir al cine cada mes. Las respuestas han sido las siguientes: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 15 2,5 6 18 y 3 6 x Desviaciones típicas: 43 x 2,5 2 0,92 0,96 6 y 62 3 2 1,33 1,15 6 Covarianza: 44 xy 2,5 3 0,17 6 Coeficientes de regresión: 0,17 y sobre x myx 0,18 0,92 0,17 x sobre y m xy 0,13 1,33 Rectas de regresión: y sobre x y 3 0,18 x 2,5 y 0,18 x 3,45 x sobre y x 2,5 0,13 y 3 x 0,13y 2,89 0,13y 2,89 x y x 2,89 0,13 y 7,69x 22,23 Representación: b) La correlación es prácticamente nula; las rectas son casi perpendiculares. Ejercicio nº 16.En un reconocimiento médico a los niños de un colegio, se les ha pesado, en kilogramos, y se les ha medido, en centímetros. Aquí tienes los datos de los primeros seis niños: Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución: 2 yi 2 xi yi xi x iy i 120 25 14400 625 3000 110 30 12100 900 3300 140 35 19600 1225 4900 130 25 16900 625 3250 125 20 15625 400 2500 115 20 13225 400 2300 740 155 91850 4175 19250 Medias: 740 x 123,33 6 155 y 25,83 6 Desviaciones típicas: 91850 x 123,33 2 98,04 9,90 6 4175 25,83 2 28,64 5,35 6 Covarianza: 19250 xy 123,33 25,83 22,72 xy 22,72 6 Coeficiente de correlación: xy 22,72 r 0,43 r 0,43 x y 9,90 5,35 y La relación entre las variables es positiva, pero débil. Ejercicio nº 17.En distintos modelos de aspiradores se ha medido el peso, en kilogramos, y la capacidad útil de la bolsa, en litros, obteniendo los siguientes resultados: a) Halla la recta de regresión de Y sobre X. b) Calcula ŷ 6. ¿Es fiableesta estimación? (Sabemosque r 0,85). Solución: a) Medias: 37,7 6,28 6 15,5 y 2,58 6 x Varianza de X: x2 238,97 6,282 0,39 6 Covarianza: xy 100,35 6,28 2,58 0,52 6 Coeficiente de regresión: myx xy x2 0,52 1,33 0,39 Ecuación de la recta de regresión de Y sobre X: y 2,58 1,33 x 6,28 y 1,33 x 5,77 b) yˆ 6 1,33 6 5,77 2,21 Sí es fiable, puesto que la correlación es fuerte, r 0,85, y x 6 está dentro del intervalo de datos que estamos considerando. Para un peso de 6 kg la capacidad de la bolsa será, aproximadamente, de 2,21 litros.