EJERCICIOS DE ESTADÍSTICA BIDIMENSIONAL Ejercicio nº 1.En una empresa de televenta se ha anotado el plazo de entrega, en días, que anunciaban en los productos y el plazo real, también en días, de entrega de estos, obteniendo la siguiente tabla: Representa los datos mediante una nube de puntos e indica cuál de estos números te parece más apropiado para el coeficiente de correlación: 0,87; 0,2; 0,87; 0,2. Solución: Vemos que la relación entre las variables es ligeramente positiva, pero muy baja. Por tanto, r 0,2. Ejercicio nº 2.En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene (para el número 42) y su precio, en euros. La información obtenida se recoge en esta tabla: Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución: Medias: 3800 633,33 6 370 y 61,67 6 x Desviaciones típicas: x 2408.050 633,33 2 234,78 15,32 6 y 26000 61,67 2 530,14 23,02 6 Covarianza: xy 234650 633,33 61,67 50,87 xy 50,87 6 Coeficiente de correlación: r 50,87 0,14 r 0,14 15,32 23,02 La relación entre las variables es muy débil. Podemos decir que no están relacionadas. Ejercicio nº 3.Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La siguiente tabla nos da los seis primeros pares de datos obtenidos: a) Halla la recta de regresión de Y sobre X. b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación? (Sabemos que r 0,97). Solución: a) Medias: 81 13,5 6 394 y 65,67 6 x Varianza de X: x2 1211 13,52 19,58 6 Covarianza: xy 5986 13,5 65,67 111,12 6 Coeficiente de regresión: myx xy x2 111,12 5,68 19,58 Ecuación de la recta de regresión de Y sobre X: y 65,67 5,68 x 13,5 y 5,68 x 11,01 b) yˆ 12 5,68 12 11,01 yˆ 12 57,15 céntimosde euro Como la correlación es alta, r 0,97, y x 12 queda dentro del intervalo de valores que tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12 céntimos de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color. Ejercicio nº 4.En una academia para aprender a conducir se han estudiado las semanas de asistencia a clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que se apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 27 4,5 6 37 y 6,17 6 x Desviaciones típicas: x 151 4,5 2 4,92 2,22 6 y 247 6,17 2 3,1 1,76 6 Covarianza: xy 184 4,5 6,17 2,9 6 Coeficientes de regresión: 2,9 0,59 4,92 2,9 0,94 3,1 y sobre x myx x sobre y m xy Rectas de regresión: y sobre x y 6,17 0,59 x 4,5 y 0,59 x 3,52 x sobre y x 4,5 0,94 y 6,17 x 4,5 0,94y 5,80 x 0,94y 1,3 x 1,3 0,94y y x 1,3 0,94 y 1,06x 1,38 Representación: APROBADO xy sobre 10 yx sobre 8 6 4 2 2 4 6 8 10 ASISTENCIAS b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy próximas. Con los datos obtenidos comprobamos que el coeficiente de correlación es: r 0,74 Ejercicio nº 5.Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el número de horas que dedicaron a estudiar la semana antes del examen y la nota obtenida en la prueba. La información se recoge en la siguiente tabla: Representa los datos mediante una nube de puntos e indica cuál de estos valores te parece más apropiado para el coeficiente de correlación: 0,92; 0,44; 0,92; 0,44. Solución: Observando la representación, vemos que el coeficiente de correlación es positivo y bajo. Por tanto, r 0,44. Ejercicio nº 6.Se han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos. Las siguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de ellas: Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las variables? Solución: Medias: 23 3,83 6 20 y 3,33 6 x Desviaciones típicas: x y 95 3,83 2 1,16 1,08 6 70 3,33 2 0,58 0,76 6 Covarianza: xy 77 3,83 3,33 0,079 6 σ xy 0,079 Coeficiente de correlación: r 0,079 0,096 1,08 0,76 r 0,096 La relación entre las variables es prácticamente nula. Ejercicio nº 7.Se ha medido el peso, en kilogramos, y el volumen, en litros, de distintos tipos de maletas, obteniendo los resultados que se recogen en esta tabla: a) Halla la recta de regresión de Y sobre X. b) Calcula yˆ 120. ¿Es fiableesta estimación? (Sabemosque r 0,79). Solución: a) Medias: 590 98,33 6 40 y 6,67 6 x Varianza de X: x2 58166 98,33 2 25,54 6 Covarianza: xy 3946,5 98,33 6,67 1,89 6 Coeficiente de regresión: myx xy x2 1,89 0,07 25,54 Ecuación de la recta de regresión de Y sobre x: y 6,67 0,07 x 98,33 y 0,07 x 0,21 b) yˆ 120 0,07 120 0,21 8,19 Como x 120 está alejado del intervalo que estamos considerando, la estimación no es fiable. Ejercicio nº 8.Se ha preguntado en seis familias por el número de hijos y el número medio de días que suelen ir al cine cada mes. Las respuestas han sido las siguientes: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 15 2,5 6 18 y 3 6 x Desviaciones típicas: x 43 2,5 2 0,92 0,96 6 y 62 3 2 1,33 1,15 6 Covarianza: xy 44 2,5 3 0,17 6 Coeficientes de regresión: 0,17 0,18 0,92 0,17 0,13 1,33 y sobre x myx x sobre y m xy Rectas de regresión: y sobre x y 3 0,18 x 2,5 y 0,18 x 3,45 x sobre y x 2,5 0,13 y 3 x 0,13y 2,89 0,13y 2,89 x y x 2,89 0,13 y 7,69x 22,23 Representación: b) La correlación es prácticamente nula; las rectas son casi perpendiculares. Ejercicio nº 9.Considera la siguiente distribución: Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado para el coeficiente de correlación: 0,99; 0,4; 0,83; 0,4. Solución: Vemos que hay una relación positiva entre las variables, pero es baja. Por tanto, r 0,4. Ejercicio nº 10.Se ha realizado una encuesta preguntando por el número de personas que habitan el hogar familiar y el número de habitaciones que tiene la casa. La tabla siguiente recoge la información obtenida: Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución: Medias: 27 4,5 6 19 y 3,17 6 x Desviaciones típicas: x 127 4,5 2 0,92 0,96 6 y 63 3,17 2 0,45 0,67 6 Covarianza: xy 88 4,5 3,17 0,40 6 xy 0,40 Coeficiente de correlación: r 0,40 0,62 r 0,62 0,96 0,67 Hay una relación positiva, aunque no demasiado fuerte, entre las variables. Ejercicio nº 11.En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de 1º de bachillerato en Matemáticas y en Inglés, obteniéndose la información que se recoge en la siguiente tabla: a) Halla la recta de regresión de Y sobre X. b) Calcula ŷ 5, 5. ¿Es fiable esta estimación? (Sabemos que r 0,87). Solución: a) Medias: 37,2 6,2 6 35,5 y 5,92 6 x Varianza de X: x2 232,54 6,22 0,32 6 Covarianza: xy 223 6,2 5,92 0,46 6 Coeficiente de regresión: myx xy x2 0,46 1,44 0,32 Ecuación de la recta de regresión de Y sobre X: y 5,92 1,44 x 6,2 y 1,44 x 3 b) yˆ 5, 5 1,44 5,5 3 4,92 Sí es fiable la estimación, puesto que la correlación es fuerte, r 0,87, y x 5,5 está dentro del intervalo de valores que estamos considerando. Por tanto, estimamos que si la nota de Matemáticas es 5,5, la de Inglés será muy probablemente 4,9. Ejercicio nº 12.Un grupo de seis atletas ha realizado pruebas de salto de longitud y de altura. Las dos se han puntuado en una escala de 0 a 5. Los resultados obtenidos han sido los siguientes: a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las dos variables? Solución: a) Medias: 25 4,17 6 23 y 3,83 6 x Desviaciones típicas: x 107 4,17 2 0,44 0,67 6 y 91 3,83 2 0,498 0,71 6 Covarianza: xy 98 4,17 3,83 0,36 6 Coeficientes de regresión: y sobre x myx 0,36 0,82 0,44 x sobre y mxy 0,36 0,72 0,498 Rectas de regresión: y sobre x y 3,83 0,82 x 4,17 x sobre y x 4,17 0,72 y 3,83 y x 1,41 y 1,39x 1,96 0,72 Representación: y 0,82x 0,41 x 0,72y 1,41 b) La correlación entre las dos variables no es demasiado fuerte, pues las dos rectas no están muy 0,36 próximas.Comprobamos que el coef iciente de correlación es: r 0,76 0,67 0,71