ESTADÍSTICA BIDIMENSIONAL 1.- Se considera la tabla estadística siguiente: X 2 4 3 5 Y 1 2 1 1 3 a) Calcule el valor de sabiendo que la media de X es 3. 2 4 3 5 Tenemos que la media se calcularía como x 3 14 15 1 5 b) Mediante la correspondiente recta de regresión lineal, haga una predicción del valor que se obtiene para Y cuando X=4.5. Halle el cuadrado del coeficiente de correlación entre X e Y y explique la fiabilidad de la predicción anterior. Construimos la tabla siguiente: X Y ni xini yini xi2ni 2 4 1 3 5 1 2 1 1 3 1 1 1 1 1 5 2 4 1 3 5 15 1 2 1 1 3 8 4 16 1 9 25 55 yi2ni xi yi ni 1 4 1 1 9 16 2 8 1 3 15 29 x 3, S X 2 1 Y por tanto y 1.6, S y 0.8 y con estos resultados r 0.8839 y por tanto, 2 0.8 S 1 XY entre las dos variables existe una relación estadística directa muy fuerte y tiene sentido calcular la recta de regresión para realizar las predicciones. Realizado este cálculo se obtiene que la recta de regresión de Y sobre X será y 0.5x 0.1 y para el caso de que x=4.5 se obtiene que y 2.35 . El cuadrado de r será r 2 0,78 , por lo que podremos decir que el 78% de la variabilidad de Y quedaría explicada por la variable X, lo cual da una alta fiabilidad. 2.- Se pasa un cuestionario a un grupo de 40 alumnos para medir su dominio del vocabulario (X) y su capacidad de razonamiento (Y). Con los resultados se han obtenido las siguientes cantidades: xi 1800, xi2 86000, yi 1390, yi2 53100, xi yi 66500 a) Halle la recta de regresión de Y sobre X. Realizamos todos los cálculos: x SX S XY xi 2 n xi yi n 2 x xy xi n yi 1390 1800 45 , y 34.75 , 40 n 40 2 2 86000 53100 yi 452 11,18 , SY y 34.752 10.95 40 n 40 66500 98.75 45 34.75 98.75 y por lo tanto r 0.8065 y se 40 11.18 10.95 trata, por tanto, de una relación estadística directa y fuerte siendo la recta de regresión de Y sobre X y 0.79 x 0.8 b) ¿Qué capacidad de razonamiento cabe esperar para un alumno que tiene una puntuación de 60 en dominio del vocabulario?. Basta sustituir en la ecuación calculada la x por el valor de 60, obteniéndose y 46.6 en capacidad de razonamiento. ESTADÍSTICA BIDIMENSIONAL 3.- La información estadística obtenida de una muestra de tamaño 6 sobre la relación existente entre el número de horas de estudio dedicado a la preparación de un examen y la puntuación obtenida en dicho examen, se refleja en la siguiente tabla: Horas de estudio (X) 15 20 25 32 18 34 Puntuación (Y) 50 60 70 92 70 84 a) Halle la ecuación de la recta de regresión de Y sobre X. Realizamos los cálculos reflejados en la siguiente tabla estadística X Y xini yini xi2ni yi2ni xi yi ni 15 20 25 32 18 34 50 60 70 92 70 84 15 20 25 32 18 34 144 50 60 70 92 70 84 426 225 400 625 1024 324 1156 3754 2500 3600 4900 8464 4900 7056 31420 x 24, S X 7.05 Y tenemos que y 71, SY 13.99 sería y 1.7987 x 27.83 750 1200 1750 2944 1260 2856 10760 S XY 89.33 y con estos datos la recta de regresión b) Obtenga el coeficiente de correlación lineal entre X e Y e interprétalo. r 89.33 0.906 , y la relación que existe entre las dos variables es estadística 7.05 13.99 directa y muy fuerte, es decir la nube de puntos está muy cerca de la recta de regresión y por lo tanto las predicciones serian muy fiables. 4.- La estatura y pesos de 10 jugadores de baloncesto de un equipo son: Estatura (X) 186 189 190 192 193 193 198 201 Pesos (Y) 85 85 86 90 87 91 93 103 203 100 205 101 a) Halla la recta de regresión de Y sobre X. X Y ni xini yini xi2ni 186 189 190 192 193 193 198 201 203 205 85 85 86 90 87 91 93 103 100 101 1 1 1 1 1 1 1 1 1 1 10 186 189 190 192 193 193 198 201 203 205 1950 85 85 86 90 87 91 93 103 100 101 921 34596 35721 36100 36864 37249 37249 39204 40401 41209 42025 380618 x 195, S X 6.066 Y con estos cálculos y 92.1, SY 6.564 y 1.0217 x 107.139 b) Halla el coeficiente de correlación. yi2ni xi yi ni 7225 7225 7396 8100 7569 8281 8649 10609 10000 10201 85255 15810 16065 16340 17280 16791 17563 18414 20703 20300 20705 179971 S XY 37.6 y la recta de regresión sería ESTADÍSTICA BIDIMENSIONAL El coeficiente de correlación lineal será r 37.6 0.944 , y la relación que existe 6.066 6.564 entre las dos variables es estadística directa y muy fuerte c) Si el equipo ficha a un jugador que mide 208 cm, ¿se puede predecir su peso? En caso afirmativo, obtenerlo. Basta sustituir en la ecuación calculada la x por el valor de 208, obteniéndose y 105.38 como peso en Kg estimado. Esta predicción es muy fiable ya que F 100 r 2 89.16 indica que el 86% de la variabilidad del peso queda explicada por la variable estatura. 5.- Las puntuaciones obtenidas por un grupo de alumnos de 2º Bachillerato en una batería de test que mide la habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes: X Y 20 30 [25, 35) [35, 45) [45, 55) [55, 65) 6 3 4 6 2 40 50 1 5 2 3 7 Se pide: a) ¿Existe correlación entre ambas variables? Aunque no es necesario, traslado esta tabla de doble entrada a una de simple entrada y realizo en ella los cálculos(también los podría haber realizado en esta tabla) Variable Variable X Y 25 25 35 35 35 45 45 45 55 55 35 35 45 45 45 55 55 55 65 65 Marca Marca de X de Y 20 30 20 30 40 30 40 50 40 50 30 30 40 40 40 50 50 50 60 60 20 30 20 30 40 30 40 50 40 50 ni xini yini xi2ni yi2ni xi yi ni 6 4 3 6 1 2 5 3 2 7 39 180 120 120 240 40 100 250 150 120 420 1740 120 120 60 180 40 60 200 150 80 350 1360 5400 3600 4800 9600 1600 5000 12500 7500 7200 25200 82400 2400 3600 1200 5400 1600 1800 8000 7500 3200 17500 52200 3600 3600 2400 7200 1600 3000 10000 7500 4800 21000 64700 x 44.615, S X 11.058 S XY 103.156 y el coeficiente de y 34.872, SY 11.064 103.156 correlación sería r 0.843 lo que nos muestra que existe relación 11.058 11.064 Y con estos cálculos estadística positiva o directa fuerte entre ambas variables. b) Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70 puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal? En este caso tendremos que calcular la recta de regresión de X sobre Y, ya que el dato conocido es de Y y el que queremos estimar es de X. Con los cálculos realizados tendremos que esta recta será: x x S XY 103.156 y y x 44.615 ( y 34.872) y 2 SY 122.42 simplificada x 0.843 x 15.23 y en el caso de y=70 tendremos que x 74,216 , resultado fiable (F=71%) aunque se pierde algo de fiabilidad ya que el valor que queremos estimar se encuentra fuera del rango de la variable.