Nombre: 1.- 1.5 La estatura y pesos de 10 jugadores de baloncesto de un equipo son: Estatura(X) 186 189 190 192 193 193 198 201 Pesos(Y) 85 85 86 90 87 91 93 103 a) Halla el coeficiente de correlación e interpretar su significado. Realizamos todos los cálculos: X Y ni xini yini xi2ni 186 189 190 192 193 193 198 201 203 205 85 85 86 90 87 91 93 103 100 101 1 1 1 1 1 1 1 1 1 1 10 186 189 190 192 193 193 198 201 203 205 1950 85 85 86 90 87 91 93 103 100 101 921 34596 35721 36100 36864 37249 37249 39204 40401 41209 42025 380618 203 100 205 101 yi2ni xi yi ni 7225 7225 7396 8100 7569 8281 8649 10609 10000 10201 85255 15810 16065 16340 17280 16791 17563 18414 20703 20300 20705 179971 Y con estos cálculos 1950 380618 195, S X 1952 6.066 x 10 10 y 921 92.1, S 85255 92.12 6.564 Y 10 10 coeficiente de correlación lineal será r S XY 179971 195 92.1 37.6 y el 10 37.6 0.944 , y la relación que existe 6.066 6.564 entre las dos variables es estadística directa y muy fuerte, es decir se puede predecir con mucha fiabilidad el peso de uno de los jugadores conociendo su estatura o viceversa. 1 b) Halla la recta de regresión de Y sobre X. La recta de regresión sería y 92.1 1.25 c) 37.6 ( x 195) y 1.0217 x 107.139 simplificando 6.0662 Si el equipo ficha a un jugador que mide 202 cm, ¿se puede estimar su peso? En caso afirmativo, obtenerlo. ¿Es fiable esta predicción? Basta sustituir en la ecuación calculada la x por el valor de 208, obteniéndose y 99.24Kg como peso en Kg estimado. Esta predicción es muy fiable ya que F 100 r 2 89.16 indica que el 86% de la variabilidad del peso queda explicada por la variable estatura y además el dato a predecir esta dentro del rango de los datos que tenemos. Nombre: 2.- 1 0.75 En una muestra de 64 familias se han estudiado dos variables estadísticas: X, número de miembros en edad laboral e Y número de ellos que trabajan. Los resultados se han recogido en la siguiente tabla: Y 1 2 3 X 1 6 0 0 2 10 2 0 3 12 5 1 4 16 8 4 a) Realiza un diagrama de dispersión. A la vista del diagrama y teniendo en cuenta el significado de las variables indica cual debe ser, aproximadamente, el coeficiente de correlación lineal y el tipo de relación que existe entre ellas. b) En el diagrama de dispersión se aprecia que los datos estan muy dispersos y que aunque exista relación estadística positiva, esta debe ser débil, es decir el coeficiente debe estar alrededor de 0,3 o 0,4. Obtener las distribuciones marginales de X e Y. Calcular la distribución de Y condicionada a que el número de miembros de la familia es mayor que 2. X 1 2 3 4 1.25 c) ni 6 12 18 28 N=64 Y 1 2 3 ni 44 15 5 N=64 Y/X>2 1 2 3 ni 28 13 5 N=46 Calcular las medias y desviaciones marginales, así como la covarianza. Realizados los cálculos de las sumas obtenemos que: 196 664 3,06, S X 3.062 0.998 x 64 64 y 89 1.39, S 149 1.392 0.628 Y 64 64 1 d) S XY 285 3.06 1.39 0.19434 64 Indica el tipo de dependencia que existe entre las dos variables utilizando el coeficiente de correlación lineal. El coeficiente de correlación sería r 0.19434 0.31 lo que nos muestra que existe 0.998 0.628 relación estadística positiva o directa débil entre ambas variables. 0.75 e) Si en una familia hay 5 miembros en edad laboral, ¿cuántos cabe esperar que trabajen?. la recta de regresión de Y sobre X sería y 0.1951 x 0.793137 y si x=5, el valor estimado de y=1,77. La fiabilidad de este cálculo es pequeña (9.62%) Nombre: 1.5 3.- Razonar cuáles pueden ser los coeficientes de correlación en cada diagrama de dispersión y explica el tipo de dependencia que existe en cada caso. A D B E C F En el gráfico A se trata de una relación entre dos variables inversa y fuerte, r debe ser aproximadamente -0.7 En el gráfico B se trata de un caso de independencia, por lo tanto r debe ser 0 aproximadamente. En el tercer caso, C), la dependencia estadística es directa y muy fuerte, por lo tanto el coeficiente de correlación lineal debe ser aproximadamente 0.9 En el caso D) el coeficiente de correlación debe ser aproximadamente -0.8 al tratarse de una dependencia estadística negativa o inversa y fuerte. En el caso E) el coeficiente de correlación debe ser aproximadamente 0.7 o 0.8 al tratarse de una dependencia estadística directa y fuerte. En este último caso la dependencia es más ébil que en las anteriores y negativa por lo que podría ser r=-0.5.