ejercicios distribuciones bidimensionales

Anuncio
SOLUCIONES
EJERCICIOS DISTRIBUCIONES BIDIMENSIONALES
Ejercicio nº 1.Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el número de
horas que dedicaron a estudiar la semana antes del examen y la nota obtenida en la prueba.
La información se recoge en la siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos valores te parece
más apropiado para el coeficiente de correlación: 0,92; 0,44; 0,92; 0,44.
Solución:
Observando la representación, vemos que el coeficiente de correlación es positivo y bajo. Por
tanto, r  0,44.
Ejercicio nº 2.Se ha realizado una encuesta preguntando por el número de personas que habitan el hogar
familiar y el número de habitaciones que tiene la casa. La tabla siguiente recoge la
información obtenida:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos
variables?
Solución:
 Medias:
27
x
 4,5
6
19
y 
 3,17
6
 Desviaciones típicas:
127
x 
 4,5 2  0,92  0,96
6
y 
63
 3,17 2  0,45  0,67
6
 Covarianza:
88
 xy 
 4,5  3,17  0,40
6
  xy  0,40
 Coeficiente de correlación:
0,40
r 
 0,62  r  0,62
0,96  0,67
 Hay una relación positiva, aunque no demasiado fuerte, entre las variables.
Ejercicio nº 3.Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en
céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La
siguiente tabla nos da los seis primeros pares de datos obtenidos:
a) Halla la recta de regresión de Y sobre X.
b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste
por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación?
(Sabemos que r  0,97).
Solución:
a)
 Medias:
81
 13,5
6
394
y 
 65,67
6
x
 Varianza de X:
1211
 x2 
 13,52  19,58
6
 Covarianza:
5986
 xy 
 13,5  65,67  111,12
6
 Coeficiente de regresión:
 xy 111,12
myx  2 
 5,68
19,58
x
 Ecuación de la recta de regresión de Y sobre X:
y  65,67  5,68 x  13,5  y  5,68 x  11,01
b) yˆ  12  5,68  12  11,01  yˆ  12  57,15 céntimosde euro
Como la correlación es alta, r  0,97, y x  12 queda dentro del intervalo de valores que
tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12 céntimos
de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color.
Ejercicio nº 4.La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene
recogida en la siguiente tabla:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
990
 165
6
1065
y 
 177,5
6
 Desviaciones típicas:
163900
x 
 165 2  91,67  9,57
6
x
y 
189175
 177,5 2  22,92  4,79
6
 Covarianza:
175900
 xy 
 165  177,5  29,17
6
 Coeficientes de regresión:
29,17
y sobre x  myx 
 0,32
91,67
29,17
x sobre y  mxy 
 1,27
22,92
 Rectas de regresión:
y sobre x  y  177,5  0,32 x  165  y  0,32x  124,7
x sobre y 
x  165  1,27 y  177,5
x  1,27y  60,43
y
 Representación:
x  60,43
1,27
 y  0,79x  47,58
b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy
29,17
próximas.Comprobamos que el coef iciente de correlación es: r 
 0,636
9,57  4,79
Ejercicio nº 5.Se ha medido el número medio de horas de entrenamiento a la semana de un grupo de 10
atletas y el tiempo, en minutos, que han hecho en una carrera, obteniendo los siguientes
resultados:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más
apropiado para el coeficiente de correlación: 0,71; 0,71; 0,45; 0,32.
Solución:
A la vista de la representación, observamos que el coeficiente de correlación, r, es negativo y
relativamente alto. Por tanto, r  0,71.
Ejercicio nº 6.En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene
(para el número 42) y su precio, en euros. La información obtenida se recoge en esta tabla:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos
variables?
Solución:
 Medias:
3800
x 
 633,33
6
370
y 
 61,67
6
 Desviaciones típicas:
2408.050
x 
 633,33 2  234,78  15,32
6
26000
 61,67 2  530,14  23,02
6
 Covarianza:
234650
 xy 
 633,33  61,67  50,87   xy  50,87
6
 Coeficiente de correlación:
50,87
r 
 0,14  r  0,14
15,32  23,02
 La relación entre las variables es muy débil. Podemos decir que no están relacionadas.
y 
Ejercicio nº 7.En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de 1º
de bachillerato en Matemáticas y en Inglés, obteniéndose la información que se recoge en la
siguiente tabla:
a) Halla la recta de regresión de Y sobre X.
b) Calcula ŷ  5, 5. ¿Es fiable esta estimación? (Sabemos que r  0,87).
Solución:
a)
 Medias:
37,2
 6,2
6
35,5
y 
 5,92
6
 Varianza de X:+
232,54
 x2 
 6,22  0,32
6
 Covarianza:
223
 xy 
 6,2  5,92  0,46
6
 Coeficiente de regresión:
 xy 0,46
myx  2 
 1,44
0,32
x
x
 Ecuación de la recta de regresión de Y sobre X:
y  5,92  1,44 x  6,2  y  1,44 x  3
b) yˆ  5, 5  1,44  5,5  3  4,92
Sí es fiable la estimación, puesto que la correlación es fuerte, r  0,87, y x  5,5 está dentro del
intervalo de valores que estamos considerando. Por tanto, estimamos que si la nota de Matemáticas
es 5,5, la de Inglés será muy probablemente 4,9.
Ejercicio nº 8.En una academia para aprender a conducir se han estudiado las semanas de asistencia a
clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que se
apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
27
 4,5
6
37
y 
 6,17
6
 Desviaciones típicas:
151
x 
 4,5 2  4,92  2,22
6
x
y 
247
 6,17 2  3,1  1,76
6
 Covarianza:
184
 xy 
 4,5  6,17  2,9
6
 Coeficientes de regresión:
2,9
y sobre x  myx 
 0,59
4,92
2,9
x sobre y  m xy 
 0,94
3,1
 Rectas de regresión:
y sobre x  y  6,17  0,59 x  4,5  y  0,59 x  3,52
x sobre y 
x  4,5  0,94 y  6,17
x  4,5  0,94y  5,80
x  0,94y  1,3
x  1,3  0,94y
y 
 Representación:
x  1,3
0,94
 y  1,06x  1,38
b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy
próximas. Con los datos obtenidos comprobamos que el coeficiente de correlación es: r  0,74
Ejercicio nº 9.Las notas de 10 alumnos y alumnas de una clase en Matemáticas y en Física han sido las
siguientes:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más
apropiado para el coeficiente de correlación: 0,23; 0,94; 0,37; 0,94.
Solución:
Viendo la representación, observamos que el coeficiente de correlación es positivo y alto. Por
tanto, r  0,94.
Ejercicio nº 10.Se ha medido la potencia (en kW) y el consumo (litros/100 km) de 6 modelos distintos de
coches, obteniéndose los siguientes resultados:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos
variables?
Solución:
 Medias:
504
x 
 84
6
54,9
y 
 9,15
6
 Desviaciones típicas:
43072
x 
 84 2  122,67  11,08
6
510,67
 9,15 2  1,39  1,18
6
 Covarianza:
4666,6
 xy 
 84  9,15  9,17   xy  9,17
6
 Coeficiente de correlación:
9,17
r 
 0,70  r  0,70
11,08  1,18
 Hay una relación positiva y relativamente alta entre las variables.
y 
Ejercicio nº 11.Se ha medido el peso, en kilogramos, y el volumen, en litros, de distintos tipos de maletas,
obteniendo los resultados que se recogen en esta tabla:
a) Halla la recta de regresión de Y sobre X.
b) Calcula yˆ  120. ¿Es fiableesta estimación? (Sabemosque r  0,79).
Solución:
a)
 Medias:
590
 98,33
6
40
y 
 6,67
6
x
 Varianza de X:
58166
 x2 
 98,33 2  25,54
6
 Covarianza:
3946,5
 xy 
 98,33  6,67  1,89
6
 Coeficiente de regresión:
 xy
1,89
myx  2 
 0,07
25
,54
x
 Ecuación de la recta de regresión de Y sobre x:
y  6,67  0,07 x  98,33  y  0,07 x  0,21
b) yˆ  120  0,07  120  0,21  8,19
Como x  120 está alejado del intervalo que estamos considerando, la estimación no es fiable.
Ejercicio nº 12.Un grupo de seis atletas ha realizado pruebas de salto de longitud y de altura. Las dos se
han puntuado en una escala de 0 a 5. Los resultados obtenidos han sido los siguientes:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
25
 4,17
6
23
y
 3,83
6
 Desviaciones típicas:
107
x 
 4,17 2  0,44  0,67
6
x
y 
91
 3,83 2  0,498  0,71
6
 Covarianza:
98
 xy 
 4,17  3,83  0,36
6
 Coeficientes de regresión:
0,36
y sobre x  myx 
 0,82
0,44
0,36
x sobre y  mxy 
 0,72
0,498
 Rectas de regresión:
y sobre x  y  3,83  0,82 x  4,17 
x sobre y 
x  4,17  0,72 y  3,83 
y  0,82x  0,41
x  0,72y  1,41
x  1,41
 y  1,39x  1,96
0,72
 Representación:
y
b) La correlación entre las dos variables no es demasiado fuerte, pues las dos rectas no están muy
0,36
próximas.Comprobamos que el coef iciente de correlación es: r 
 0,76
0,67  0,71
Ejercicio nº 13.Se han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos. Las
siguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de ellas:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las
variables?
Solución:
 Medias:
23
 3,83
6
20
y
 3,33
6
 Desviaciones típicas:
x
95
 3,83 2  1,16  1,08
6
70
y 
 3,33 2  0,58  0,76
6
 Covarianza:
77
 xy 
 3,83  3,33  0,079  σ xy  0,079
6
 Coeficiente de correlación:
0,079
r
 0,096  r  0,096
1,08  0,76
 La relación entre las variables es prácticamente nula.
x 
Ejercicio nº 14.Se ha estudiado en distintas marcas de yogures naturales el porcentaje de grasa que
contenían, así como las kilocalorías por envase. Estos son los resultados obtenidos en seis
de ellos:
a) Halla la recta de regresión de Y sobre X.
b) Calcula yˆ  2, 5 e yˆ  10. ¿Son válidas estas estimaciones? (Sabemos que r  0,85).
Solución:
a)
 Medias:
14,2
 2,37
6
373
y 
 62,17
6
x 
 Varianza de X:
35,06
 x2 
 2,37 2  0,23
6
 Covarianza:
904,9
 xy 
 2,37  62,17  3,47
6
 Coeficiente de regresión:
 xy 3,47
myx  2 
 15,1
0,23
x
 Ecuación de la recta de regresión de Y sobre X:
y  62,17  15,1 x  2,37  y  15,1x  26,38
b) yˆ  2, 5  15,1  2,5  26,38  64,13 kcal
yˆ  10  15,1 10  26,38  177,38 kcal
Como la correlación es alta, r  0,85, es razonable hacer estimaciones dentro del intervalo de
datos. Para un porcentaje del 2,5 de grasa, las kilocalorías serán, aproximadamente, 64,13. Sin
embargo, la segunda estimación no es válida porque x  10 está muy alejado del intervalo de
datos que hemos considerado.
Ejercicio nº 15.Se ha preguntado en seis familias por el número de hijos y el número medio de días que
suelen ir al cine cada mes. Las respuestas han sido las siguientes:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
15
 2,5
6
18
y
3
6
x
 Desviaciones típicas:
43
x 
 2,5 2  0,92  0,96
6
y 
62
 3 2  1,33  1,15
6
 Covarianza:
44
 xy 
 2,5  3  0,17
6
 Coeficientes de regresión:
0,17
y sobre x  myx 
 0,18
0,92
0,17
x sobre y  m xy 
 0,13
1,33
 Rectas de regresión:
y sobre x  y  3  0,18 x  2,5  y  0,18 x  3,45
x sobre y 
x  2,5  0,13 y  3
x  0,13y  2,89
0,13y  2,89  x
y
x  2,89
0,13
 y  7,69x  22,23
 Representación:
b) La correlación es prácticamente nula; las rectas son casi perpendiculares.
Ejercicio nº 16.En un reconocimiento médico a los niños de un colegio, se les ha pesado, en kilogramos, y
se les ha medido, en centímetros. Aquí tienes los datos de los primeros seis niños:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos
variables?
Solución:
2
yi
2
xi
yi
xi
x iy i
120
25
14400
625
3000
110
30
12100
900
3300
140
35
19600
1225
4900
130
25
16900
625
3250
125
20
15625
400
2500
115
20
13225
400
2300
740
155
91850
4175
19250
 Medias:
740
x
 123,33
6
155
y 
 25,83
6
 Desviaciones típicas:
91850
x 
 123,33 2  98,04  9,90
6
4175
 25,83 2  28,64  5,35
6
 Covarianza:
19250
 xy 
 123,33  25,83  22,72   xy  22,72
6
 Coeficiente de correlación:
 xy
22,72
r 

 0,43  r  0,43
 x y
9,90  5,35
y 
 La relación entre las variables es positiva, pero débil.
Ejercicio nº 17.En distintos modelos de aspiradores se ha medido el peso, en kilogramos, y la capacidad útil
de la bolsa, en litros, obteniendo los siguientes resultados:
a) Halla la recta de regresión de Y sobre X.
b) Calcula ŷ  6. ¿Es fiableesta estimación? (Sabemosque r  0,85).
Solución:
a)
 Medias:
37,7
 6,28
6
15,5
y 
 2,58
6
x
 Varianza de X:
 x2 
238,97
 6,282  0,39
6
 Covarianza:
 xy 
100,35
 6,28  2,58  0,52
6
 Coeficiente de regresión:
myx 
 xy
 x2

0,52
 1,33
0,39
 Ecuación de la recta de regresión de Y sobre X:
y  2,58  1,33 x  6,28  y  1,33 x  5,77
b) yˆ  6  1,33  6  5,77  2,21
Sí es fiable, puesto que la correlación es fuerte, r  0,85, y x  6 está dentro del intervalo de
datos que estamos considerando. Para un peso de 6 kg la capacidad de la bolsa será,
aproximadamente, de 2,21 litros.
Descargar