ejercicios de estadística bidimensional

Anuncio
EJERCICIOS DE ESTADÍSTICA BIDIMENSIONAL
Ejercicio nº 1.En una empresa de televenta se ha anotado el plazo de entrega, en días, que anunciaban
en los productos y el plazo real, también en días, de entrega de estos, obteniendo la
siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos números te
parece más apropiado para el coeficiente de correlación: 0,87; 0,2; 0,87; 0,2.
Solución:
Vemos que la relación entre las variables es ligeramente positiva, pero muy baja. Por tanto,
r  0,2.
Ejercicio nº 2.En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene
(para el número 42) y su precio, en euros. La información obtenida se recoge en esta
tabla:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos
variables?
Solución:
 Medias:
3800
 633,33
6
370
y 
 61,67
6
x 
 Desviaciones típicas:
x 
2408.050
 633,33 2  234,78  15,32
6
y 
26000
 61,67 2  530,14  23,02
6
 Covarianza:
 xy 
234650
 633,33  61,67  50,87   xy  50,87
6
 Coeficiente de correlación:
r 
50,87
 0,14  r  0,14
15,32  23,02
 La relación entre las variables es muy débil. Podemos decir que no están relacionadas.
Ejercicio nº 3.Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en
céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La
siguiente tabla nos da los seis primeros pares de datos obtenidos:
a) Halla la recta de regresión de Y sobre X.
b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el
coste por página en blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la
estimación? (Sabemos que r  0,97).
Solución:
a)
 Medias:
81
 13,5
6
394
y 
 65,67
6
x
 Varianza de X:
 x2 
1211
 13,52  19,58
6
 Covarianza:
 xy 
5986
 13,5  65,67  111,12
6
 Coeficiente de regresión:
myx 
 xy
 x2

111,12
 5,68
19,58
 Ecuación de la recta de regresión de Y sobre X:
y  65,67  5,68 x  13,5 
y  5,68 x  11,01
b) yˆ  12  5,68  12  11,01  yˆ  12  57,15 céntimosde euro
Como la correlación es alta, r  0,97, y x  12 queda dentro del intervalo de valores que
tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12
céntimos de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color.
Ejercicio nº 4.En una academia para aprender a conducir se han estudiado las semanas de asistencia a
clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que
se apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
27
 4,5
6
37
y 
 6,17
6
x
 Desviaciones típicas:
x 
151
 4,5 2  4,92  2,22
6
y 
247
 6,17 2  3,1  1,76
6
 Covarianza:
 xy 
184
 4,5  6,17  2,9
6
 Coeficientes de regresión:
2,9
 0,59
4,92
2,9

 0,94
3,1
y sobre x  myx 
x sobre y  m xy
 Rectas de regresión:
y sobre x 
y  6,17  0,59 x  4,5  y  0,59 x  3,52
x sobre y 
x  4,5  0,94 y  6,17
x  4,5  0,94y  5,80
x  0,94y  1,3
x  1,3  0,94y
y 
x  1,3
0,94
 y  1,06x  1,38
 Representación:
APROBADO
xy sobre
10
yx sobre
8
6
4
2
2
4
6
8
10
ASISTENCIAS
b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy
próximas. Con los datos obtenidos comprobamos que el coeficiente de correlación es: r 
0,74
Ejercicio nº 5.Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el
número de horas que dedicaron a estudiar la semana antes del examen y la nota
obtenida en la prueba. La información se recoge en la siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos valores te
parece más apropiado para el coeficiente de correlación: 0,92; 0,44; 0,92; 0,44.
Solución:
Observando la representación, vemos que el coeficiente de correlación es positivo y bajo. Por
tanto, r  0,44.
Ejercicio nº 6.Se han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos.
Las siguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de
ellas:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las
variables?
Solución:
 Medias:
23
 3,83
6
20
y
 3,33
6
x
 Desviaciones típicas:
x 
y 
95
 3,83 2  1,16  1,08
6
70
 3,33 2  0,58  0,76
6
 Covarianza:
 xy 
77
 3,83  3,33  0,079
6
 σ xy  0,079
 Coeficiente de correlación:
r
0,079
 0,096
1,08  0,76
 r  0,096
 La relación entre las variables es prácticamente nula.
Ejercicio nº 7.Se ha medido el peso, en kilogramos, y el volumen, en litros, de distintos tipos de
maletas, obteniendo los resultados que se recogen en esta tabla:
a) Halla la recta de regresión de Y sobre X.
b) Calcula yˆ  120. ¿Es fiableesta estimación? (Sabemosque r  0,79).
Solución:
a)
 Medias:
590
 98,33
6
40
y 
 6,67
6
x
 Varianza de X:
 x2 
58166
 98,33 2  25,54
6
 Covarianza:
 xy 
3946,5
 98,33  6,67  1,89
6
 Coeficiente de regresión:
myx 
 xy
 x2

1,89
 0,07
25,54
 Ecuación de la recta de regresión de Y sobre x:
y  6,67  0,07 x  98,33  y  0,07 x  0,21
b) yˆ  120  0,07  120  0,21  8,19
Como x  120 está alejado del intervalo que estamos considerando, la estimación no es fiable.
Ejercicio nº 8.Se ha preguntado en seis familias por el número de hijos y el número medio de días que
suelen ir al cine cada mes. Las respuestas han sido las siguientes:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
15
 2,5
6
18
y
3
6
x
 Desviaciones típicas:
x 
43
 2,5 2  0,92  0,96
6
y 
62
 3 2  1,33  1,15
6
 Covarianza:
 xy 
44
 2,5  3  0,17
6
 Coeficientes de regresión:
0,17
 0,18
0,92
0,17

 0,13
1,33
y sobre x  myx 
x sobre y  m xy
 Rectas de regresión:
y sobre x 
y  3  0,18 x  2,5  y  0,18 x  3,45
x sobre y 
x  2,5  0,13 y  3
x  0,13y  2,89
0,13y  2,89  x
y
x  2,89
0,13
 y  7,69x  22,23
 Representación:
b) La correlación es prácticamente nula; las rectas son casi perpendiculares.
Ejercicio nº 9.Considera la siguiente distribución:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece
más apropiado para el coeficiente de correlación: 0,99; 0,4; 0,83; 0,4.
Solución:
Vemos que hay una relación positiva entre las variables, pero es baja. Por tanto,
r  0,4.
Ejercicio nº 10.Se ha realizado una encuesta preguntando por el número de personas que habitan el
hogar familiar y el número de habitaciones que tiene la casa. La tabla siguiente recoge la
información obtenida:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos
variables?
Solución:
 Medias:
27
 4,5
6
19
y 
 3,17
6
x
 Desviaciones típicas:
x 
127
 4,5 2  0,92  0,96
6
y 
63
 3,17 2  0,45  0,67
6
 Covarianza:
 xy 
88
 4,5  3,17  0,40
6
  xy  0,40
 Coeficiente de correlación:
r 
0,40
 0,62  r  0,62
0,96  0,67
 Hay una relación positiva, aunque no demasiado fuerte, entre las variables.
Ejercicio nº 11.En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de
1º de bachillerato en Matemáticas y en Inglés, obteniéndose la información que se
recoge en la siguiente tabla:
a) Halla la recta de regresión de Y sobre X.
b) Calcula ŷ  5, 5. ¿Es fiable esta estimación? (Sabemos que r  0,87).
Solución:
a)
 Medias:
37,2
 6,2
6
35,5
y 
 5,92
6
x
 Varianza de X:
 x2 
232,54
 6,22  0,32
6
 Covarianza:
 xy 
223
 6,2  5,92  0,46
6
 Coeficiente de regresión:
myx 
 xy
 x2

0,46
 1,44
0,32
 Ecuación de la recta de regresión de Y sobre X:
y  5,92  1,44 x  6,2  y  1,44 x  3
b) yˆ  5, 5  1,44  5,5  3  4,92
Sí es fiable la estimación, puesto que la correlación es fuerte, r  0,87, y x  5,5 está dentro
del intervalo de valores que estamos considerando. Por tanto, estimamos que si la nota de
Matemáticas es 5,5, la de Inglés será muy probablemente 4,9.
Ejercicio nº 12.Un grupo de seis atletas ha realizado pruebas de salto de longitud y de altura. Las dos se
han puntuado en una escala de 0 a 5. Los resultados obtenidos han sido los siguientes:
a) Halla las dos rectas de regresión y represéntalas.
b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la
correlación entre las dos variables?
Solución:
a)
 Medias:
25
 4,17
6
23
y
 3,83
6
x
 Desviaciones típicas:
x 
107
 4,17 2  0,44  0,67
6
y 
91
 3,83 2  0,498  0,71
6
 Covarianza:
 xy 
98
 4,17  3,83  0,36
6
 Coeficientes de regresión:
y sobre x  myx 
0,36
 0,82
0,44
x sobre y  mxy 
0,36
 0,72
0,498
 Rectas de regresión:
y sobre x 
y  3,83  0,82 x  4,17 
x sobre y 
x  4,17  0,72 y  3,83 
y
x  1,41
 y  1,39x  1,96
0,72
 Representación:
y  0,82x  0,41
x  0,72y  1,41
b) La correlación entre las dos variables no es demasiado fuerte, pues las dos rectas no están
muy
0,36
próximas.Comprobamos que el coef iciente de correlación es: r 
 0,76
0,67  0,71
Descargar