ni xini yini xi ni yi ni

Anuncio
ESTADÍSTICA BIDIMENSIONAL
1.-
Se considera la tabla estadística siguiente:
X
2
4
3
5

Y
1
2
1
1
3
a) Calcule el valor de  sabiendo que la media de X es 3.
2  4   3 5
Tenemos que la media se calcularía como x 
 3  14    15    1
5
b) Mediante la correspondiente recta de regresión lineal, haga una predicción del valor que
se obtiene para Y cuando X=4.5. Halle el cuadrado del coeficiente de correlación entre
X e Y y explique la fiabilidad de la predicción anterior.
Construimos la tabla siguiente:
X
Y
ni
xini
yini
xi2ni
2
4
1
3
5
1
2
1
1
3
1
1
1
1
1
5
2
4
1
3
5
15
1
2
1
1
3
8
4
16
1
9
25
55
yi2ni xi yi ni
1
4
1
1
9
16
2
8
1
3
15
29
 x  3, S X  2

1
Y por tanto  y  1.6, S y  0.8 y con estos resultados r 
 0.8839 y por tanto,
2  0.8

S 1
 XY
entre las dos variables existe una relación estadística directa muy fuerte y tiene sentido
calcular la recta de regresión para realizar las predicciones. Realizado este cálculo se
obtiene que la recta de regresión de Y sobre X será y  0.5x  0.1 y para el caso de que
x=4.5 se obtiene que y  2.35 .
El cuadrado de r será r 2  0,78 , por lo que podremos decir que el 78% de la
variabilidad de Y quedaría explicada por la variable X, lo cual da una alta fiabilidad.
2.-
Se pasa un cuestionario a un grupo de 40 alumnos para medir su dominio del vocabulario
(X) y su capacidad de razonamiento (Y). Con los resultados se han obtenido las
siguientes cantidades:  xi  1800,  xi2  86000,  yi  1390,  yi2  53100,  xi yi  66500
a) Halle la recta de regresión de Y sobre X.
Realizamos todos los cálculos: x 
SX 
S XY 
 xi
2
n
 xi yi
n
2
x 
 xy 
 xi
n

 yi 1390
1800
 45 , y 

 34.75 ,
40
n
40
2
2
86000
53100
 yi
 452  11,18 , SY 
y 
 34.752  10.95
40
n
40
66500
98.75
 45  34.75  98.75 y por lo tanto r 
 0.8065 y se
40
11.18 10.95
trata, por tanto, de una relación estadística directa y fuerte siendo la recta de regresión
de Y sobre X y  0.79 x  0.8
b) ¿Qué capacidad de razonamiento cabe esperar para un alumno que tiene una puntuación
de 60 en dominio del vocabulario?.
Basta sustituir en la ecuación calculada la x por el valor de 60, obteniéndose y  46.6 en
capacidad de razonamiento.
ESTADÍSTICA BIDIMENSIONAL
3.-
La información estadística obtenida de una muestra de tamaño 6 sobre la relación
existente entre el número de horas de estudio dedicado a la preparación de un examen y
la puntuación obtenida en dicho examen, se refleja en la siguiente tabla:
Horas de estudio (X)
15
20
25
32
18
34
Puntuación (Y)
50
60
70
92
70
84
a) Halle la ecuación de la recta de regresión de Y sobre X.
Realizamos los cálculos reflejados en la siguiente tabla estadística
X
Y
xini
yini
xi2ni
yi2ni xi yi ni
15
20
25
32
18
34
50
60
70
92
70
84
15
20
25
32
18
34
144
50
60
70
92
70
84
426
225
400
625
1024
324
1156
3754
2500
3600
4900
8464
4900
7056
31420

 x  24, S X  7.05
Y tenemos que 

 y  71, SY  13.99
sería y  1.7987  x  27.83
750
1200
1750
2944
1260
2856
10760
S XY  89.33 y con estos datos la recta de regresión
b) Obtenga el coeficiente de correlación lineal entre X e Y e interprétalo.
r
89.33
 0.906 , y la relación que existe entre las dos variables es estadística
7.05 13.99
directa y muy fuerte, es decir la nube de puntos está muy cerca de la recta de regresión
y por lo tanto las predicciones serian muy fiables.
4.-
La estatura y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X) 186 189 190 192 193 193 198 201
Pesos (Y)
85
85
86
90
87
91
93
103
203
100
205
101
a) Halla la recta de regresión de Y sobre X.
X
Y
ni
xini
yini
xi2ni
186
189
190
192
193
193
198
201
203
205
85
85
86
90
87
91
93
103
100
101
1
1
1
1
1
1
1
1
1
1
10
186
189
190
192
193
193
198
201
203
205
1950
85
85
86
90
87
91
93
103
100
101
921
34596
35721
36100
36864
37249
37249
39204
40401
41209
42025
380618

 x  195, S X  6.066
Y con estos cálculos 

 y  92.1, SY  6.564
y  1.0217  x  107.139
b) Halla el coeficiente de correlación.
yi2ni xi yi ni
7225
7225
7396
8100
7569
8281
8649
10609
10000
10201
85255
15810
16065
16340
17280
16791
17563
18414
20703
20300
20705
179971
S XY  37.6 y la recta de regresión sería
ESTADÍSTICA BIDIMENSIONAL
El coeficiente de correlación lineal será r 
37.6
 0.944 , y la relación que existe
6.066  6.564
entre las dos variables es estadística directa y muy fuerte
c) Si el equipo ficha a un jugador que mide 208 cm, ¿se puede predecir su peso? En caso
afirmativo, obtenerlo.
Basta sustituir en la ecuación calculada la x por el valor de 208, obteniéndose y  105.38
como peso en Kg estimado. Esta predicción es muy fiable ya que F  100  r 2  89.16
indica que el 86% de la variabilidad del peso queda explicada por la variable estatura.
5.-
Las puntuaciones obtenidas por un grupo de alumnos de 2º Bachillerato en una batería de
test que mide la habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:
X
Y
20
30
[25, 35)
[35, 45)
[45, 55)
[55, 65)
6
3
4
6
2
40
50
1
5
2
3
7
Se pide:
a) ¿Existe correlación entre ambas variables?
Aunque no es necesario, traslado esta tabla de doble entrada a una de simple entrada y
realizo en ella los cálculos(también los podría haber realizado en esta tabla)
Variable Variable
X
Y
25
25
35
35
35
45
45
45
55
55
35
35
45
45
45
55
55
55
65
65
Marca Marca
de X de Y
20
30
20
30
40
30
40
50
40
50
30
30
40
40
40
50
50
50
60
60
20
30
20
30
40
30
40
50
40
50
ni
xini
yini
xi2ni
yi2ni xi yi ni
6
4
3
6
1
2
5
3
2
7
39
180
120
120
240
40
100
250
150
120
420
1740
120
120
60
180
40
60
200
150
80
350
1360
5400
3600
4800
9600
1600
5000
12500
7500
7200
25200
82400
2400
3600
1200
5400
1600
1800
8000
7500
3200
17500
52200
3600
3600
2400
7200
1600
3000
10000
7500
4800
21000
64700
 x  44.615, S X  11.058

S XY  103.156 y el coeficiente de

 y  34.872, SY  11.064
103.156
correlación sería r 
 0.843 lo que nos muestra que existe relación
11.058 11.064
Y con estos cálculos 
estadística positiva o directa fuerte entre ambas variables.
b) Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70
puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?
En este caso tendremos que calcular la recta de regresión de X sobre Y, ya que el dato
conocido es de Y y el que queremos estimar es de X. Con los cálculos realizados
tendremos que esta recta será: x  x 


S XY
103.156
y  y  x  44.615 
( y  34.872) y
2
SY
122.42
simplificada x  0.843  x  15.23 y en el caso de y=70 tendremos que x  74,216 ,
resultado fiable (F=71%) aunque se pierde algo de fiabilidad ya que el valor que
queremos estimar se encuentra fuera del rango de la variable.
Descargar