EJERCICIOS PROPUESTOS - ANÁLISIS DE

Anuncio
EJERCICIOS PROPUESTOS - ANÁLISIS DE REGRESIÓN SIMPLE
0.
El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un patrón lineal. Se calculó una
recta de regresión mediante el método de mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a 9
años y el resultado fue: intercepto a=80 y pendiente b=6. La variable dependiente y es la altura en cm y x es la edad en
años.
) Interprete los valores estimados del intercepto y de la pendiente.
) Cuál será la altura predicha de una niña de 8 años.
) Cuál será la altura predicha de una mujer de 25 años. Comente el resultado.
0.
En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops Research, los datos
usados en la investigación son:
Duración
Rendimiento
92
1,7
92
2,3
96
1,9
100
2,0
102
1,5
102
1,7
106
1,6
106
1,8
121
1,0
143
0,3
Con x = la duración de la cosecha de porotos de soya en días, y = rendimiento de la cosecha en toneladas por hectárea.
)
)
)
)
Estime la recta de regresión mediante el método de mínimos cuadrados. Interprete los estimadores en el contexto de la
pregunta.
¿Existe una relación lineal significativa entre la duración y el rendimiento de la cosecha?
Verifique los supuestos.
Estime el rendimiento si la duración de la cosecha fue de 104 días.
Salida de SPSS para pregunta 2:
Estadísticos descriptivos
Rendimiento
DURACIÓN
Media
1.580
106.00
Desviación
típ.
.5633
15.470
N
10
10
Correlaciones
Duración
Rendimiento
Duración
Rendimiento
1
-.940**
.
.000
10
10
-.940**
1
.000
.
10
10
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
**. La correlación es significativa al nivel 0,01 (bilateral).
Coeficientesa
Modelo
1
(Constante)
DURACIÓN
Coeficientes no
estandarizados
B
Error típ.
5.207
.471
-.034
.004
Coeficientes
estandarizad
os
Beta
-.940
a. Variable dependiente: Rendimiento
Instituto de Matemática y Física – Universidad de Talca
estadistica@utalca.cl
t
11.047
-7.768
Sig.
.000
.000
2.5
.3
.2
2.0
.1
1.5
Unstandardized Residual
0.0
Rendimiento
1.0
.5
0.0
90
100
110
120
130
140
150
-.1
-.2
-.3
-.4
90
DURACIÓN
0.
100
110
120
130
140
150
DURACIÓN
Un investigador cree que la inteligencia de los niños, medida a través del coeficiente intelectual (CI en puntos),
depende del número de hermanos. Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los
resultados aparecen en la salida adjunta.
CI
Hermanos
)
)
)
)
110 115 120 118 110 108 105 104 98 99 98 100 90 93 90
0
1
1
1
2
2
2
3 3 4 4
5 5 5 6
Encuentre e interprete el coeficiente de correlación r.
Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto de la pregunta.
Verifique los supuestos de regresión.
¿Existe una relación lineal significativa entre el número de hermanos y el coeficiente intelectual?
Salida SPSS:
Correlaciones
Correlación de Pearson
Estadísticos descriptivos
CI
nhermanos
Media
103.87
3.00
Desviación
típ.
9.591
1.732
Sig. (unilateral)
N
15
15
N
CI
nhermanos
CI
nhermanos
CI
nhermanos
CI
1.000
-.929
.
.000
15
15
nhermanos
-.929
1.000
.000
.
15
15
Coeficientesa
Modelo
1
(Constante)
nhermanos
Coeficientes no
estandarizados
B
Error típ.
119.295
1.955
-5.143
.569
Coeficientes
estandarizad
os
Beta
-.929
a. Variable dependiente: CI
Instituto de Matemática y Física – Universidad de Talca
estadistica@utalca.cl
t
61.016
-9.036
Sig.
.000
.000
130
8
6
120
4
110
Unstandardized Residual
2
100
CI
90
80
0
1
2
3
4
5
6
7
0
-2
-4
-6
0
nhermanos
1
2
3
4
5
6
7
nhermanos
Unstandardized Residual Stem-and-Leaf Plot
Frequency
1.00
6.00
6.00
2.00
Stem
-0
-0
0
0
Stem width:
10.00000
0.
&
.
.
.
.
Leaf
5
001344
000013
56
Each leaf:
1 case(s)
Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas en lactantes desnutridos. Se realizan
20 determinaciones de ingestión y absorción cuyos resultados se muestran en la tabla que sigue.
INGESTION Y ABSORCION DE GRASAS EN 20 LACTANTES DESNUTRIDOS.
Caso Nº
Ingestión
Absorción
Caso Nº
Ingestión
Absorción
1
1,4
0,7
11
2,0
1,4
2
1,6
1,2
12
1,4
1,1
3
2,1
1,6
13
1,9
1,5
4
1,7
1,1
14
1,8
1,3
5
1,8
1,3
15
1,9
1,5
6
2,6
2,0
16
1,6
1,4
7
1,5
1,2
17
1,9
1,7
8
2,5
1,5
18
2,1
1,7
9
2,7
2,4
19
1,6
1,3
10
1,8
1,5
20
1,6
1,1
)
)
)
)
)
Estime a y b mediante el método de mínimos cuadrados. Interprete los coeficientes de regresión.
Encuentre e interprete el coeficiente de correlación r.
¿Existe una relación lineal significativa entre la ingestión y la absorción de grasas?
Verifique los supuestos
¿Cuánto vale la suma de los residuos calculados para las 20 determinaciones?
Conteste SI o NO a las siguientes preguntas:
)
)
)
El gráfico de residuos muestra que la relación entre la ingestión y la absorción de grasas es lineal
El gráfico de residuos se puede usar para determinar si los residuos están normalmente distribuidos.
El gráfico de residuos se puede usar para verificar el supuesto de homocedasticidad.
Instituto de Matemática y Física – Universidad de Talca
estadistica@utalca.cl
Correlaciones
Correlación de Pearson
Estadísticos descriptivos
Media
1.425
1.875
Absorción
Ingestión
Sig. (unilateral)
Desviación
típ.
.3611
.3740
N
20
20
N
Absorción
Ingestión
Absorción
Ingestión
Absorción
Ingestión
Absorción
1.000
.866
.
.000
20
20
Ingestión
.866
1.000
.000
.
20
20
Coeficientesa
Modelo
1
Coeficientes no
estandarizados
B
Error típ.
-.143
.217
.836
.114
(Constante)
Ingestión
Coeficientes
estandarizad
os
Beta
t
-.659
7.353
.866
Sig.
.518
.000
a. Variable dependiente: Absorción
2.5
.4
.2
2.0
-.0
Unstandardized Residual
1.5
Absorción
1.0
.5
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
-.2
-.4
-.6
1.2
Ingestión
1.4
1.6
Ingestión
Unstandardized Residual Stem-and-Leaf Plot
Frequency
Stem &
1.00 Extremes
1.00
-3 .
.00
-2 .
2.00
-1 .
5.00
-0 .
6.00
0 .
2.00
1 .
3.00
2 .
Stem width:
Leaf
(=<-.45)
2
27
13669
055788
03
058
.10000
Each leaf:
1 case(s)
Instituto de Matemática y Física – Universidad de Talca
estadistica@utalca.cl
1.8
2.0
2.2
2.4
2.6
2.8
5.
La tabla más abajo presenta los datos sobre el número de cambios de aceite al año (x) y el costo de la reparación (y, en
miles de pesos) de una muestra aleatoria de 10 autos de una cierta marca y modelo.
# cambios aceite
3
5
2
3
1
4 6
4
costo en miles de peso 150 150 250 200 350 200 50 125
)
)
)
)
)
)
)
Haga un gráfico de dispersión con los datos, verifique el supuesto de linealidad y valores extremos.
Encuentre la recta de regresión de mínimos cuadrados.
Interprete los valores estimados del intercepto y de la pendiente.
Estima cuál será el costo de reparación de un auto que ha tenido 4 cambios de aceite.
Si cambia x por y, obtendrá la misma recta de regresión?
Calcule el residuo para la primera observación (x=3, y=150).
Verifique los supuestos de la regresión lineal.
Salida SPSS:
Correlaciones
Correlación de Pearson
Estadísticos descriptivos
Media
368.75
3.50
Y
X
Sig. (unilateral)
Desviación
típ.
179.160
1.604
N
N
8
8
Y
1.000
-.907
.
.001
8
8
Y
X
Y
X
Y
X
X
-.907
1.000
.001
.
8
8
Coeficientesa
Modelo
1
(Constante)
X
Coeficientes no
estandarizados
B
Error típ.
723.611
72.964
-101.389
19.161
Coeficientes
estandarizad
os
Beta
t
9.917
-5.291
-.907
Sig.
.000
.002
a. Variable dependiente: Y
800
100
700
600
0
500
Unstandardized Residual
400
300
200
Y
100
0
0
X
1
2
3
4
5
6
7
-100
-200
0
1
X
Instituto de Matemática y Física – Universidad de Talca
estadistica@utalca.cl
2
3
4
5
6
7
Descargar