EJERCICIOS PROPUESTOS - ANÁLISIS DE REGRESIÓN SIMPLE 0. El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un patrón lineal. Se calculó una recta de regresión mediante el método de mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a 9 años y el resultado fue: intercepto a=80 y pendiente b=6. La variable dependiente y es la altura en cm y x es la edad en años. ) Interprete los valores estimados del intercepto y de la pendiente. ) Cuál será la altura predicha de una niña de 8 años. ) Cuál será la altura predicha de una mujer de 25 años. Comente el resultado. 0. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops Research, los datos usados en la investigación son: Duración Rendimiento 92 1,7 92 2,3 96 1,9 100 2,0 102 1,5 102 1,7 106 1,6 106 1,8 121 1,0 143 0,3 Con x = la duración de la cosecha de porotos de soya en días, y = rendimiento de la cosecha en toneladas por hectárea. ) ) ) ) Estime la recta de regresión mediante el método de mínimos cuadrados. Interprete los estimadores en el contexto de la pregunta. ¿Existe una relación lineal significativa entre la duración y el rendimiento de la cosecha? Verifique los supuestos. Estime el rendimiento si la duración de la cosecha fue de 104 días. Salida de SPSS para pregunta 2: Estadísticos descriptivos Rendimiento DURACIÓN Media 1.580 106.00 Desviación típ. .5633 15.470 N 10 10 Correlaciones Duración Rendimiento Duración Rendimiento 1 -.940** . .000 10 10 -.940** 1 .000 . 10 10 Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N **. La correlación es significativa al nivel 0,01 (bilateral). Coeficientesa Modelo 1 (Constante) DURACIÓN Coeficientes no estandarizados B Error típ. 5.207 .471 -.034 .004 Coeficientes estandarizad os Beta -.940 a. Variable dependiente: Rendimiento Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl t 11.047 -7.768 Sig. .000 .000 2.5 .3 .2 2.0 .1 1.5 Unstandardized Residual 0.0 Rendimiento 1.0 .5 0.0 90 100 110 120 130 140 150 -.1 -.2 -.3 -.4 90 DURACIÓN 0. 100 110 120 130 140 150 DURACIÓN Un investigador cree que la inteligencia de los niños, medida a través del coeficiente intelectual (CI en puntos), depende del número de hermanos. Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados aparecen en la salida adjunta. CI Hermanos ) ) ) ) 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6 Encuentre e interprete el coeficiente de correlación r. Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto de la pregunta. Verifique los supuestos de regresión. ¿Existe una relación lineal significativa entre el número de hermanos y el coeficiente intelectual? Salida SPSS: Correlaciones Correlación de Pearson Estadísticos descriptivos CI nhermanos Media 103.87 3.00 Desviación típ. 9.591 1.732 Sig. (unilateral) N 15 15 N CI nhermanos CI nhermanos CI nhermanos CI 1.000 -.929 . .000 15 15 nhermanos -.929 1.000 .000 . 15 15 Coeficientesa Modelo 1 (Constante) nhermanos Coeficientes no estandarizados B Error típ. 119.295 1.955 -5.143 .569 Coeficientes estandarizad os Beta -.929 a. Variable dependiente: CI Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl t 61.016 -9.036 Sig. .000 .000 130 8 6 120 4 110 Unstandardized Residual 2 100 CI 90 80 0 1 2 3 4 5 6 7 0 -2 -4 -6 0 nhermanos 1 2 3 4 5 6 7 nhermanos Unstandardized Residual Stem-and-Leaf Plot Frequency 1.00 6.00 6.00 2.00 Stem -0 -0 0 0 Stem width: 10.00000 0. & . . . . Leaf 5 001344 000013 56 Each leaf: 1 case(s) Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción cuyos resultados se muestran en la tabla que sigue. INGESTION Y ABSORCION DE GRASAS EN 20 LACTANTES DESNUTRIDOS. Caso Nº Ingestión Absorción Caso Nº Ingestión Absorción 1 1,4 0,7 11 2,0 1,4 2 1,6 1,2 12 1,4 1,1 3 2,1 1,6 13 1,9 1,5 4 1,7 1,1 14 1,8 1,3 5 1,8 1,3 15 1,9 1,5 6 2,6 2,0 16 1,6 1,4 7 1,5 1,2 17 1,9 1,7 8 2,5 1,5 18 2,1 1,7 9 2,7 2,4 19 1,6 1,3 10 1,8 1,5 20 1,6 1,1 ) ) ) ) ) Estime a y b mediante el método de mínimos cuadrados. Interprete los coeficientes de regresión. Encuentre e interprete el coeficiente de correlación r. ¿Existe una relación lineal significativa entre la ingestión y la absorción de grasas? Verifique los supuestos ¿Cuánto vale la suma de los residuos calculados para las 20 determinaciones? Conteste SI o NO a las siguientes preguntas: ) ) ) El gráfico de residuos muestra que la relación entre la ingestión y la absorción de grasas es lineal El gráfico de residuos se puede usar para determinar si los residuos están normalmente distribuidos. El gráfico de residuos se puede usar para verificar el supuesto de homocedasticidad. Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl Correlaciones Correlación de Pearson Estadísticos descriptivos Media 1.425 1.875 Absorción Ingestión Sig. (unilateral) Desviación típ. .3611 .3740 N 20 20 N Absorción Ingestión Absorción Ingestión Absorción Ingestión Absorción 1.000 .866 . .000 20 20 Ingestión .866 1.000 .000 . 20 20 Coeficientesa Modelo 1 Coeficientes no estandarizados B Error típ. -.143 .217 .836 .114 (Constante) Ingestión Coeficientes estandarizad os Beta t -.659 7.353 .866 Sig. .518 .000 a. Variable dependiente: Absorción 2.5 .4 .2 2.0 -.0 Unstandardized Residual 1.5 Absorción 1.0 .5 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 -.2 -.4 -.6 1.2 Ingestión 1.4 1.6 Ingestión Unstandardized Residual Stem-and-Leaf Plot Frequency Stem & 1.00 Extremes 1.00 -3 . .00 -2 . 2.00 -1 . 5.00 -0 . 6.00 0 . 2.00 1 . 3.00 2 . Stem width: Leaf (=<-.45) 2 27 13669 055788 03 058 .10000 Each leaf: 1 case(s) Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl 1.8 2.0 2.2 2.4 2.6 2.8 5. La tabla más abajo presenta los datos sobre el número de cambios de aceite al año (x) y el costo de la reparación (y, en miles de pesos) de una muestra aleatoria de 10 autos de una cierta marca y modelo. # cambios aceite 3 5 2 3 1 4 6 4 costo en miles de peso 150 150 250 200 350 200 50 125 ) ) ) ) ) ) ) Haga un gráfico de dispersión con los datos, verifique el supuesto de linealidad y valores extremos. Encuentre la recta de regresión de mínimos cuadrados. Interprete los valores estimados del intercepto y de la pendiente. Estima cuál será el costo de reparación de un auto que ha tenido 4 cambios de aceite. Si cambia x por y, obtendrá la misma recta de regresión? Calcule el residuo para la primera observación (x=3, y=150). Verifique los supuestos de la regresión lineal. Salida SPSS: Correlaciones Correlación de Pearson Estadísticos descriptivos Media 368.75 3.50 Y X Sig. (unilateral) Desviación típ. 179.160 1.604 N N 8 8 Y 1.000 -.907 . .001 8 8 Y X Y X Y X X -.907 1.000 .001 . 8 8 Coeficientesa Modelo 1 (Constante) X Coeficientes no estandarizados B Error típ. 723.611 72.964 -101.389 19.161 Coeficientes estandarizad os Beta t 9.917 -5.291 -.907 Sig. .000 .002 a. Variable dependiente: Y 800 100 700 600 0 500 Unstandardized Residual 400 300 200 Y 100 0 0 X 1 2 3 4 5 6 7 -100 -200 0 1 X Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl 2 3 4 5 6 7