PRACTICA II SALA DE COMPUTADORES. ANALISIS DE REGRESIÓN. SEMESTRE 01-2009 Marzo 26 de 2009. OBJETIVOS: Mostrar la necesidad de incluir una nueva variable en el modelo. Escribir el problema de mínimos cuadrados en forma matricial. Calcular las ecuaciones normales. Calcular la varianza de los parámetros estimados. PROBLEMA(NETER página 235): Una empresa vende una crema para la piel en 15 drogerias especiales, ubicadas en diferentes ciudades. La tabla siguiente contiente datos de las ventas(# de docenas),de la población (miles de personas) y de los ingresos promedio por capita (dolares) de cada ciudad. Las ventas se consideran como una función de la población y de los ingresos promedios. Dist 1 Ventas 162 Pobla 274 Ingre 2450 2 120 180 3254 3 223 375 3802 4 131 205 2838 5 67 86 2347 6 169 265 3782 7 81 98 3008 8 192 330 2450 9 116 195 2137 10 55 53 2560 11 252 430 4020 12 232 372 4427 13 144 236 2660 14 103 157 2088 1.- Ajustar el modelo de regresión de ventas vs ingresos. 2.- Ajustar el modelo de regresión de ventas vs ingresos y población. Calcular la matriz de coeficientes, la varianza de los parámetros estimdados y la correlación entre ellos. Validar la significancia de los parámetros ajustados. 3.- Ajustar el modelo de regresión de ventas vs población. Comparar los coeficientes de determinación de todos los modelos. 4.- Ajustar el modelo del punto dos sin intercepto. 5.Predecir las ventas de una población que tiene 220.000 habitantes y un ingreso promedio per capita de 2500 dólares. PROGRAMA OPTIONS ps=266 ls=280 nocenter nodate nonumber; GOPTIONS colors=(black black black) cback=white ftext=simplex ftitle=simplex htitle=1. htext=0.8; DATA regmul; INPUT ventas pob ingr; cards; 162 274 2450 120 180 3254 223 375 3802 131 205 2838 67 86 2347 169 265 3782 81 98 3008 192 330 2450 116 195 2137 55 53 2560 252 430 4020 232 372 4427 144 236 2660 103 157 2088 212 370 2605 . 220 2500 ; proc print data=regmul; var ventas pob ingr;run; *; * Nuevas opciones del proc reg: corr: calcula las correlaciones entre todas las varibles definidas en el data, con el cual se ejecutará el procedimiento; * Nuevas opciones de model: i.- covb: imprime matriz de varianza covarianza de los parámetros estimados. ii.- corrb: imprime matriz de correlación de los parámetros estimados. iii. xpx: Imprime las matrices X'X, X'Y, Y'Y iv. i: Imprime la inversa de X'X, vector de parámetros estimados y la SSE, v. Covb: Imprime la matriz de varianzas covarianzas estimada del vector BETA ESTIMADO. *; proc reg data=regmul corr; model ventas = pob ingr/xpx i covb; plot ventas*pob= ventas*ingr; run; 15 212 370 2605 RESULTADOS DE LA EJECUCIÓN DEL PROGRAMA Correlaciones entre las variables regresoras y la variable Matriz de respuesta Variable pob ingr ventas pob 1.0000 0.5686 0.9955 ingr 0.5686 1.0000 0.6393 ventas 0.9955 0.6393 1.0000 Productos cruzados del modelo X'X X'Y Y'Y Variable Intercept pob ingr ventas Intercept pob ingr ventas 15 3626 44428 2259 3626 1067614 11419181 647107 44428 11419181 139063428 7096619 2259 647107 7096619 394107 X'X Inversa, estimadores del parámetro, y SSE Variable Intercept pob ingr ventas Intercept 1.2463484164 0.0002129664 -0.000415671 3.4526127899 Fuente Modelo Error Total corregido Raíz MSE Media dependiente Var Coeff Variable Intercept pob ingr Variable Intercept pob ingr DF 1 1 1 pob 0.0002129664 7.732903E-6 -7.030252E-7 0.4960049761 ingr -0.000415671 -7.030252E-7 1.9771851E-7 0.0091990809 Análisis de la varianza Suma de Cuadrado DF cuadrados de la media 2 53845 26922 12 56.88357 4.74030 14 53902 2.17722 R-cuadrado 0.9989 150.60000 R-Cuad Adj 0.9988 1.44570 Estimadores del parámetro Estimador del Error parámetro estándar 3.45261 2.43065 0.49600 0.00605 0.00920 0.00096811 Covarianza del estimador Intercept pob 5.9080618212 0.0010095241 0.0010095241 0.0000366563 -0.001970405 -3.332548E-6 Valor t 1.42 81.92 9.50 ventas 3.4526127899 0.4960049761 0.0091990809 56.883565559 F-Valor 5679.47 Pr > |t| 0.1809 <.0001 <.0001 ingr -0.001970405 -3.332548E-6 9.372445E-7 Pr > F <.0001