EJERCICIOS ´ LINEAL SIMPLE Tema 2: MODELO DE REGRESION Ejercicio 1.- Para el modelo de regresión simple siguiente: Yi = βxi + εi i = 1, ..., 100 se tienen las siguientes medias muestrales: ( ( ( P P P yi ) /n = 0.3065 x2i ) /n = 25.2693 P ( P ( P yi2 /x2i ) /n = 0.5951 ( P yi2 ) /n = 16.003 ( P xi yi ) /n = 15.4195 ( x4i ) /n = 1269.589 xi ) /n = −0.0985 yi /xi ) /n = 0.5646 a) Obtener la estimación MCO de β y la desviación típica del estimador MCO de β cuando se cumplen los supuestos habituales. b) Si la varianza del término de perturbación ui fuese conocida y tal que σ 2u = 0.25 · x2i , ¿cuál sería la verdadera desviación típica del estimador MCO de β? Interpretar Ejercicio 2.- Se ha estimado el modelo yi = βxi + εi y, para medir la bondad de ajuste, se ha calculado el R2 y se ha obtenido un valor igual a -1.74 ¿A qué se debe este resultado? Ejercicio 3.- Para estimar el modelo yi = β 0 +β 1 xi +ui se dispone de dos muestras, A y B. Justifica para cada uno de los siguientes casos, qué muestra sería más deseable: a) la única diferencia entre ambas muestras es que el número de observaciones de la muestra A es menor que el de la muestra B. b) la única diferencia entre ambas muestras es que 1 Pn A A 2 i=1 (xi −x̄ ) < Pn B B 2 i=1 (xi −x̄ ) %&' ()* !"# #$%&$'()'# #&*+)",$"# #' "-)$'('( + .+,)$, /' 01 "-#',2+3$"('# Ejercicio 4.- Los siguientes sumatorios se obtienen a partir de 16 observaciones $+-4'# ! ' " ! de las variables x e y "!! 5 671 ! ! "! 5 19 ! " " ! !!! 5X 168 !! "! 5X 9:7 2 ! ! yi = 526 x2i = 657 ! i i !! 5 :1 X X ! yi = 64 xi = 96 " i X xi yi = 492 i i >;! ? P ! =!! !>;="P >; !" ! =!! ! P a) Calcula i (yi − ȳ)2 , i (xi − x̄)2 y i (xi − x̄)(yi − ȳ) &'(),+ 4+# '#)$*+3$"('# A<B /' 4+ ,'%,'#$C"( "! 5 q " D q # !! D $! % b) Encuentra las estimaciones MCO de la regresión yi = β 0 + β 1 xi + ui . &4+ '4 3"'!3$'()' /' /')',*$(+3$C"( &! ? 3"*'()+ 4"# ,'#&4)+/"#E c) Calcula el coeficiente de determinación R2 y comenta los resultados. &4+ >;! # ! ="! " ! %&' +)* F+/" '4 *"/'4" /' ,'%,'#$C"( #$*.4' "! 5 q # D q ! !! D $! G /'*"#),+, s Ejercicio 5.- Dado el modelo de regresión simple yi = β 1 + β 2 xi + ui , demostrar $ %&$#% √ ("# s /"(/' ("# '# '4 3"'!3$'()' /' 3",,'4+3$C"( 4$('+4 =*&'#),+4; '(),' V ar(y) $ %&$"% que b2 = rxy √ donde rxy es el coeficiente de correlación lineal (muestral) entre V ar(x) x e y. %&' ,)* @( '4 *"/'4" /' ,'%,'#$C"( #$*.4' "! 5 k D q!! D 0! G ) 5 0# %%%# * -+I" Ejercicio 6.- En el modelo de regresión simple yi = α + βxi + εi , i = 1, ..., n bajo #$# &#&+4'# #' J+( "-)'($/" 4"# #$%&$'()'# 2+4",'#K qL 5 0%0 ? '4 3"'!3$'()' las hipótesis usuales se han obtenido los siguientes valores: β̂ = −1.1 y el coeficiente 3$C"( 4$('+4 ( 5 M%N:E O$ #' *&4)$.4$3+( )"/"# 4"# 2+4",'# !! G .", 6 ? )"/"# 4"# de correlación lineal r = 0.89. Si se multiplican todos los valores xi , por 5 y todos los 0M;K yi por (-10): 4", /' , #$%&' #$'(/" MEN: .'," '4 /' qL # .+#+ + #', 7E7E a) el valor de r sigue siendo 0.89 pero el de β̂ 1 pasa a ser 2.2. " '4 2+4", /' ( 3"*" '4 /' qL # .',*+('3'( 3"(#)+()'#E b) tanto el valor de r como el de β̂ 1 permanecen constantes. -$+( )+()" '4 2+4", /' ( 3"*" '4 /' qL # % c) cambian tanto el valor de r como el de β̂ 1 . 4", /' ( .+#+ + #', PMEN:G .'," '4 /' qL # .',*+('3' 3"(#)+()'E d) el valor de r pasa a ser -0.89, pero el de β̂ 1 permanece constante. %&' -)* !+ /$,'33$C"( /' &(+ '*.,'#+ H&$',' '#)&/$+, 4+ ,'()+-$4$/+/ /' #& Ejercicio 7.- La dirección de una empresa quiere estudiar la rentabilidad de su '( .&-4$3$/+/E Q+,+ '44" J+ en ,'3"%$/" /+)"#Para /'4 2"4&*'( /' 2'()+# ? /'4del %+#)" inversión publicidad. ello ha recogido datos volumen de ventas y del gasto /+/ ,'R',$/"# + 4"#en+S ("# ("2'()+ ? 'T.,'#+/"# '( *$44"('# /' .'#')+# publicidad referidos a los años noventa, en miles de euros 7 2 Año Ventas Gasto publicidad 1990 50 10 1991 100 15 1992 150 18 1993 200 20 1994 200 25 1995 300 35 1996 400 50 1997 500 55 1998 650 60 1999 700 65 a) Especifica y estima el modelo lineal que explique las ventas de la empresa en función de la inversión publicitaria. Interpreta los parámetros estimados. b) En el año 2003, la empresa va a invertir 450.000 euros en publicidad. Calcula el volumen de ventas esperado. c) Se plantea el modelo Yi = βXi + εi i = 1, .....n Halla el estimador mínimo cuadrático de β. d) Aplica el resultado del apartado anterior para explicar el volumen de ventas en función de los gastos en publicidad. Comprueba que la media de los residuos no es nula. Ejercicio 8.- Dado el modelo Yi = β 0 + β 1 Xi + εi y realizada su estimación por mínimos cuadrados ordinarios para una muestra de 6 observaciones, se obtiene el vector de residuos que aparece en la tercera columna de la tabla siguiente, 3 Observación X e 1 2 -1 2 3 3 3 4 ? 4 2 -2 5 1 -1 6 2 ? A partir de esta información, recuperar los datos desconocidos en la tabla anterior. Ejercicio 9.- En una empresa el salario anual de cada individuo, Y, se determina por la fórmula Y = 10.000 + 500S + 200T donde S es el número de años de estudios del individuo y T es el número de años que ha estado empleado. Sea X la edad del individuo. Calcule Cov(X, Y ), Cov (X, S) y Cov (X, T ) para la muestra de individuos que figura en la tabla de abajo y compruebe que Cov (X, Y ) = 500Cov (X, S) + 200Cov (X, T ) y además V (Y ) = 250.000V (S) + 40.000V (T ) + 200.000Cov (S, T ) Deduzca analíticamente estas expresiones. 18 Años Estudio 11 Años Empleo 1 2 29 14 6 18.200 3 33 12 8 17.600 4 35 16 10 20.000 5 45 12 5 17.000 Individuo Edad 1 4 Salario 15.700 Ejercicio 10.- La tabla de abajo muestra la tasa media de crecimiento del PIB, g, y del empleo, e, para 25 países de la OCDE para el periodo 1988-97. Adicionalmente se presentan los resultados de realizar la regresión de e frente a g : 3.1) Realice un gráfico entre la tasa de empleo y la tasa de crecimento del PIB. 3.2) Describa cada uno de los conceptos de la salida de ordenador de la regresión, hallando los resultados que faltan e interprete los coeficientes de la regresión Tasas de crecimiento medio del Empleo y PIB 1988-97 Empleo PIB Empleo PIB Australia 1.68 3.04 Corea 2.57 7.73 Austria 0.65 2.55 Luxemburgo 3.02 5.64 Bélgica 0.34 2.16 Holanda 1.88 2.86 Canadá 1.17 2.03 Nueva Zelanda 0.91 2.01 Dinamarca 0.02 2.02 Noruega 0.36 2.98 Finlandia -1.06 1.78 Portugal 0.33 2.79 Francia 0.28 2.08 España 0.89 2.60 Alemania 0.08 2.71 Suecia -0.94 1.17 Grecia 0.87 2.08 Suiza 0.79 1.15 Islandia -0.13 1.54 Turquía 2.02 4.18 Irlanda 2.16 6.40 RU 0.66 1.97 Italia -0.30 1.68 EEUU 1.53 2.46 Japón 1.06 2.81 e Coef. Std.Err. t P>|t| g .48468 .08409 ? 0.000 cons -.52086 -1.924 ? 0.067 5 Ejercicio 11.- Usando el conjunto datos de EEUU, un individuo realizó la regresión del ingreso por hora, EARNINGS, medido en dólares, frente a años de educación, S, y obtuvo el siguiente resultado cIN GS = −1.39 + 1.07S EARN Un segundo individuo ajusta la misma regresión pero se equivoca y estima la regresión de S frente a EARN INGS y obtiene y de ésta deriva Sb = 12.25 + 0.097EARNINGS c GS = −126.29 + 10.31S EARNIN Explique por qué existe esta discrepancia entre esta ecuación y la que ajustó el primer individuo. Ejercicio 12.- Se llama curva de aprendizaje a las mejoras que experimenta un individuo en la realización de una actividad cuando éste la repite. Las curvas de aprendizaje se utilizan, por ejemplo, para analizar el coste de incorporación de un nuevo trabajador a una cadena de montaje. Supongamos que el número de piezas correctas que hace un operario en una máquina está determinada por la siguiente curva de aprendizaje Y = 500 + 100X + u donde Y es el número de piezas sin fallos, X es el número de veces que ha repetido la operación en el mes de incorporación a la empresa y u es un término de perturbación. La tabla siguiente da los resultados de las primeras 20 veces que el operario trabajó en la cadena: X va de 0 a 19; los valores de la perturbación - que a priori son inobservables- se obtuvieron de muestrear en una normal con media cero y varianza 1 y multiplicar el valor obtenido por 400; el valor de Y se obtuvo de los valores de X y u aplicados a la curva de aprendizaje 6 Observación X u Y 1 0 -236 264 2 1 -96 504 3 2 -332 368 4 3 12 812 5 4 -152 748 6 5 -876 124 7 6 412 1.512 8 7 96 1.296 9 8 1.012 2.312 10 9 -52 1.348 11 10 636 2.136 12 11 -368 1.232 13 12 -284 1.416 14 13 -100 1.700 15 14 676 2.576 16 15 60 2.060 17 16 8 2.108 18 17 -44 2.156 19 18 -364 1.936 20 19 568 2.968 La regresión de Y frente a X se estimó con los datos de esta tabla Yb =369 + 116.8 X (190) (17.1) donde los errores standard están entre paréntesis. (a) Explique con sus palabras el significado de la tabla anterior. 7 (b) ¿Por qué el valor estimado de la constante no es igual a 500 y el coeficiente de X no es igual a 100? (c) ¿Cuál es el significado del error standard y para qué se utiliza? (d) El mismo proceso de aprendizaje se ha repetido con otros 10 operarios nuevos, generando nuevamente el término de perturbación a partir de una normal, y los resultados de las regresiones fueron las siguientes Operario Constante St.error Coef. de X St.error 1 369 190 116.8 17.1 2 699 184 90.1 16.5 3 531 169 78.5 15.2 4 555 158 99.5 14.2 5 407 120 122.6 10.8 6 427 194 104.3 17.5 7 412 175 123.8 15.8 8 613 192 95.8 17.3 9 234 146 130.1 13.1 10 485 146 109.6 13.1 (d.1)¿Por qué la constante, el coeficiente de X y su error standard varían de operario a operario? (d.2) Realice un gráfico donde en el eje de abcisas figure el número de operario y en el de ordenadas el valor del coeficiente de X. ¿Qué observa en dicho gráfico? Realice la media matemática de los coeficientes de X y discuta su resultado. (d.3) La varianza de X es 33.25 y la de u es 160.000. Usando la expresión de abajo, demostrar que la desviación típica del coeficiente de X es 15.5. ¿Cree que los errores standard presentados en la tabla son buenas estimaciones de la desviación típica? 8 Justifique su respuesta. σ 2b2 = σ 2u nV ar (X) Ejercicio 13.- Un investigador cree que la verdadera relación entre dos variables está dada por la ecuación Y = β 1 + β2X + u Dada una muestra de n observaciones, el investigador estima β 2 como la media de Y dividida por la media de X. Discuta las propiedades de este estimador. ¿Qué diferencias habría si hubiéramos supuesto β 1 = 0? 9