ECONOMETRIA SESION 5-GP4GT2. Objetivos: Analizar lógicamente las variables del modelo, y la presencia de multicolinealidad mediante la observación de la estimación por MCO, la matriz de correlaciones de los regresores, la medida de Belsley, Kuck y Welsch, el contraste de Farrar-Glauber y a través de sus regresiones auxiliares, entre otros métodos, y su conveniente corrección. Introducción: Nuestro modelo se basa en una función de producción Cobb Douglas que representa la máxima cantidad que se puede producir de un bien con unos recursos. La función de producción de un productor relaciona la cantidad usada de factores de producción con la producción obtenida gracias a ella. Frecuentemente se simplifica suponiendo que en muchos sectores sólo interviene el capital y el trabajo. En ese caso la función de producción F es una función monótona creciente en las variables capital (K), trabajo (L) y, en algunos casos, otros factores de producción (Ri). En nuestro modelo la variable explicada es el Importe Neto de la Cifra de negocios, que comprende los importes de la venta de productos y de la prestación de servicios correspondientes a las actividades ordinarias, deducidas las bonificaciones y demás reducciones sobre las ventas. Las variables que hemos escogido para explicar nuestra endógena son el Gasto de Personal, que se compone de los Sueldos y Salarios Brutos y la Seguridad Social a cargo de la empresa, como variable de trabajo y la Formación Bruta de Capital Fijo como variable de capital, que mide el valor de las adquisiciones de activos fijos nuevos o existentes. Los datos de las tres variables han sido obtenidos del INE y son datos anuales a nivel estatal. Métodos: El análisis de la multicolinealidad del modelo se realizara mediante: 1. Significación global e individual del modelo, junto con el valor de R2. La significación global del modelo lo obtenemos con el valor FStadistics que obtenemos en la salida del modelo de Eviews. En el caso que esta sea mayor que el nivel de significación (0,05 en nuestro caso) se entenderá que el modelo no es significativo globalmente. Significación individual del modelo. La obtenemos en la columna de Probability de la salida de Eviews. En el caso que alguna variable presente un valor superior a 0,05 se entenderá que no es significativa para el modelo. Valor de R2: El coeficiente de determinación deberá de ser alto, dando a entender que el modelo tiene una alta capacidad explicativa. En caso de que la significación global sea nula, la significación individual alta, y el coeficiente de determinación también alto, se considerara como un signo de multicolinealidad. 2. Matriz de correlaciones. Deberemos comprobar tras estimarla que la relación entre dos variables o más no sea excesivamente alta, pues esto significara un signo de multicolinealidad. 3. Contraste de Farrar-Glauber: Es un contraste que no se estima directamente. Tenemos que plantear la hipótesis, esta será que el determinante de la matriz de correlaciones sea igual a 1, (ausencia de colinealidad). El estadístico es una formula donde K es el numero de parámetros y Rxx la matriz de correlaciones. Tras ello hay que calcular al probabilidad con =@chisq(estadístico de contraste, n). Si esta es menor del 0,05 (nivel de significación) se rechaza que la hipótesis nula, por tanto hay colinealidad. 4. Factor de inflación de la varianza: Habrá que calcular las regresiones auxiliares, donde cada variable dependerá de las otras variables. Y el factor de inflación (FIV) y TOL. Después se estima cada modelo. FIV= 1/1-R2 y TOL=1/FIV. Si el FIV es mayor de 10 es alto, por lo que presenta colinealidad. Hay que realizar el FIV por cada modelo auxiliar, con R2 de cada modelo auxiliar. Por tanto, si algún modelo presenta colinealidad será colinealidad de la variable independiente con el resto. 5. La medida de Theil: es un valor que nos ofrece la capacidad explicativa que cada variable aporta al modelo, a partir de la diferencia entre el coeficiente de determinación del modelo original y las regresiones. Resultados: El modelo queda estimado como: 1. Significación global e individual del modelo, junto con el valor de R2. En la regresión anterior puede verse el output de la estimación del modelo en Eviews. La presencia simultánea de un coeficiente de determinación elevado al 98.88%, la significación global y los coeficientes de las variables significativos individualmente, es un signo de no colinealidad en nuestro modelo. 2. Matriz de correlaciones: Como vemos en la tabla inferior la correlación entre la variable CI y G es bastante cercana a 1, por lo que podemos entenderlo como un probable síntoma de colinealidad. Al calcular el determinante de esta matriz, |Rxx|=0.144539642079, un valor pequeño pero no extremadamente cercano a 0, y toma el valor 1 cuando los regresores son totalmente ortogonales. Según la medida de Belsley, Kuck y Welsch, calculando los autovectores de la matriz, obtenemos que ∂₁=1.924911 y ∂₂=0.075089. Por lo tanto: K(x)=5.06310771455 hace pensar de nuevo que no existen problemas de colinealidad en el modelo. 3. Contraste de Farrar-Glauber; cuya Ho: |Rxx|=1 ->ortogonalidad de los regresores. Como estadístico, obtenemos el valor: Gexp= -(11-1-(1/6)(2*3+5))*log(0.144539642079)=19.0196477825 Y calculando la probabilidad que queda a la derecha mediante =@chisq(19.0196477825,8), obtenemos el valor 0.014754923569, por lo que, en este caso, se rechaza la Ho de ausencia de colinealidad. 4. Para analizar el factor de inflación de la varianza, obtendremos las regresiones auxiliares siguientes: En este caso, el R2j es el mismo para los dos, por lo que el FIV=1/(10.855460)=6.918500069 para ambas regresiones y, al no ser mayor de 10, según este método no presentan colinealidad. 5. La medida de Theil: según esta medida calculamos la información que aporta cada variable al modelo obteniendo las estimaciones a partir de la exclusión de uno de los regresores. A partir del coeficiente del modelo inicial: 0.98884, sabemos que la variable GP aporta 0.98884-0.908551=0.080289 y la variable FBCF, 0.98884-0.978778=0.010062. La medida de Theil, por tanto, sería: 0.98884-(0.080289+0.010062)=0.898489, distinta de 0 y algo cercana al valor del coeficiente de determinación, por lo tanto, se concluye la presencia de colinealidad. 6. PARA LA CORRECCIÓN DEL MODELO DANDO POR HECHO QUE TIENE PROBLEMAS DE COLINEALIDAD, eliminaremos la variable FBCF que es la que menos capacidad explicativa tiene respecto al modelo inicial y comprobaremos la diferencia entre las estimaciones de las varianzas de los estimadores obtenidos en el modelo inicial, y el modelo corregido, que ofrece una leve disminución en la estimación de la varianza de los coeficientes. Conclusión: Ante la duda por los diferentes resultados de las anteriores pruebas, hemos corregido el modelo suponiendo que presentara colinealidad en nuestro modelo inicial mediante la exclusión de una de nuestras variables explicativas, aunque en otras de las pruebas resulta incongruente decir que el modelo la presenta. Calendarización: La fecha de comienzo de este informe fue el 8 de mayo de 2012, y la fecha de entrega sería el 20 de mayo de 2012. En este período hemos trabajado los días 8 y 10 de mayo con los primeros pasos del informe, y 15 y 21 de mayo con la finalización y entrega del trabajo. La fecha de entrega supera la fecha establecida por problemas ya expuestos al profesor de la asignatura. Referencias: Pena Trapero – Cien ejercicios de econometría (1999)