TALLER SOBRE EL SECTOR DE LAS MÁQUINAS DE OFICINA Y EQUIPOS INFORMÁTICOS DESDE 1997-2007 AMBOS INCLUSIVE. CRISTINA REBOLLO NÚÑEZ RAFAEL MARTÍN ROMERO PALOMA FERIA MARQUÍNEZ ADRIÁN MACÍAS LÓPEZ 2º ADE-FICO 0. Resumen introductorio. El trabajo realizado por Cristina Rebollo, Rafael Martín, Paloma Feria y Adrián Macias, consta de archivos realizados en Eviews, con la intención de realizar un análisis exploratorio-grafico y estimación de un modelo econométrico basado en la función de producción del sector de las máquinas de oficina y equipos informáticos. Los datos proceden de la base de datos del INE (organismo autónomo que ejerce las funciones de coordinación general de los se rvicios estadísticos de la Administración General del Estado) y están estructurados según la metodología del CNAE-93, que es un código de Clasificación Nacional de Actividades Económicas que permite identificar y clasificar las diferentes sociedades según la actividad económica ejercida, en este caso, el 3001 Fabricación de máquinas de oficina y el 3002 Fabricación de ordenadores y otro equipo informático. El estudio consta de un modelo de producción con una variable independiente (el Importe neto de la cifra de negocio) y dos variables independientes (el Gasto de personal y la Financiación bruta de capital fijo). 0. Summary This report made by Cristina Rebollo, Rafael Martín, Paloma Feria y Adrián Macias, has got files made by Eviews, with the idea of doing an exploratory-graphicanalysis and estimate a econometric model based in a production function of the office machines. 1. Introducción y objetivos. Los objetivos pretendidos en el trabajo son: a) Seleccionar la combinación de variables más adecuada a través de cinco criterios como son: el coeficiente de determinación ajustado, el Akaike, el Schwarz, el Amemiya y el contraste de razón de verosimilitud; y realizar el contraste Ramsey de error de especificación para saber si las variables elegidas son realmente significativas sobre el modelo elegido anteriormente. b) Detectar la heterocedasticidad del modelo mediante un análisis gráfico, y contrastes de Goldfeld y Quant, Glesjer, White y Breush-Pagan. c) Comprobar gráficamente, mediante el correlograma y mediante los contraste de Durbin Watson y Breusch Godfrey, si existe autocorrelación en el modelo sobre el que trabajamos. d) Analizar lógicamente las variables del modelo, y la presencia de multicolinealidad mediante la observación de la estimación por MCO, la matriz de correlaciones de los regresores, la medida de Belsley, Kuck y Welsch, el contraste de Farrar-Glauber y a través de sus regresiones auxiliares, entre otros métodos, y su conveniente corrección. e) Comprobar la existencia de un cambio estructural en el modelo y cómo afectaría la inclusión de variables ficticias. Los anteriores métodos se realizarán mediante el software Eviews y la presentación del trabajo se ha realizado mediante un PREZI. Nos hemos organizado en un WIKI (http://ewiews.wikispaces.com/) dónde se encuentra, entre otros el acta de trabajo y el enlace al prezi antes mencionado. 2. Marco teórico. Según la evolución de los datos que se presentan del año 1997 al 2007, observamos un aumento de las ventas y por lo tanto de los beneficios de las empresas, que se pronuncia en 2002 debido al cambio tecnológico que se produce, aunque también podemos observar un breve decrecimiento a partir de ese año cuya causa podemos justificar por la crisis que se presenta en estos años. Debido a estos dos factores (crisis y cambio tecnológico) cae el gasto del personal: menos dinero para los trabajadores y menos puestos necesarios de trabajo. Respecto al FBCF, las empresas clientes del sector se dan cuenta que deben invertir más para sacar beneficios aún estando en crisis y por ello eso subida se aprecia una subida de esta variable en el período 2003-2007. 3. Datos y resultados. a) Partiendo de los datos sobre el sector de máquinas de oficina y equipos informáticos para las variables Importe neto de la cifra de negocios, Valor añadido bruto, Excedente de explotación, Gasto del personal, Financiación bruta de capital fijo y Consumos intermedios, para el período de 11 observaciones (1997-2007), comprobaremos cual es la mejor combinación de variables en la que se basará nuestro caso de estudio: Datos del sector. Al ser modelos de producción, para estimarlos, primero los transformaremos por logaritmos en modelos linealizados, es decir: Y tras la estimación de todos los modelos que podemos combinar, con las variables anteriores transformadas en logaritmos (aunque las denominaremos como la variables sin transformar), nos basaremos en la comparación entre diferentes coeficientes: Razón de Verosimilitud Prob R.Veros. 0,124972932393 0,62313 0,105317 0,097214 0,17014991963 6,015924 0,014177 -0,304841 0,198536 0,42543440628 0,958649 -0,52042 0,199015 0,348276940759 0,026526 0,870622 -0,5421 0,954897 -0,433583 0,21707 0,379872324011 0,981736 0,331771 EBE-GP-FBCF-CI 2,771398 0,708139 2,916088 4,9736 10,657715296600 EBE-GP-FBCF 2,594363 0,743398 2,702879 4,997443 8,74552445488 0,052605 0,818591 EBE-GP-CI 2,688348 0,718111 2,796865 5,489909 9,60734113504 1,086445 0,29726 MODELO AKAIKE R2AJ SCHWARZ SCE AMEMIYA INCN-GP-FBCF-CI -1,710486 0,98744 -1,565797 0,056262 0,12056091 INCN-GP-FBCF -1,653838 0,98605 -1,545321 0,071413 INCN-GP-CI -1,345402 0,98101 -1,236885 VAB-GP-FBCF-CI -0,44953 0,952855 VAB-GP-FBCF -0,628937 VAB-GP-CI Coeficientes de los modelos. Ya que los criterios escogidos para la comparación funcionan de la siguiente forma: El coeficiente de determinación ajustado (un coeficiente 0<R2<1) debe ser lo más cercano a 1 posible, y el Akaike, el Schwarz, el Amemiya y el de Razón de Verosimilitud deben ser lo más pequ eños posible, comprobamos que el mejor es el primer modelo, pero para que se ajuste mejor a la teoría económica de producción que compone al modelo de una variable de capital y otra de trabajo, y puesto que en el primer modelo los parámetros de las variables explicativas no son significativas, optaremos por el segundo modelo de forma linealizada para nuestro caso de estudio: Ln INCNi=b0+b1*Ln GPi+b2*Ln FBCFi+Ԑi Datos del modelo A continuación, realizaremos el contraste de error de significación para el modelo ya escogido, que puede presentar dos casos: -En el que la Ho: b1=b2=0 indica la omisión de variables. -En el que la Ho: b1=b2=0 indica que no deben incluirse las variables. Para determinar si rechazamos o aceptamos la Ho debemos fijarnos en si el p-value es mayor o menor que el nivel de significación. Si es mayor, aceptaremos la Ho; y si es menor, rechazaremos la Ho y esto indicará que debemos incluir las variables explicativas. El valor de la probabilidad después de realizar el test de Ramsey, obtenemos un valor mayor al nivel de significación (0.05), por lo que aceptamos la Ho en cada caso y afirmamos que nuestro modelo no tiene error en su especificación. Además, observamos que al añadir la nueva variable en el test, los parámetros dejan de ser significativos, lo que evidencia, aún más el buen funcionamiento del modelo seleccionado. En conclusión, el modelo Ln INCNi=b0+b1*Ln GPi+b2*Ln FBCFi+Ԑi parece ser el indicado según todos los criterios que hemos elegido para comprobarlo y una vez estimado por MCO, obtenemos la regresión de la siguiente forma en la que el 98.605 de las variaciones e n INCN son explicadas por las variaciones en GP y FBCF, y los regresores son significativos global e individualmente: (Ln INCN)estimado=-1.743907+1.137608*Ln GPi+0.194634*Ln FBCFi O lo que es mismo: Estimación a través de Gretel. Estimación a través de R. Estimación a través de Eviews. Una vez escogido el modelo, nos dedicaremos a analizar los diferentes problemas que pueden afectar negativamente a nuestro modelo como son la heterocedasticidad, la autocorrelación, la multicolinealidad o los cambios estructurales. se basa en una función de producción Cobb Douglas que representa la máxima cantidad que se puede producir de un bien con unos recursos. La función de producción de un productor relaciona la cantidad usada de factores de producción con la producción obtenida gracias a ella. Frecuentemente se simplifica suponiendo que en muchos sectores sólo interviene el capital y el trabajo. En ese caso la función de producción F es una función monótona creciente en las variables capital (K), trabajo (L) y, en algunos casos, otros factores de producción (Ri). El primero paso será realizar el análisis lógico de nuestro modelo, que En nuestro modelo la variable explicada es el Importe Neto de la Cifra de negocios, que comprende los importes de la venta de productos y de la prestación de servicios correspondientes a las actividades ordinarias, deducidas las bonificaciones y demás reducciones sobre las ventas. Las variables que hemos escogido para explicar nuestra endógena son el Gasto de Personal, que se compone de los Sueldos y Salarios Brutos y la Seguridad Social a cargo de la empresa, como variable de trabajo y la Formación Bruta de Capital Fijo como variable de capital, que mide el valor de las adquisiciones de activos fijos nuevos o existentes. Los datos de las tres variables han sido obtenidos del INE y son datos anuales a nivel estatal. b) Para analizar la presencia de heterocedasticidad, procederemos con diferentes métodos: 1. Análisis gráfico del modelo mediante la representación de los residuos con respecto a las distintas variables: I. Representación de las variables exógenas respecto a la endógena: Como puede apreciarse en la grafica, los puntos son más dispersos a medida que la variable explicada se hace mayor, signo de heterocedasticidad. II. Representación de las variables explicativas respecto a los residuos: En una situación homocedástica los puntos responderían como una línea totalmente vertical ya que la varianza de los residuos (R) sería constante para todos los valores de GP y FBCF. En el caso de nuestro modelo, los puntos se presentan de manera aleatoria, indicándonos que la varianza es desigual dependiendo de los valores que tomen las variables. III. Representación de las variables explicativas respecto al cuadrado de los residuos: Como en el caso anterior, si los puntos aparecieran en una línea vertical para distintos valores de GP y FBCF podríamos entender que el modelo presenta signos de homocedasticidad. Dado que para algunos valores la representación de los residuos rompe con la trayectoria vertical, podemos entender que hay indicios de heterocedasticidad. IV. GP – R2 normalizada y FBCF-R2 normalizada V. GP2 - R2 normalizada y FBCF2-R2 normalizada VI. GP – ABSR normalizada y FBCF-ABSR normalizada En las últimas graficas la representación de los residuos (línea azul) debería de ser una línea totalmente horizontal, significando esto que el modelo es homocedástico, dado que la varianza de los residuos es constante y la línea roja (los valores de las distintas variables) en tal caso, fluctuaría tomando los valores predichos por el modelo para tal variable. Al ser en nuestro modelo una línea azul que fluctúa a lo largo de todo el grafico, podemos tenerlo en cuenta como un signo más de la presencia de heterocedasticidad. 2.Test de Goldfeld-Quant: no se ordena de acuerdo a la variable explicativa que puede causar la heterocedasticidad por ser una serie temporal, así que se realiza dividiendo el modelo en tres submuestras, del mismo número de observaciones, de las cuales se estiman la primera y la tercera, obteniendo la suma de los cuadrados de los residuos y calculando el ratio R=SCE3/SCE1 que se distribuye como una F con ((n-c)/2)-k. Realizando los cálculos, R=0.031545/0.000333=94.7297297297 y la probabilidad a la derecha, calculada mediante =@FDIST(94.7297297297,2,2) es 0.0104460756635 con k=2. Dado que la probabilidad es menor que el nivel de significación, se rechaza la Ho de varianzas constantes al 95%. 3.Análisis de Breusch-Pagan: El estadístico SCE/2 se distribuye como una chi-cuadrado. El SCE se calcula mediante una regresión auxiliar en la que la variable independiente G es el cociente entre R2 y la estimación máximoverosímil de la varianza de las perturbaciones. El estadístico experimental del contraste es SCE/2=2.419159693, y la probabilidad a la derecha de este punto, calculada mediante =@CHISQ(2.419159693,2) es 0.298322594384. Puesto que la probabilidad es mayor que el nivel de significación del 5%, se acepta la Ho de varianzas constantes. El SCE se obtiene tras calcular el SCT-SCR, estimados mediante el siguiente procedimiento: G=r2/(SCR de EQ01/n=0.0064920909090909) ->(n=11) Quick, estimate equation, G C GP FBCF SCT=SCR/(1-R^2)=22.76285/(1-0.175294)=27.6011693864 SCE=SCT-SCR=4.838319386 4.Contraste de White: en primer lugar, obtenemos los residuos por una estimación MCO y realizamos la regresión auxiliar de los residuos al cuadrado frente a los valores de las variables explicativas, sus cuadrados y sus productos cruzados. Tras la introducción del comando se obtiene los valores del estadístico n*R²=3.650380 y la probabilidad a partir de este punto, que es 0.600765, que al ser mayor que el nivel de significación, nos conduce a aceptar la Ho de homocedasticidad. 5.Contraste de Glesjer: se realiza una regresión de los residuos en valor absoluto, sobre el regresor ficticio y la variable explicativa que suponemos que puede causar heterocedastidad elevada a h, cuando h=1, h=-1, h=-1/2, h=1/2 y h=2, y obtenemos los siguientes coeficientes asociados a las variables para los contrastes individuales: A) Siendo GP la variable heterocedastica: 1. H=1->0.3625 2. H=-1->0.3734 3. H=1/2->0.3651 4. H=-1/2->0.3706 5. H=2->0.3574 B) Siendo FBCF la variable heterocedastica: 1. H=1->0.5569 2. H=-1->0.5782 3. H=1/2->0.5628 4. H=-1/2->0.5735 5. H=2->0.5440 De lo que deducimos que, puesto que los estadísticos se encuentran en la región de aceptación, se considera que las variables no explican el comportamiento de los residuos ya que sus parámetros no son significativos, es decir, hay homocedasticidad en todos los casos. c) Procederemos al estudio de la autocorrelación mediante: 1. Método grafico con el que se analiza el comportamiento de la variable residual. Se realizara dos análisis distintos: I. Et frente a Et-1. Este análisis relaciona los residuos de un periodo con los residuos del periodo justamente anterior y se usa solo en el caso de suponer procesos autocorrelativos de orden 1. Si la mayoría de puntos estuvieran en los cuadrantes 1 y 3, indicarían autocorrelación positiva, mientras que si estuvieran en los cuadrantes 2 y 4, indicarían autocorrelación negativa. Los residuos van de valores negativos a valores positivos, situándose en los cuadrantes 1 y 3, de forma que podemos deducir la presencia de autocorrelación positiva. II. Et en el tiempo. Representación de la variable residual a través del tiempo. Si se produjera un comportamiento sistemático, con alguna forma concreta, se podría deducir la autocorrelacion. Dado que los residuos presentan un comportamiento cíclico a través del tiempo, podemos decir que presenta autocorrelación.. 2.Método de representación gráfica de autocorrelación simple y parcial, que son diagramas en los que se representan los retardos y los coeficientes de autocorrelación. El correlograma con 9 retardos, no presenta evidencia de autocorrelación, ya que no hay un decrecimiento paulatino en la FAS ni un residuo significativo en la FAP. 3.Test de Durbin Watson: evalua la presencia de autocorrelación de primer orden de tipo autorregresivo estableciendo las hipótesis Ho: p=0 (ausencia de autocorrelación) y H1: p<0 ó p>0 (presencia de autocorrelación), mediante el estadístico dw que se relaciona aproximadamente con el coeficiente autorregresivo estimado 2(1-p). En la salida de la estimación del modelo en Eviews encontramos el valor del estadístico de Durbin Watson, que en este caso es de 1.805009. Puesto que los valores del límite superior e inferior al 95% de confianza con un tamaño de muestra igual a 11 y con k’ igual a 2 los encontramos en las tablas de Savin-White como dL=0.758 y dU=1.604, se concluye por tanto que el estadístico presenta ausencia de correlación, ya que se encuentra entre dU y 4-dU, y en esa zona se acepta la Ho de ausencia de correlación. 4.Test de Breush Godfrey: permite evaluar no solo la presencia o ausencia de autocorrelación sino también el orden de esta, siguiendo las hipótesis: Ho: ausencia de autocorrelación y H1: autocorrelación de orden p. Si el estadístico n*R² supera el valor en tablas de la chi cuadrado al nivel de confianza prefijado con p grados de libertad, se rechaza la Ho. Probando desde 1 hasta 3 retardos, dado que presenta probabilidades asociadas mayores a 0,05 (nivel de significación), durante ese tramo, se acepta la Ho de ausencia de correlación. Sin embargo, al probar con 4 retardos, la presencia de autocorrelación se evidencia. 5.Suponiendo la presencia de autocorrelación, procederemos a realizar el algoritmo de Cochrane-Orcutt. La estimación que muestra los resultados de la repetición 7 veces del proceso de Cochrane-Orcutt para conseguir la convergencia define que la variable FBCF pasa a no ser significativa, no siéndolo tampoco el proceso autorregresivo, por lo que supondremos que los residuos no presentan autocorrelación. d) Para el análisis de la multicolinealidad estudiaremos: 1. Observación del modelo: La significación global del modelo lo obtenemos con el valor F-Stadistics que obtenemos en la salida del modelo de Eviews. En el caso que esta sea mayor que el nivel de significación (0,05 en nuestro caso) se entenderá que el modelo no es significativo globalmente. Significación individual del modelo. La obtenemos en la columna de Probability de la salida de Eviews. En el caso que alguna variable presente un valor superior a 0,05 se entenderá que no es significativa para el modelo. Valor de R2: El coeficiente de determinación deberá de ser alto, dando a entender que el modelo tiene una alta capacidad explicativa. La presencia simultánea de un coeficiente de determinación elevado al 98.88%, la significación global y los coeficientes de l as variables significativos individualmente, es un signo de no colinealidad en nuestro modelo. 2. Matriz de correlaciones. Deberemos comprobar tras estimarla que la relación entre dos variables o más no sea excesivamente al ta, pues esto significara un signo de multicolinealidad. Como vemos en la tabla inferior la correlación entre la variable GP y FBCF es bastante cercana a 1, por lo que podemos entenderlo como un probable síntoma de colinealidad. Al calcular el determinante de esta matriz, |Rxx|=0.144539642079, un valor pequeño pero no extremadamente cercano a 0, y toma el valor 1 cuando los regresores son totalmente ortogonales. Según la medida de Belsley, Kuck y Welsch, calculando los autovectores de la matriz, obtenemos que ∂₁=1.924911 y ∂₂=0.075089. Por lo tanto: K(x)= ∂max/∂min=5.06310771455 hace pensar de nuevo que no existen problemas de colinealidad en el modelo. 3. Contraste de Farrar-Glauber: Es un contraste que no se estima directamente. Tenemos que plantear la hipótesis, esta será que el determinante de la matriz de correlaciones sea igual a 1, Ho: |Rxx|=1 >ortogonalidad de los regresores<, (ausencia de colinealidad). El estadístico es G=-(T-1(1/6)*(2*k+5))*log(|Rxx|), donde K es el numero de parámetros y Rxx la matriz de correlaciones. Tras ello hay que calcular la probabilidad con =@chisq(estadístico de contraste, n). Si esta es menor del 0,05 (nivel de significación) se rechaza la hipótesis nula y por tanto hay colinealidad. Como estadístico, obtenemos el valor: Gexp= -(11-1-(1/6)(2*3+5))*log(0.144539642079)=19.0196477825 y calculando la probabilidad que queda a la derecha mediante =@chisq(19.0196477825,8), obtenemos el valor 0.014754923569, por lo que, en este caso, se rechaza la Ho de ausencia de colinealidad. 4. Factor de inflación de la varianza: Habrá que estimar las regresiones auxiliares, donde cada variable explicativa dependerá de la otra variable y el factor de inflación (FIV) y TOL, donde FIV= 1/1-R2 y TOL=1/FIV. Si el FIV es mayor de 10 es alto, por lo que suponemos la presencia de colinealidad. Si alguno de los modelos auxiliares presenta colinealidad será colinealidad de la variable independiente con el resto. Para analizar el factor de inflación de la varianza, obtendremos las regresiones auxiliares siguientes: En este caso, el R2j es el mismo para los dos, por lo que el FIV=1/(1-0.855460)=6.918500069 para ambas regresiones y, al no ser mayor de 10, según este método no presentan colinealidad. 5. La medida de Theil: es un valor que nos ofrece la capacidad explicativa que cada variable aporta al modelo, a partir de la di ferencia entre el coeficiente de determinación del modelo original y las regresiones excluyendo alguna variable. A partir del coeficiente del modelo inicial: 0.98884, sabemos que la variable GP aporta 0.98884-0.908551=0.080289 y la variable FBCF, 0.988840.978778=0.010062. La medida de Theil, por tanto, sería: 0.98884-(0.080289+0.010062)=0.898489, distinta de 0 y algo cercana al valor del coeficiente de determinación, por lo tanto, se concluye la presencia de colinealidad. 1. PARA LA CORRECCIÓN DEL MODELO DANDO POR HECHO QUE TIENE PROBLEMAS DE COLINEALIDAD, eliminaremos la variable FBCF que es la que menos capacidad explicativa tiene respecto al modelo inicial y comprobaremos la diferencia entre las estimaciones de las varianzas de los estimadores obtenidos en el modelo inicial, y el modelo corregido, que ofrece una leve disminución en la estimación de la varianza de los coeficientes y un aumento en la covarianza. e) Otro de los problemas que podemos encontrar es un cambio estructural y la inclusión de variables ficticias. 1. Método grafico: Observando el análisis gráfico de nuestra variable endógena podemos deducir dos subperíodos de tiempo diferenciados. Antes del 2001 vemos un crecimiento moderado (subperíodo 1) y a posteriori una gran caída seguido de unos datos con fluctuaciones pero en línea constante sin variar significativamente la línea gráfica (subperíodo 2), lo que nos lleva a pensar en una ruptura estructural en el 2001-2002. Gráfica de las predicciones: Al hacer la predicción hasta el año 2013, obtenemos las estimaciones puntuales (línea azul, YF) del período observado y el intervalo de confianza del modelo (línea roja, ±2S.E.). 2. Contraste de ruptura total: Para realizar el contraste de Chow es necesario especificar un modelo restringido y uno no restringido. Es decir, el modelo restringido: y el modelo sin restricciones o de ruptura total que será: Cada uno de los modelos se estima MCO y se realiza el siguiente contraste para verificar si existe o no cambio estructural que afecte a todos los parámetros de la ecuación del modelo. Y el estadístico a utilizar será: La estimación de los modelos especificados es la siguiente: Como observamos en las estimaciones, la pendiente de nuestra endógena cambia, ya que en el segundo período el ritmo de crecimiento es más elevado en cuanto a variaciones unitarias de GP y menor ante variaciones unitarias de FBCF. Para realizar el test, necesitamos calcular el estadístico que se distribuye como una F de Snedecor para el cual calcularemos la suma de la suma de los cuadrados de los residuos de los subperiodos: SCRsr=0.038542, y sustituyendo los valores en la fórmula del estadístico obtenemos que Fexp=((0.0714130.038542)/2)/(0.038542/(11-6))=2.13215453272. El P-Valor calculado mediante =@FDIST(2.13214543272, 2, 5) es 0.213990530864, con lo que, al ser mayor que el nivel de significación 0.05, se acepta la Ho de ausencia de cambio estructural . Mediante Eviews también podemos realizar este contraste directamente: Obteniendo el mismo resultado de ausencia de cambio estructural de ruptura total a un nivel de confianza del 95%. 3. Contraste de ruptura parcial: Se contrasta la estabilidad de la pendiente de regresión suponiendo que los niveles son distintos. Y el modelo sin restricciones o de ruptura total que será: Para considerar un modelo restringido con la misma pendiente y distintas ordenadas en el origen, generaremos las variables F1 (columna de 1 para las primeras cinco observaciones y el resto 0) y F2 (columna de 0 para las primeras cinco observaciones y el resto 1). Para analizar la ruptura parcial de nuestro modelo estimaremos el modelo restringido y los modelos sin restricciones para contrastar la Ho, excluyendo el término constante puesto que sería una combinación lineal de F1 y F2 y daría lugar a la imposibilidad de estimación mínimo cuadrática debido al problema conocido como trampa de las variables ficticias. El modelo sin restricciones sería igual que en el caso anterior. Para realizar el test con , necesitamos calcular el estadístico que se distribuye como una F de Snedecor para el cual calcularemos la suma de la suma de los cuadrados de los residuos de los subperíodos: SCRsr=0.038542, y sustituyendo los valores en la fórmula del estadístico obtenemos que Fexp=((0.045971-0.038542)/1)/(0.038542/(116))=0.963753826994. El P-Valor calculado mediante =@FDIST(0.963753826994, 1, 5) es 0.371327147343, con lo que, al ser mayor que el nivel de significación 0.05, se acepta la Ho de igualdad de pendientes de regresión cuando las ordenadas en el origen son distintas. 4. Verificación de cambio estructural en la ordenada en el origen: Se verifica la homogeneidad de la ordenada en el origen suponiendo que las pendientes de regresión son distintas. Y el modelo sin restricciones o de ruptura total que será: Para considerar este modelo restringido incluiremos los regresores ficticios GP*F1, GP*F2, FBCF*F1 y FBCF*F2 y lo estimamos: El modelo sin restricciones sería igual que en los casos anteriores. Para realizar el test con , necesitamos calcular el estadístico que se distribuye como una F de Snedecor para el cual calcularemos la suma de la suma de los cuadrados de los residuos de los subperíodos: SCRsr=0.038542, y sustituyendo los valores en la fórmula del estadístico obtenemos que Fexp=((0.038633-0.038542)/1)/(0.038542/(11-6))=0.118053033055. El P-Valor calculado mediante =@FDIST(0.118053033055, 1, 5) es 0.917704000581, con lo que, al ser mayor que el nivel de significación 0.05, se acepta la Ho de igualdad de ordenadas en el origen cuando las pendientes de regresión son distintas. g) En el supuesto de que quisiéramos incluir una variable cualitativa en el modelo, la variable elegida sería el resultado del ejercicio que tendrá valor 1 si hay beneficio y valor 0 si hay perdidas. Los datos de esta variable, recogidos en el INE en miles de euros son: Resultado del ejercicio 2007 2006 2005 2004 2003 2002 2001 2000 1999 1998 CNAE 300. Fabricación de máquinas de oficina y equipos -846 informáticos 48146 4130 -15327 127108 -124004 90825 172167 103632 1997 .. .. A falta de los valores en 1997 y 1998, tomaremos que hay beneficios 1997 y pérdidas en 1998. Por lo que F1 tendrá valores 1 para 1997, 1999, 2000, 2001, 2003, 2005 y 2006, y 0 para 1998, 2002, 2004 y 2007. Esta variable nueva suponemos influirá en nuestras variables correctamente ya que las retribuciones al personal y los gastos de carácter social (GP), y el valor de los bienes duraderos nuevos y los usados procedentes de la importación, así como las grandes reparaciones o mejoras de los bienes existentes que alarguen su vida media o que modifiquen su estructura (FBCF) dependerán en gran medida del capital del que se disponga, que está muy relacionado con el nivel de beneficios del sector para cada ejercicio. Además esta variable también podría ser adecuada a nuestro modelo porque nuestra endógena es el INCN, que es el total de ventas o prestaciones de servicios, del cual depende el resultado. 2. Conclusiones Como se puede observar en los resultados, el modelo estimado quedaría de la forma: (Ln INCN)estimado=-1.743907+1.137608*Ln GPi+0.194634*Ln FBCFi De lo que se puede extraer que ante el aumento en una unidad del Gasto del personal, se aumentaría en 1,13761 el Importe Neto de la cifra de negocios, de igual manera que si se aumentara en una unidad la FBCF, el Importe Neto se aumentaría en 0,194634. Al analizar de nuevo el coeficiente de determinación, que determina que el 98.605% de las variaciones del Importe Neto de la cifra de negocios son explicadas por el modelo, por lo cual el modelo se podría considerar un modelo muy bueno. Contrastando hipótesis acerca de nuestro modelo a un nivel de confianza del 95%, obtenemos: a) Inicialmente haremos un contraste individual de cada una de ellas. Las conclusiones de dicho contraste son que tanto para los Gastos de personal como para la FBCF, los parámetros son significativos para nuestro modelo, puesto que en ambos casos se rechaza la Hipotesis nula (Ho: Bi=0) debido a que pvalor (0,00006 y 0,02768) son menores que el nivel de significación (0.05). b) En cuanto al contraste individual de la constante, podemos observar que se acepta la Hipotesis nula, puesto que el p-valor es mayor que el nivel de significación, lo cual determina que el parámetro asociado a la constante no es significativo para el modelo. c) Si hacemos un contraste global del modelo al mismo nivel de confianza podemos observar que se rechaza la Hipotesis nula (Ho: Bi=0 para i=0,1,2), debido a que el p-valor (1.551e-08) es menor que el nivel de significación. Por lo cual al menos de un Bi es distinto de cero. d) Al hacer el contraste global del modelo para Ho: Bi=0 para i=1,2., obtenemos la misma conclusión que en el apartado anterior: al menos B1 o B2 es distinto de cero a un nivel de significación del 0,05%. e) Al añadir una restricción a nuestro modelo, tal como B2=0, sabemos que la Ho se rechaza a un 0,05% de significación fijándonos en la probabilidad del contraste F. 3. Referencias http://aai.medioambientecantabria.es/Formularios%20word/NORMATIVA/CNAE93.pdf http://www.ine.es/daco/daco42/clasificaciones/cnae09/cnae2009.pdf http://prezi.com/ytug0racuymp/taller-de-econometria/ https://moodle.uhu.es/contenidos/mod/workshop/view.php?id=169124 https://moodle.uhu.es/contenidos/mod/resource/view.php?id=135698https://moodle.uhu.es/contenidos/file.php/2762/Practica/p2/eymciip2-ev.pdf www.economia48.com