TALLER SOBRE EL SECTOR DE LAS MÁQUINAS DE OFICINA Y

Anuncio
TALLER SOBRE EL
SECTOR DE LAS
MÁQUINAS DE
OFICINA Y EQUIPOS
INFORMÁTICOS DESDE
1997-2007 AMBOS
INCLUSIVE.
CRISTINA REBOLLO NÚÑEZ
RAFAEL MARTÍN ROMERO
PALOMA FERIA MARQUÍNEZ
ADRIÁN MACÍAS LÓPEZ
2º ADE-FICO
0.
Resumen introductorio.
El trabajo realizado por Cristina Rebollo, Rafael Martín, Paloma Feria y Adrián Macias, consta de archivos realizados en Eviews, con la intención de realizar un
análisis exploratorio-grafico y estimación de un modelo econométrico basado en la función de producción del sector de las máquinas de oficina y equipos informáticos.
Los datos proceden de la base de datos del INE (organismo autónomo que ejerce las funciones de coordinación general de los se rvicios estadísticos de la
Administración General del Estado) y están estructurados según la metodología del CNAE-93, que es un código de Clasificación Nacional de Actividades Económicas
que permite identificar y clasificar las diferentes sociedades según la actividad económica ejercida, en este caso, el 3001 Fabricación de máquinas de oficina y el 3002
Fabricación de ordenadores y otro equipo informático.
El estudio consta de un modelo de producción con una variable independiente (el Importe neto de la cifra de negocio) y dos variables independientes (el Gasto
de personal y la Financiación bruta de capital fijo).
0.
Summary
This report made by Cristina Rebollo, Rafael Martín, Paloma Feria y Adrián Macias, has got files made by Eviews, with the idea of doing an exploratory-graphicanalysis and estimate a econometric model based in a production function of the office machines.
1.
Introducción y objetivos.
Los objetivos pretendidos en el trabajo son:
a)
Seleccionar la combinación de variables más adecuada a través de cinco criterios como son: el coeficiente de determinación ajustado, el Akaike, el
Schwarz, el Amemiya y el contraste de razón de verosimilitud; y realizar el contraste Ramsey de error de especificación para saber si las variables
elegidas son realmente significativas sobre el modelo elegido anteriormente.
b)
Detectar la heterocedasticidad del modelo mediante un análisis gráfico, y contrastes de Goldfeld y Quant, Glesjer, White y Breush-Pagan.
c)
Comprobar gráficamente, mediante el correlograma y mediante los contraste de Durbin Watson y Breusch Godfrey, si existe autocorrelación en el modelo
sobre el que trabajamos.
d)
Analizar lógicamente las variables del modelo, y la presencia de multicolinealidad mediante la observación de la estimación por MCO, la matriz de
correlaciones de los regresores, la medida de Belsley, Kuck y Welsch, el contraste de Farrar-Glauber y a través de sus regresiones auxiliares, entre otros
métodos, y su conveniente corrección.
e)
Comprobar la existencia de un cambio estructural en el modelo y cómo afectaría la inclusión de variables ficticias.
Los anteriores métodos se realizarán mediante el software Eviews y la presentación del trabajo se ha realizado mediante un PREZI. Nos hemos organizado en
un WIKI (http://ewiews.wikispaces.com/) dónde se encuentra, entre otros el acta de trabajo y el enlace al prezi antes mencionado.
2.
Marco teórico.
Según la evolución de los datos que se presentan del año 1997 al 2007, observamos un aumento de las ventas y por lo tanto de los beneficios de las empresas,
que se pronuncia en 2002 debido al cambio tecnológico que se produce, aunque también podemos observar un breve decrecimiento a partir de ese año cuya causa
podemos justificar por la crisis que se presenta en estos años.
Debido a estos dos factores (crisis y cambio tecnológico) cae el gasto del personal: menos dinero para los trabajadores y menos puestos necesarios de trabajo.
Respecto al FBCF, las empresas clientes del sector se dan cuenta que deben invertir más para sacar beneficios aún estando en crisis y por ello eso subida se
aprecia una subida de esta variable en el período 2003-2007.
3.
Datos y resultados.
a) Partiendo de los datos sobre el sector de máquinas de oficina y equipos informáticos para las variables Importe neto de la cifra de negocios, Valor añadido
bruto, Excedente de explotación, Gasto del personal, Financiación bruta de capital fijo y Consumos intermedios, para el período de 11 observaciones (1997-2007),
comprobaremos cual es la mejor combinación de variables en la que se basará nuestro caso de estudio:
Datos del sector.
Al ser modelos de producción, para estimarlos, primero los transformaremos por logaritmos en modelos linealizados, es decir:
Y tras la estimación de todos los modelos que podemos combinar, con las variables anteriores transformadas en logaritmos (aunque las denominaremos como
la variables sin transformar), nos basaremos en la comparación entre diferentes coeficientes:
Razón de
Verosimilitud
Prob R.Veros.
0,124972932393
0,62313
0,105317
0,097214
0,17014991963
6,015924
0,014177
-0,304841
0,198536
0,42543440628
0,958649
-0,52042
0,199015
0,348276940759
0,026526
0,870622
-0,5421
0,954897
-0,433583
0,21707
0,379872324011
0,981736
0,331771
EBE-GP-FBCF-CI
2,771398
0,708139
2,916088
4,9736
10,657715296600
EBE-GP-FBCF
2,594363
0,743398
2,702879
4,997443
8,74552445488
0,052605
0,818591
EBE-GP-CI
2,688348
0,718111
2,796865
5,489909
9,60734113504
1,086445
0,29726
MODELO
AKAIKE
R2AJ
SCHWARZ
SCE
AMEMIYA
INCN-GP-FBCF-CI
-1,710486
0,98744
-1,565797
0,056262
0,12056091
INCN-GP-FBCF
-1,653838
0,98605
-1,545321
0,071413
INCN-GP-CI
-1,345402
0,98101
-1,236885
VAB-GP-FBCF-CI
-0,44953
0,952855
VAB-GP-FBCF
-0,628937
VAB-GP-CI
Coeficientes de los modelos.
Ya que los criterios escogidos para la comparación funcionan de la siguiente forma: El coeficiente de determinación ajustado (un coeficiente 0<R2<1)
debe ser lo más cercano a 1 posible, y el Akaike, el Schwarz, el Amemiya y el de Razón de Verosimilitud deben ser lo más pequ eños posible, comprobamos que el
mejor es el primer modelo, pero para que se ajuste mejor a la teoría económica de producción que compone al modelo de una variable de capital y otra de trabajo, y
puesto que en el primer modelo los parámetros de las variables explicativas no son significativas, optaremos por el segundo modelo de forma linealizada para nuestro
caso de estudio:
Ln INCNi=b0+b1*Ln GPi+b2*Ln FBCFi+Ԑi
Datos del modelo
A continuación, realizaremos el contraste de error de significación para el modelo ya escogido, que puede presentar dos casos:
-En el que la Ho: b1=b2=0 indica la omisión de variables.
-En el que la Ho: b1=b2=0 indica que no deben incluirse las variables.
Para determinar si rechazamos o aceptamos la Ho debemos fijarnos en si el p-value es mayor o menor que el nivel de significación. Si es mayor,
aceptaremos la Ho; y si es menor, rechazaremos la Ho y esto indicará que debemos incluir las variables explicativas.
El valor de la probabilidad después de realizar el test de Ramsey, obtenemos un valor mayor al nivel de significación (0.05), por lo que aceptamos la Ho
en cada caso y afirmamos que nuestro modelo no tiene error en su especificación.
Además, observamos que al añadir la nueva variable en el test, los parámetros dejan de ser significativos, lo que evidencia, aún más el buen
funcionamiento del modelo seleccionado.
En conclusión, el modelo Ln INCNi=b0+b1*Ln GPi+b2*Ln FBCFi+Ԑi parece ser el indicado según todos los criterios que hemos elegido para
comprobarlo y una vez estimado por MCO, obtenemos la regresión de la siguiente forma en la que el 98.605 de las variaciones e n INCN son explicadas por las
variaciones en GP y FBCF, y los regresores son significativos global e individualmente:
(Ln INCN)estimado=-1.743907+1.137608*Ln GPi+0.194634*Ln FBCFi
O lo que es mismo:
Estimación a través de Gretel.
Estimación a través de R.
Estimación a través de Eviews.
Una vez escogido el modelo, nos dedicaremos a analizar los diferentes problemas que pueden afectar negativamente a nuestro modelo como son la
heterocedasticidad, la autocorrelación, la multicolinealidad o los cambios estructurales.
se basa en una función de producción Cobb
Douglas que representa la máxima cantidad que se puede producir de un bien con
unos recursos. La función de producción de un productor relaciona la cantidad
usada de factores de producción con la producción obtenida gracias a ella.
Frecuentemente se simplifica suponiendo que en muchos sectores sólo interviene
el capital y el trabajo. En ese caso la función de producción F es una función
monótona creciente en las variables capital (K), trabajo (L) y, en algunos casos,
otros factores de producción (Ri).
El primero paso será realizar el análisis lógico de nuestro modelo, que
En nuestro modelo la variable explicada es el Importe Neto de la Cifra de
negocios, que comprende los importes de la venta de productos y de la prestación
de servicios correspondientes a las actividades ordinarias, deducidas las
bonificaciones y demás reducciones sobre las ventas.
Las variables que hemos escogido para explicar nuestra endógena son el Gasto de
Personal, que se compone de los Sueldos y Salarios Brutos y la Seguridad Social a
cargo de la empresa, como variable de trabajo y la Formación Bruta de Capital Fijo
como variable de capital, que mide el valor de las adquisiciones de activos fijos
nuevos o existentes.
Los datos de las tres variables han sido obtenidos del INE y son datos anuales a
nivel estatal.
b) Para analizar la presencia de heterocedasticidad, procederemos con diferentes métodos:
1. Análisis gráfico del modelo mediante la representación de los residuos con respecto a las distintas variables:
I.
Representación de las variables exógenas respecto a la endógena: Como puede apreciarse en la grafica, los puntos son más dispersos a
medida que la variable explicada se hace mayor, signo de heterocedasticidad.
II.
Representación de las variables explicativas respecto a los residuos: En una situación homocedástica los puntos responderían como una
línea totalmente vertical ya que la varianza de los residuos (R) sería constante para todos los valores de GP y FBCF. En el caso de nuestro
modelo, los puntos se presentan de manera aleatoria, indicándonos que la varianza es desigual dependiendo de los valores que tomen las
variables.
III.
Representación de las variables explicativas respecto al cuadrado de los residuos: Como en el caso anterior, si los puntos aparecieran en
una línea vertical para distintos valores de GP y FBCF podríamos entender que el modelo presenta signos de homocedasticidad. Dado que
para algunos valores la representación de los residuos rompe con la trayectoria vertical, podemos entender que hay indicios de
heterocedasticidad.
IV.
GP – R2 normalizada y FBCF-R2 normalizada
V.
GP2 - R2 normalizada y FBCF2-R2 normalizada
VI.
GP – ABSR normalizada y FBCF-ABSR normalizada
En las últimas graficas la representación de los residuos (línea azul) debería de ser una línea totalmente horizontal, significando esto que el modelo es
homocedástico, dado que la varianza de los residuos es constante y la línea roja (los valores de las distintas variables) en tal caso, fluctuaría tomando los valores
predichos por el modelo para tal variable. Al ser en nuestro modelo una línea azul que fluctúa a lo largo de todo el grafico, podemos tenerlo en cuenta como un signo
más de la presencia de heterocedasticidad.
2.Test de Goldfeld-Quant: no se ordena de acuerdo a la variable explicativa que puede causar la heterocedasticidad por ser una serie temporal, así que se
realiza dividiendo el modelo en tres submuestras, del mismo número de observaciones, de las cuales se estiman la primera y la tercera, obteniendo la suma de los
cuadrados de los residuos y calculando el ratio R=SCE3/SCE1 que se distribuye como una F con ((n-c)/2)-k.
Realizando los cálculos, R=0.031545/0.000333=94.7297297297 y la probabilidad a la derecha, calculada mediante =@FDIST(94.7297297297,2,2) es
0.0104460756635 con k=2. Dado que la probabilidad es menor que el nivel de significación, se rechaza la Ho de varianzas constantes al 95%.
3.Análisis de Breusch-Pagan: El estadístico SCE/2 se distribuye como una chi-cuadrado. El SCE se calcula mediante una regresión auxiliar en la que la
variable independiente G es el cociente entre R2 y la estimación máximoverosímil de la varianza de las perturbaciones.
El estadístico experimental del contraste es SCE/2=2.419159693, y la probabilidad a la derecha de este punto, calculada mediante
=@CHISQ(2.419159693,2) es 0.298322594384. Puesto que la probabilidad es mayor que el nivel de significación del 5%, se acepta la Ho de varianzas constantes.
El SCE se obtiene tras calcular el SCT-SCR, estimados mediante el siguiente procedimiento:
G=r2/(SCR de EQ01/n=0.0064920909090909) ->(n=11)
Quick, estimate equation, G C GP FBCF
SCT=SCR/(1-R^2)=22.76285/(1-0.175294)=27.6011693864
SCE=SCT-SCR=4.838319386
4.Contraste de White: en primer lugar, obtenemos los residuos por una estimación MCO y realizamos la regresión auxiliar de los residuos al cuadrado
frente a los valores de las variables explicativas, sus cuadrados y sus productos cruzados. Tras la introducción del comando se obtiene los valores del estadístico
n*R²=3.650380 y la probabilidad a partir de este punto, que es 0.600765, que al ser mayor que el nivel de significación, nos conduce a aceptar la Ho de
homocedasticidad.
5.Contraste de Glesjer: se realiza una regresión de los residuos en valor absoluto, sobre el regresor ficticio y la variable explicativa que suponemos que
puede causar heterocedastidad elevada a h, cuando h=1, h=-1, h=-1/2, h=1/2 y h=2, y obtenemos los siguientes coeficientes asociados a las variables para los
contrastes individuales:
A) Siendo GP la variable heterocedastica:
1. H=1->0.3625
2. H=-1->0.3734
3. H=1/2->0.3651
4. H=-1/2->0.3706
5. H=2->0.3574
B) Siendo FBCF la variable heterocedastica:
1. H=1->0.5569
2. H=-1->0.5782
3. H=1/2->0.5628
4. H=-1/2->0.5735
5. H=2->0.5440
De lo que deducimos que, puesto que los estadísticos se encuentran en la región de aceptación, se considera que las variables no explican el comportamiento
de los residuos ya que sus parámetros no son significativos, es decir, hay homocedasticidad en todos los casos.
c) Procederemos al estudio de la autocorrelación mediante:
1. Método grafico con el que se analiza el comportamiento de la variable residual. Se realizara dos análisis distintos:
I.
Et frente a Et-1. Este análisis relaciona los residuos de un periodo con los residuos del periodo justamente anterior y se usa solo en el caso
de suponer procesos autocorrelativos de orden 1.
Si la mayoría de puntos estuvieran en los cuadrantes 1 y 3, indicarían autocorrelación positiva, mientras que si estuvieran en los cuadrantes
2 y 4, indicarían autocorrelación negativa.
Los residuos van de valores negativos a valores positivos, situándose en los cuadrantes 1 y 3, de forma que podemos deducir la presencia
de autocorrelación positiva.
II.
Et en el tiempo. Representación de la variable residual a través del tiempo. Si se produjera un comportamiento sistemático, con alguna
forma concreta, se podría deducir la autocorrelacion.
Dado que los residuos presentan un comportamiento cíclico a través del tiempo, podemos decir que presenta autocorrelación..
2.Método de representación gráfica de autocorrelación simple y parcial, que son diagramas en los que se representan los retardos y los coeficientes de
autocorrelación. El correlograma con 9 retardos, no presenta evidencia de autocorrelación, ya que no hay un decrecimiento paulatino en la FAS ni un residuo
significativo en la FAP.
3.Test de Durbin Watson: evalua la presencia de autocorrelación de primer orden de tipo autorregresivo estableciendo las hipótesis Ho: p=0 (ausencia de
autocorrelación) y H1: p<0 ó p>0 (presencia de autocorrelación), mediante el estadístico dw que se relaciona aproximadamente con el coeficiente autorregresivo
estimado 2(1-p).
En la salida de la estimación del modelo en Eviews encontramos el valor del estadístico de Durbin Watson, que en este caso es de 1.805009. Puesto que
los valores del límite superior e inferior al 95% de confianza con un tamaño de muestra igual a 11 y con k’ igual a 2 los encontramos en las tablas de Savin-White como
dL=0.758 y dU=1.604, se concluye por tanto que el estadístico presenta ausencia de correlación, ya que se encuentra entre dU y 4-dU, y en esa zona se acepta la Ho
de ausencia de correlación.
4.Test de Breush Godfrey: permite evaluar no solo la presencia o ausencia de autocorrelación sino también el orden de esta, siguiendo las hipótesis: Ho:
ausencia de autocorrelación y H1: autocorrelación de orden p.
Si el estadístico n*R² supera el valor en tablas de la chi cuadrado al nivel de confianza prefijado con p grados de libertad, se rechaza la Ho.
Probando desde 1 hasta 3 retardos, dado que presenta probabilidades asociadas mayores a 0,05 (nivel de significación), durante ese tramo, se acepta la
Ho de ausencia de correlación.
Sin embargo, al probar con 4 retardos, la presencia de autocorrelación se evidencia.
5.Suponiendo la presencia de autocorrelación, procederemos a realizar el algoritmo de Cochrane-Orcutt. La estimación que muestra los resultados de la
repetición 7 veces del proceso de Cochrane-Orcutt para conseguir la convergencia define que la variable FBCF pasa a no ser significativa, no siéndolo tampoco el
proceso autorregresivo, por lo que supondremos que los residuos no presentan autocorrelación.
d) Para el análisis de la multicolinealidad estudiaremos:
1. Observación del modelo:

La significación global del modelo lo obtenemos con el valor F-Stadistics que obtenemos en la salida del modelo de Eviews. En el caso que
esta sea mayor que el nivel de significación (0,05 en nuestro caso) se entenderá que el modelo no es significativo globalmente.

Significación individual del modelo. La obtenemos en la columna de Probability de la salida de Eviews. En el caso que alguna variable
presente un valor superior a 0,05 se entenderá que no es significativa para el modelo.

Valor de R2: El coeficiente de determinación deberá de ser alto, dando a entender que el modelo tiene una alta capacidad explicativa.
La presencia simultánea de un coeficiente de determinación elevado al 98.88%, la significación global y los coeficientes de l as variables
significativos individualmente, es un signo de no colinealidad en nuestro modelo.
2.
Matriz de correlaciones. Deberemos comprobar tras estimarla que la relación entre dos variables o más no sea excesivamente al ta, pues esto
significara un signo de multicolinealidad. Como vemos en la tabla inferior la correlación entre la variable GP y FBCF es bastante cercana a 1, por lo
que podemos entenderlo como un probable síntoma de colinealidad.
Al calcular el determinante de esta matriz, |Rxx|=0.144539642079, un valor pequeño pero no extremadamente cercano a 0, y toma el valor 1
cuando los regresores son totalmente ortogonales.
Según la medida de Belsley, Kuck y Welsch, calculando los autovectores de la matriz, obtenemos que ∂₁=1.924911 y ∂₂=0.075089.
Por lo tanto: K(x)= ∂max/∂min=5.06310771455 hace pensar de nuevo que no existen problemas de colinealidad en el modelo.
3.
Contraste de Farrar-Glauber: Es un contraste que no se estima directamente. Tenemos que plantear la hipótesis, esta será que el determinante de
la matriz de correlaciones sea igual a 1, Ho: |Rxx|=1 >ortogonalidad de los regresores<, (ausencia de colinealidad). El estadístico es G=-(T-1(1/6)*(2*k+5))*log(|Rxx|), donde K es el numero de parámetros y Rxx la matriz de correlaciones. Tras ello hay que calcular la probabilidad con
=@chisq(estadístico de contraste, n). Si esta es menor del 0,05 (nivel de significación) se rechaza la hipótesis nula y por tanto hay colinealidad.
Como estadístico, obtenemos el valor:
Gexp= -(11-1-(1/6)(2*3+5))*log(0.144539642079)=19.0196477825 y calculando la probabilidad que queda a la derecha mediante
=@chisq(19.0196477825,8), obtenemos el valor 0.014754923569, por lo que, en este caso, se rechaza la Ho de ausencia de colinealidad.
4.
Factor de inflación de la varianza: Habrá que estimar las regresiones auxiliares, donde cada variable explicativa dependerá de la otra variable y el
factor de inflación (FIV) y TOL, donde FIV= 1/1-R2 y TOL=1/FIV. Si el FIV es mayor de 10 es alto, por lo que suponemos la presencia de
colinealidad. Si alguno de los modelos auxiliares presenta colinealidad será colinealidad de la variable independiente con el resto. Para analizar el
factor de inflación de la varianza, obtendremos las regresiones auxiliares siguientes:
En este caso, el R2j es el mismo para los dos, por lo que el FIV=1/(1-0.855460)=6.918500069 para ambas regresiones y, al no ser mayor de 10,
según este método no presentan colinealidad.
5.
La medida de Theil: es un valor que nos ofrece la capacidad explicativa que cada variable aporta al modelo, a partir de la di ferencia entre el
coeficiente de determinación del modelo original y las regresiones excluyendo alguna variable.
A partir del coeficiente del modelo inicial: 0.98884, sabemos que la variable GP aporta 0.98884-0.908551=0.080289 y la variable FBCF, 0.988840.978778=0.010062.
La medida de Theil, por tanto, sería:
0.98884-(0.080289+0.010062)=0.898489, distinta de 0 y algo cercana al valor del coeficiente de determinación, por lo tanto, se concluye la
presencia de colinealidad.
1.
PARA LA CORRECCIÓN DEL MODELO DANDO POR HECHO QUE TIENE PROBLEMAS DE COLINEALIDAD, eliminaremos la variable FBCF
que es la que menos capacidad explicativa tiene respecto al modelo inicial y comprobaremos la diferencia entre las estimaciones de las varianzas
de los estimadores obtenidos en el modelo inicial, y el modelo corregido, que ofrece una leve disminución en la estimación de la varianza de los
coeficientes y un aumento en la covarianza.
e) Otro de los problemas que podemos encontrar es un cambio estructural y
la inclusión de variables ficticias.
1. Método grafico: Observando el análisis gráfico de nuestra variable endógena
podemos deducir dos subperíodos de tiempo diferenciados. Antes del 2001
vemos un crecimiento moderado (subperíodo 1) y a posteriori una gran
caída seguido de unos datos con fluctuaciones pero en línea constante sin
variar significativamente la línea gráfica (subperíodo 2), lo que nos lleva a
pensar en una ruptura estructural en el 2001-2002.
Gráfica de las predicciones:
Al hacer la predicción hasta el año 2013, obtenemos las estimaciones puntuales (línea azul, YF)
del período observado y el intervalo de confianza del modelo (línea roja, ±2S.E.).
2. Contraste de ruptura total: Para realizar el contraste de Chow es necesario
especificar un modelo restringido y uno no restringido. Es decir, el modelo
restringido:
y el
modelo
sin
restricciones
o
de
ruptura
total
que
será:
Cada uno de los modelos se estima MCO y se realiza el siguiente contraste
para verificar si existe o no cambio estructural que afecte a todos los
parámetros de la ecuación del modelo.
Y el estadístico a utilizar será:
La estimación de los modelos especificados es la siguiente:
Como observamos en las estimaciones, la pendiente de nuestra endógena cambia,
ya que en el segundo período el ritmo de crecimiento es más elevado en cuanto a
variaciones unitarias de GP y menor ante variaciones unitarias de FBCF.
Para realizar el test, necesitamos calcular el estadístico que se distribuye como una
F de Snedecor para el cual calcularemos la suma de la suma de los cuadrados de
los residuos de los subperiodos: SCRsr=0.038542, y sustituyendo los valores en la
fórmula
del
estadístico
obtenemos
que
Fexp=((0.0714130.038542)/2)/(0.038542/(11-6))=2.13215453272. El P-Valor calculado mediante
=@FDIST(2.13214543272, 2, 5) es 0.213990530864, con lo que, al ser mayor que
el nivel de significación 0.05, se acepta la Ho de ausencia de cambio estructural
.
Mediante Eviews también podemos realizar este contraste directamente:
Obteniendo el mismo resultado de ausencia de cambio estructural de ruptura total a
un nivel de confianza del 95%.
3. Contraste de ruptura parcial: Se contrasta la estabilidad de la pendiente de
regresión suponiendo que los niveles son distintos.
Y el modelo sin restricciones o de ruptura total que será:
Para considerar un modelo restringido con la misma pendiente y distintas
ordenadas en el origen, generaremos las variables F1 (columna de 1 para las
primeras cinco observaciones y el resto 0) y F2 (columna de 0 para las primeras
cinco observaciones y el resto 1).
Para analizar la ruptura parcial de nuestro modelo estimaremos el modelo
restringido y los modelos sin restricciones para contrastar la Ho, excluyendo el
término constante puesto que sería una combinación lineal de F1 y F2 y daría lugar
a la imposibilidad de estimación mínimo cuadrática debido al problema conocido
como trampa de las variables ficticias.
El modelo sin restricciones sería igual que en el caso anterior.
Para realizar el test con
, necesitamos calcular el
estadístico que se distribuye como una F de Snedecor para el cual calcularemos la
suma de la suma de los cuadrados de los residuos de los subperíodos:
SCRsr=0.038542, y sustituyendo los valores en la fórmula del estadístico
obtenemos
que
Fexp=((0.045971-0.038542)/1)/(0.038542/(116))=0.963753826994. El P-Valor calculado mediante =@FDIST(0.963753826994,
1, 5) es 0.371327147343, con lo que, al ser mayor que el nivel de significación
0.05, se acepta la Ho de igualdad de pendientes de regresión cuando las
ordenadas en el origen son distintas.
4. Verificación de cambio estructural en la ordenada en el origen: Se verifica la
homogeneidad de la ordenada en el origen suponiendo que las pendientes
de regresión son distintas.
Y
el
modelo
sin
restricciones
o
de
ruptura
total
que
será:
Para considerar este modelo restringido incluiremos los regresores ficticios
GP*F1, GP*F2, FBCF*F1 y FBCF*F2 y lo estimamos:
El modelo sin restricciones sería igual que en los casos anteriores.
Para realizar el test con
, necesitamos calcular el estadístico que se
distribuye como una F de Snedecor para el cual calcularemos la suma de la suma
de los cuadrados de los residuos de los subperíodos: SCRsr=0.038542, y
sustituyendo los valores en la fórmula del estadístico obtenemos que
Fexp=((0.038633-0.038542)/1)/(0.038542/(11-6))=0.118053033055. El P-Valor
calculado mediante =@FDIST(0.118053033055, 1, 5) es 0.917704000581, con lo
que, al ser mayor que el nivel de significación 0.05, se acepta la Ho de igualdad de
ordenadas en el origen cuando las pendientes de regresión son distintas.
g) En el supuesto de que quisiéramos incluir una variable cualitativa en
el modelo, la variable elegida sería el resultado del ejercicio que tendrá valor 1 si
hay beneficio y valor 0 si hay perdidas. Los datos de esta variable, recogidos en el
INE en miles de euros son:
Resultado del ejercicio
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
CNAE 300. Fabricación de máquinas de oficina y equipos
-846 informáticos
48146
4130
-15327 127108 -124004
90825 172167 103632
1997
..
..
A falta de los valores en 1997 y 1998, tomaremos que hay beneficios 1997 y
pérdidas en 1998.
Por lo que F1 tendrá valores 1 para 1997, 1999, 2000, 2001, 2003, 2005 y
2006, y 0 para 1998, 2002, 2004 y 2007.
Esta variable nueva suponemos influirá en nuestras variables correctamente
ya que las retribuciones al personal y los gastos de carácter social (GP), y el valor
de los bienes duraderos nuevos y los usados procedentes de la importación, así
como las grandes reparaciones o mejoras de los bienes existentes que alarguen su
vida media o que modifiquen su estructura (FBCF) dependerán en gran medida del
capital del que se disponga, que está muy relacionado con el nivel de beneficios del
sector para cada ejercicio.
Además esta variable también podría ser adecuada a nuestro modelo
porque nuestra endógena es el INCN, que es el total de ventas o prestaciones de
servicios, del cual depende el resultado.
2.
Conclusiones
Como se puede observar en los resultados, el modelo estimado quedaría de la forma:
(Ln INCN)estimado=-1.743907+1.137608*Ln GPi+0.194634*Ln FBCFi
De lo que se puede extraer que ante el aumento en una unidad del Gasto del personal, se aumentaría en 1,13761 el Importe Neto de la cifra de negocios, de
igual manera que si se aumentara en una unidad la FBCF, el Importe Neto se aumentaría en 0,194634.
Al analizar de nuevo el coeficiente de determinación, que determina que el 98.605% de las variaciones del Importe Neto de la cifra de negocios son explicadas
por el modelo, por lo cual el modelo se podría considerar un modelo muy bueno.
Contrastando hipótesis acerca de nuestro modelo a un nivel de confianza del 95%, obtenemos:
a)
Inicialmente haremos un contraste individual de cada una de ellas. Las conclusiones de dicho contraste son que tanto para los Gastos de personal como
para la FBCF, los parámetros son significativos para nuestro modelo, puesto que en ambos casos se rechaza la Hipotesis nula (Ho: Bi=0) debido a que pvalor (0,00006 y 0,02768) son menores que el nivel de significación (0.05).
b)
En cuanto al contraste individual de la constante, podemos observar que se acepta la Hipotesis nula, puesto que el p-valor es mayor que el nivel de
significación, lo cual determina que el parámetro asociado a la constante no es significativo para el modelo.
c)
Si hacemos un contraste global del modelo al mismo nivel de confianza podemos observar que se rechaza la Hipotesis nula (Ho: Bi=0 para i=0,1,2),
debido a que el p-valor (1.551e-08) es menor que el nivel de significación. Por lo cual al menos de un Bi es distinto de cero.
d)
Al hacer el contraste global del modelo para Ho: Bi=0 para i=1,2., obtenemos la misma conclusión que en el apartado anterior: al menos B1 o B2 es
distinto de cero a un nivel de significación del 0,05%.
e)
Al añadir una restricción a nuestro modelo, tal como B2=0, sabemos que la Ho se rechaza a un 0,05% de significación fijándonos en la probabilidad del
contraste F.
3.
Referencias
http://aai.medioambientecantabria.es/Formularios%20word/NORMATIVA/CNAE93.pdf
http://www.ine.es/daco/daco42/clasificaciones/cnae09/cnae2009.pdf
http://prezi.com/ytug0racuymp/taller-de-econometria/
https://moodle.uhu.es/contenidos/mod/workshop/view.php?id=169124
https://moodle.uhu.es/contenidos/mod/resource/view.php?id=135698https://moodle.uhu.es/contenidos/file.php/2762/Practica/p2/eymciip2-ev.pdf
www.economia48.com
Descargar