PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2009/2010 Práctica 3 Planteamiento y objetivos de la práctica En la presente práctica se propone la modelización univariante por medio del enfoque de Box-Jenkins de tres series temporales con características distintas. En cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que considere más importantes en cada ejemplo y dejar los pasos omitidos para que los cubran los alumnos después por su cuenta. Con la presente práctica se intenta que el alumno aprenda a construir modelos ARIMA univariantes para una serie temporal por medio del enfoque de Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas hasta elaborar el posible modelo generador de los datos. De forma sintética los pasos a realizar son los siguientes: • Especificación inicial • Estimación • Chequeo o validación • Utilización del modelo 1 En la etapa de especificación inicial se deberá determinar el orden de integración de la serie temporal, es decir cual es el número y naturaleza (regular o estacional, incluyendo trimestral, mensual, etc.) de diferencias que se requerirán para convertir en estacionaria a la variable objeto de análisis, Zt (d,s). Zt = (1-B)d (1-Bs ) D 1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredecibilidad, para basar sobre él la extracción de señales como el componente estacional, etc. 2 Donde: d es el número de diferencias regulares y D es el número de diferencias de tipo estacional y habitualmente D = 0 ó 1 y habitualmente 0 ≤ d+D ≤ 2. Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela determinadas características de la misma, como sus correlogramas simple y parcial y los tests de raíces unitarias. En esta práctica nos centramos en el test de raíces unitarias de Dickey y Fuller aumentado (ADF o DF simplemente). Una vez decidido el orden d y D, es decir el número de raíces unitarias que tiene la serie temporal, habrá que decidir el orden del polinomio autorregresivo (p) y el de medias móviles (q) para lo cual utilizamos como principales instrumentos el correlograma simple y el parcial de la serie. Los criterios generales que deben servir de guía para determinar el orden p del polinomio autorregresivo y el orden q del polinomio medias móviles se recogen en las estructuras de los correlogramas simple (FAC) y parcial (FAP) y que para los casos más sencillos se han visto en las clases teóricas. Un resumen de las características de la estructura del correlograma simple y del parcial se recoge en el esquema adjunto. Características teóricas de la FAC y de la FAP de los procesos estacionarios Procesos FAC FAP Decrecimiento rápido hacia AR (p) cero sin llegar a anularse MA (p) ARMA (p, q) P primeras autocorrelaciones distintas de cero y el resto ceros q primeras autocorrelaciones Decrecimiento rápido hacia significativas y el resto ceros cero sin llegar a anularse Decrecimiento rápido hacia cero sin llegar a anularse Decrecimiento rápido hacia cero sin llegar a anularse Debe quedar claro que la identificación es siempre tentativa por lo que se deben sugerir varios modelos como posibles procesos generadores de datos. Una vez que se han sugerido uno o varios modelos se procede a su estimación, 3 usualmente por máxima verosimilitud aunque en Eviews este método no está implementado. Posteriormente se debe realizar el chequeo ó validación del modelo y escoger el que parezca más adecuado para la utilización del modelo. Algunos de los criterios de validación del modelo más importantes incluyen el análisis de la autocorrelación y de valores atípicos de los residuos, la significatividad de los parámetros estimados del modelo (así como sus correlaciones), las condiciones de estacionariedad e invertibilidad y distintos criterios de ajuste (como el error estándar de la regresión, el de Akaike o el de Scharwz). En esta práctica se realiza la modelización de tres series temporales de datos reales y características distintas. El primer caso se refiere al volumen de ventas anual de una empresa en términos reales, el segundo analiza el Índice de empleo de un determinado país con frecuencia trimestral y en el último se modeliza una serie de frecuencia mensual y con estacionalidad, las ventas de cigarros puros de una empresa tabaquera. Ejemplo1. Ventas anuales de una empresa La serie que se modeliza se refiere a las ventas en términos reales de una determinada empresa dedicada a la producción de cosméticos. Su periodicidad es anual y el tamaño muestral abarca 51 observaciones que comprenden el periodo 1949-1999; dada su frecuencia anual, esta serie no tendrá componente estacional. El primer paso que debemos dar para elaborar el modelo univariante de las series es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e importamos los datos, tal y como hemos hecho en las prácticas anteriores. La variable la denominamos ventas Una vez cargados los datos debemos verificar si la serie temporal es estacionaria y, en caso de que no lo sea, realizar las transformaciones pertinentes hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie ventas, gráfico que se muestra a continuación. 4 Las instrucciones en Eviews para obtener el gráfico de la serie son: Quik/Graph /ventas/Line Graph Evolución de las ventas 1200 1100 1000 900 800 700 600 500 50 55 60 65 70 75 80 85 90 95 VENTAS Se observa que tiene una tendencia creciente muy acentuada, lo que es un claro signo de que la serie no es estacionaria en media, además ese crecimiento muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto grado de estabilidad y no es del todo preciso tomar logaritmos. En segundo lugar obtenemos los correlogramas Instrucciones en Eviews para obtener los correlogramas de ventas Quick/Series Statistics/Correlogram/ventas También de forma alternativa en el objeto serie (ventas) View/Correlogram 5 El correlograma simple de ventas (AC) confirma la sospecha anterior sobre la no estacionariedad de la variable ventas al mostrar un decrecimiento muy lento. Adicionalmente llevamos a cabo el test de raíces unitarias de DF. Instrucciones en Eviews para el test DF: Quick/Series Statistics/unit root/ventas Null Hypothesis: VENTAS has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(VENTAS) Method: Least Squares Date: 04/11/06 Time: 17:42 Sample (adjusted): 1951 1999 Included observations: 49 after adjustments 6 t-Statistic Prob.* -0.906450 -3.571310 -2.922449 -2.599224 0.7780 Variable Coefficient Std. Error t-Statistic Prob. VENTAS(-1) D(VENTAS(-1)) C -0.001026 0.577317 5.282546 0.001132 0.111009 1.831241 -0.906450 5.200645 2.884682 0.3694 0.0000 0.0059 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.454475 0.430757 1.058424 51.53198 -70.76235 2.399094 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 10.49688 1.402848 3.010708 3.126534 19.16125 0.000001 El Valor del estadístico t (-0.906) es inferior a los valores críticos de la distribución DF por lo que no se puede rechazar la hipótesis de la existencia de una raíz unitaria y, por tanto, la serie ventas no es estacionaria. Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria se prueba con el ajuste de una tendencia lineal determinista a la serie ventas. Para ello, se ajusta una tendencia determinista a la variable ventas del tipo: ventas = c +β t + εt Cuya estimación se presenta a continuación Instrucciones en Eviews para la estimación de la tendencia determinista: Quick /estimate equation Y en la ventana de la ecuación que se abre escribir: ventas c @trend+1 El resultado de la estimación es: Dependent Variable: VENTAS Method: Least Squares Date: 04/09/06 Time: 19:17 Sample: 1949 1999 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C @TREND+1 605.9019 10.39500 1.299179 0.043483 466.3730 239.0563 0.0000 0.0000 7 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.999143 0.999126 4.570939 1023.781 -148.8514 0.109129 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 876.1719 154.5990 5.915740 5.991498 57147.92 0.000000 12 8 4 0 -4 -8 -12 -16 50 55 60 65 70 75 80 85 90 95 VENTAS Residuals Analizando esos resultados podemos observar que la estimación de los residuos presenta un estadístico Durban-Watson próximo a cero, lo que es indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido blanco. El gráfico de los residuos la serie ventas también muestra esos problemas y nos indica que los residuos se han mantenido por encima y/o por debajo de la media durante un periodo demasiado largo. Por lo tanto, el ajuste con tendencia determinista no es adecuado puesto que olvida determinadas propiedades importantes de la serie Dado que el procedimiento anterior no es el adecuado, la tendencia es tipo estocástica y utilizamos a continuación el procedimiento de la diferenciación para 8 convertir a la serie en estacionaria. Tomamos la primera diferencia en la serie ventas para lo que generamos la serie de Dventas =ventas-ventas(-1), es decir, transformamos la serie de acuerdo con la siguiente expresión: Zt =(1-B)ventas La representación gráfica de la serie transformada y sus correspondientes correlogramas se muestran a continuación. Primera diferencia de la serie ventas 15 14 13 12 11 10 9 8 7 50 55 60 65 70 75 80 DVENTAS 9 85 90 95 Tanto el gráfico de la serie Dventas como su correlograma indican que la primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a su nivel medio y el correlograma tiende a cero con cierta rapidez. No obstante, se completa este análisis con el test DFA de raíces unitarias que se muestra a continuación Test de D-F Aumentado de Dventas Null Hypothesis: DVENTAS has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=10) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level t-Statistic Prob.* -3.777505 -3.571310 -2.922449 -2.599224 0.0057 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(DVENTAS) Method: Least Squares Date: 04/11/06 Time: 21:55 Sample (adjusted): 1951 1999 Included observations: 49 after adjustments Variable Coefficient Std. Error t-Statistic Prob. DVENTAS(-1) C -0.381068 3.942637 0.100878 1.078866 -3.777505 3.654428 0.0004 0.0006 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.232898 0.216577 1.056413 52.45244 -71.19611 2.473364 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) -0.092714 1.193536 2.987596 3.064813 14.26955 0.000445 El test DFA rechaza la hipótesis nula de una raíz unitaria en Dventas puesto que el valor del estadístico t (3,78) supera el valor de los puntos críticos de la 10 distribución DFA. Este resultado corrobora la estacionariedad de la serie Dventas que indican el gráfico y el correlograma de la serie Por lo tanto, de estos resultados la transformación que convertiría a la serie en estacionaria sería: Zt = (1-B) ventas o ventas ∼I (1) Una vez decidido el grado de integración de la serie, es decir, el número de raíces unitarias que tiene, se debe determinar cuales son los posibles procesos ARMA que generan la serie. El análisis de los correlograma de la serie Dventas nos dice que el modelo más claro que puede generar la serie es un AR(2), puesto que el correlograma simple tiende a cero con cierta rapidez y el parcial se anula después del segundo retardo. También se puede sugerir como un modelo alternativo, aunque no tan rotundamente como en el caso anterior, un MA(3) puesto que el correlograma simple se anula después del tercero o cuarto retardo. Por otro lado, de la observación del gráfico de la serie que consideramos estacionaria, D(ventas,1), se observa que su media es distinta de cero, por lo que procede en principio la inclusión de un término independiente. Los modelos sugeridos son: 1.1) ARIMA(2,1,0) : (1-φ1B- φ2B2 ) (1-B) ventas = C+at 1.2) ARIMA(0,1,3) : (1-B) ventas = C+ (1+ θ1B+ θ2B2+ θ3B3)at Un análisis más detallado de la estructura del correlograma podría sugerir algún modelo adicional pero de momento nos quedamos con los propuestos. Estimación 11 Una vez especificados varios modelos alternativos como posibles generadores de la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se deben dar las siguientes instrucciones para estimar los modelos sugeridos. Modelo 1.1: Quick/Estimate Equation/ LS d(ventas,1) c ar(1) ar(2) Modelo 1.2: Quick/Estimate Equation/ LS d(ventas,1) c ma(1) ma(2) ma(3) Los resultados de la estimación de estos modelos se presentan a continuación: Estimación Modelo1.1 Dependent Variable: DVENTAS Method: Least Squares Date: 04/09/06 Time: 19:10 Sample (adjusted): 1952 1999 Included observations: 48 after adjustments Convergence achieved after 3 iterations Variable Coefficient Std. Error t-Statistic Prob. C AR(1) AR(2) 10.11214 0.368149 0.388732 0.616994 0.135783 0.127968 16.38936 2.711310 3.037719 0.0000 0.0095 0.0040 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Inverted AR Roots 0.525916 0.504846 0.979571 43.18014 -65.56936 1.991277 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) .83 10.45896 1.392085 2.857057 2.974007 24.95999 0.000000 -.47 Estimación modelo 1.2 Dependent Variable: DVENTAS Method: Least Squares Date: 04/09/06 Time: 19:02 Sample (adjusted): 1950 1999 Included observations: 50 after adjustments Convergence achieved after 13 iterations Backcast: 1946 1948 Variable Coefficient Std. Error 12 t-Statistic Prob. C MA(1) MA(2) MA(3) 10.43083 0.497157 0.564666 0.632436 0.392970 0.101433 0.097743 0.086339 26.54353 4.901323 5.777057 7.324991 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.557023 0.528133 1.029564 48.76011 -70.31917 2.161780 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Inverted MA Roots .15-.88i .15+.88i 0.0000 0.0000 0.0000 0.0000 10.57670 1.498800 2.972767 3.125729 19.28094 0.000000 -.79 Una vez estimados los modelos especificados se debe validar dichas estimaciones, es decir, se debe contrastar la adecuación del modelo a los datos, por medio de una batería de tests estadísticos y econométricos vistos en clase y que se encuentran en Eviews en el objeto ecuación. Validación o chequeo En la etapa de validación se presentan tres bloques de análisis: Un primero referente a los resultados de la estimación, un segundo centrado en el análisis de los residuos y, finalmente, un tercero dedicado a la comparación de modelos alternativos. • Análisis de la estimación.- Referente a la significatividad individual de los coeficientes por medio del estadístico t de student pone de relieve que todos los coeficientes del modelo 1 son altamente significativos y también lo son los del modelo 2. En cuanto a las condiciones de estacionariedad e invertibilidad de los modelos estimados, todas las raíces de los polinomios de retardos caen fuera de circulo de radio unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro del circulo de radio unidad. 13 De la observación de los resultados de la estimación se deduce que el modelo 1.1 presenta un error estándar (0,979), ligeramente más bajo que el del modelo 1.2 (1,029) y tanto el estadístico de Akaike como el criterio de Schwarz son inferiores en el primer modelo, 2,857 y 2,974, frente a 2,973 y 3,126 En esta etapa también se suele analizar las correlaciones entre los coeficientes estimados para verificar la posible existencia de multicolinealidad en el modelo. La existencia de multicolinealidad indica una falta de precisión en las estimaciones obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las correlaciones entre los coeficientes se acude su matriz de correlaciones que proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo siguiente: View/Correlation Matrix La ejecución de esta instrucción muestra la matriz de coeficientes de la ecuación estimada. Para el modelo 1.1 se tiene: Matriz de correlaciones del modelo 1 C AR(1) AR(2) C 0.380682 -0.005342 -0.015880 AR(1) -0.005342 0.018437 -0.011620 AR(2) -0.015880 -0.011620 0.016376 Se observa que esa matriz presenta unas correlaciones muy bajas por lo que no muestra indicios de multicolinealidad. Para el modelo 1.2 se puede verificar de la misma forma que tampoco presentan problemas de multicolinealidad. Análisis de los residuos. El siguiente paso dentro del proceso de validación es el análisis de los residuos de ambos modelos. Para ello en el objeto ecuación de Eviews se ofrecen varios contrastes pero nos limitamos al contraste de que los residuos sean ruido blanco, inspeccionando el correlograma de residuos, el estadístico Q de Box14 Pierce y el gráfico de residuos. Para ello, en Eviews una vez dentro del objeto ecuación Instrucciones: View/ Residual Tests/Correlogram-Q-Statistics Los resultados para el modelo1.1 se presentan en la tabla adjunta y se puede contemplar que las autocorrelaciones de los residuos no son significativas y entran dentro de las bandas de confianza, lo que indica que no son distintas de cero. Por su parte, el estadístico Q no muestra indicios de autocorrelación global de los residuos, puesto que el valor de Q estimado para los diferentes ordenes de autocorrelación que se muestran en la tabla adjunta es siempre inferior al punto crítico de la χ2 con los correspondientes grados de libertad y niveles de significación estándar utilizados en el trabajo empírico, lo que nos lleva a rechazar ampliamente la hipótesis nula de autocorrelación global de los residuos. Correlograma de los residuos del modelo 1 Instrucciones Eviews para el gráfico de residuos: View/Actual, Fitted, residuals 15 16 14 12 10 2 8 1 6 0 -1 -2 -3 55 60 65 70 75 Residual 80 85 Actual 90 95 Fitted El gráfico de los residuos también apoya la ausencia de autocorrelación residual, puesto que la gran mayoría de los residuos entran dentro de las bandas de confianza, con excepción del correspondiente al año 1962. Por lo tanto, también muestra claramente que los residuos son ruido blanco. De la misma forma que el análisis llevado a cabo para el modelo 1.1 se puede entrar en el objeto ecuación del modelo 1.2 y verificar que sus residuos son ruido blanco. Comparación de modelos alternativos. Del análisis que se acaba de realizar en los dos apartados anteriores se deduce que el modelo 1.1 supera el conjunto de pruebas estadísticas para validar sus estimaciones. Aunque el análisis de residuos es satisfactorio para ambos modelos, el modelo 1.1 presenta una menor varianza residual y un menor Akaike y Schwarz, por lo que es preferible al 1.2. 16 Por lo tanto, el crecimiento anual de las ventas de la empresa, Δventas, que es la variable modelizada viene explicada de forma satisfactoria por un modelo sencillo ARIMA(2,1,0). 3. Ejemplo 2. El Índice de Empleo de un determinado país La serie a modelizar es el índice de empleo de un determinado país, la serie está corregida de estacionalidad y tiene frecuencia trimestral. El periodo muestral abarca 1962:1 1993:4. Una vez creado el WorKfile y establecido el periodo muestral, se cargan los datos tal y como se ha hecho en el ejemplo anterior. La serie la denominamos empleo en el Workfile El primer paso en la modelización de la serie es su representación gráfica. Para ello en Eviews, la instrucción es: Quick/ Graph/ Graph Line/empleo El resultado es el gráfico adjunto 1a en el que se puede contemplar como la serie empleo muestra una tendencia creciente en los primeros 20 años y después y muestra un marcado comportamiento cíclico en los 10 años últimos. La serie no parece mostrar cambios en la varianza ante desplazamientos del tiempo, lo que se puede comprobar tomando logaritmos en la serie y representando gráficamente esa serie, vemos que los gráficos de ambas series son similares, por lo que trabajaremos con la serie original. Para ello, en Eviews GENR Lempleo =LOG(empleo) y para su representación gráfica: Quick/ Graph/ Graph Line/ empleo Grafico 1 a Gráfico 1b 17 115 4.75 110 4.70 105 4.65 100 4.60 95 4.55 90 4.50 85 4.45 4.40 80 1965 1970 1975 1980 1985 1965 1990 1970 1975 1980 1985 1990 LEMPLEO EMPLEO También se muestra a continuación el correlograma de la serie empleo En Eviews una vez dentro del objeto serie empleo View/Correlogram El correlograma confirma un elevado grado de dependencia de las observaciones de la serie empleo y su no estacionariedad en media por el lento decrecimiento de la FAC. 18 Se realiza también el test de DFA de raíces unitarias, cuyos resultados se presentan a continuación. Para ello, en Eviews: Quick/ SERIES STATISTIC/ Unit root / empleo Test D-F aumentado de la serie empleo Null Hypothesis: EMPLEO has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=12) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level t-Statistic Prob.* -2.205738 -3.482879 -2.884477 -2.579080 0.2054 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(EMPLEO) Method: Least Squares Date: 04/19/08 Time: 21:29 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments Variable Coefficient Std. Error t-Statistic Prob. EMPLEO(-1) D(EMPLEO(-1)) C -0.039278 0.478736 3.982081 0.017807 0.078727 1.807249 -2.205738 6.080986 2.203394 0.0293 0.0000 0.0294 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.243969 0.231676 1.457341 261.2326 -224.7214 2.064222 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 0.014150 1.662605 3.614626 3.682156 19.84590 0.000000 El test DFA no rechaza la hipótesis nula de la existencia de una raíz unitaria en empleo puesto que el valor del estadístico t (-2.205) es notablemente inferior a los valores críticos de la distribución DFA 19 Si ajustamos una tendencia temporal lineal simple de tipo determinista a la serie empleo (como hicimos en el capítulo 1 del programa de la asignatura y práctica 1 y en la modelización de la serie ventas que acabamos de realizar, y restamos de empleo la línea ajustada, podremos comprobar que ese no es un procedimiento correcto para convertir a la serie en estacionaria, ya que los residuos tenderán a estar por encima y por debajo de la media durante períodos seguidos demasiado largos (se deja al alumno que lo compruebe). Por lo tanto, es claro que esa tendencia no es determinista sino estocástica y debemos proceder con diferenciaciones para eliminar esa tendencia. Comenzamos tomando una primera diferencia regular en la serie empleo, cuyo gráfico se muestra a continuación así como su correlograma. Instrucciones en Eviews: Genr DEMPLEO =D(EMPLEO,1) Quick/Graph/Line Graph/DEMPLEO Quick/Series Statistic/Correlogram 8 6 4 2 0 -2 -4 -6 1965 1970 1975 1980 D(EMPLEO,1) 20 1985 1990 El gráfico de DEMPLEO muestra que la serie podría ser estacionaria y también en ese sentido apunta el correlograma al mostrar un decaimiento con cierta rapidez. No obstante, se realiza también el test de DFA, cuyos resultados se muestran a continuación, y corrobora también la no existencia de una raíz unitaria en la serie DEMPLEO y que, por tanto, esa transformación convierte a la serie en estacionaria. Test DFA de la serie DEMPLEO Null Hypothesis: D(EMPLEO,1) has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=12) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(EMPLEO,2) Method: Least Squares Date: 04/19/08 Time: 21:28 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments 21 t-Statistic Prob.* -6.751657 -3.482879 -2.884477 -2.579080 0.0000 Variable Coefficient Std. Error t-Statistic Prob. D(EMPLEO(-1),1) C -0.537417 0.006063 0.079598 0.131846 -6.751657 0.045988 0.0000 0.9634 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.268803 0.262906 1.479881 271.5657 -227.1654 2.029454 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) -0.003332 1.723714 3.637545 3.682566 45.58488 0.000000 Por lo tanto la serie EMPLEO tiene una raíz unitaria y la primera diferencia convierte a dicha serie en estacionaria, eliminado su tendencia. La serie es del tipo: Zt =(1-B)EMPLEO o EMPLEO ∼I(1) Es decir, es integrada de orden 1 Determinado el grado de diferenciación ó de raíces unitarias, pasamos a especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas de la serie DEMPLEO se deduce que en la FAC existen 2 ó tres coeficientes que son distintos de cero y después todos son cero, mientras que en la FAP solo existe un coeficiente significativo (que no es cero) el primero, y después tienden rápidamente a cero (o “muy” rápidamente en este caso, ya que los coeficientes segundo y siguientes están todos dentro de las bandas de no significación). Esto sugiere que la serie (DEMPLEO) podría haber sido generada por modelos con estructura MA hasta orden 2 o estructura AR(1). Los modelos que vamos a considerar en esta práctica son ARIMA (1,1,0), ARIMA(1;1,2) y ARIMA(2,1,1). Por otro lado, de la observación del gráfico de la serie DEMPLEO se deduce que la media de la serie aparentemente es cero por lo que debe no debe incluirse el término constante en los modelos especificados Los modelos tentativos serian por tanto: 2.1. ARIMA(1,1,0) o (1- φ1 B)(1-B)EMPLEO = at 22 2.2. ARIMA(1,1,2) ) o (1- φ1 B )(1-B)EMPLEO= (1+ θ1B+θ2B2)at 2.3. ARIMA(2,1,1) ) o (1- φ1 B- φ2 B2) (1-B)EMPLEO= (1+ θ1B) at Estimación La estimación de los modelos anteriores en Eviews se hace por medio de las siguientes instrucciones: Quick/ Estimate Equation/ LS EMPLEO ar(1) Quick/ Estimate Equation/ LS EMPLEO ar(1) ma(1) ma(2) Quick/ Estimate Equation/ LS EMPLEO ar(1) ar(2) ma(1) Los resultados de la estimación de estos modelos se presentan a continuación: Estimacion modelo 2.1 Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 00:48 Sample (adjusted): 1962Q3 1993Q4 Included observations: 126 after adjustments Convergence achieved after 2 iterations Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.462622 0.079275 5.835666 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots 0.214051 0.214051 1.473962 271.5704 -227.1664 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .46 Estimacion modelo 2.2 Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 01:37 Sample (adjusted): 1962Q3 1993Q4 23 0.014150 1.662605 3.621689 3.644200 2.029500 Included observations: 126 after adjustments Convergence achieved after 8 iterations Backcast: 1961Q3 1961Q4 Variable Coefficient Std. Error t-Statistic Prob. AR(1) MA(1) MA(2) 0.515070 -0.070881 0.008407 0.312357 0.324334 0.170031 1.648981 -0.218544 0.049446 0.1017 0.8274 0.9606 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 0.215272 0.202513 1.484742 271.1483 -227.0684 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat Inverted AR Roots Inverted MA Roots .52 .04+.08i .04-.08i 0.014150 1.662605 3.651880 3.719411 1.992157 Estimacion modelo 2.3 Dependent Variable: D(EMPLEO,1) Method: Least Squares Date: 04/21/08 Time: 01:12 Sample (adjusted): 1962Q4 1993Q4 Included observations: 125 after adjustments Convergence achieved after 19 iterations Backcast: 1961Q4 Variable Coefficient Std. Error t-Statistic Prob. AR(1) AR(2) MA(1) -0.459695 0.426099 0.956981 0.094065 0.082802 0.046168 -4.886990 5.145983 20.72805 0.0000 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Inverted MA Roots 0.239708 0.227244 1.462870 261.0787 -223.3991 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .46 -.96 -.92 Validación 24 0.002497 1.664120 3.622385 3.690265 2.031913 En cuanto al modelo 2.1, todos los coeficientes son individualmente significativos según el contraste de la t de student y el ajuste es globalmente aceptable. También son altamente significativos los coeficientes del modelo 2.3. Sin embargo en el modelo 2.2 los coeficientes de los de los parámetros MA no son significativos por lo que el modelo es rechazable. Todos los modelos cumplen las condiciones de estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios autorregresivos como los de media móvil caen fuera del círculo de radio unidad, aunque en el modelo 2.3 haya una raíz cercana a la unidad en el polinomio autorregresivo y otra en el polinomio de medias móviles. A su vez, las matrices de correlaciones de los coeficientes de estos modelos no muestran signos de multicolinealidad Desde el punto de vista del error estándar de los modelos estimados el 2.1 es el que presenta un valor menor (1,4739) seguido del 2.3, aunque muy cerca (1,4628). Desde el punto de vista del criterio de Akaike, tanto el modelo 2.1 como el 2.3 presentan el mismo valor (3,622) El análisis de los residuos de los dos modelos seleccionados a través de sus correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se presentan a continuación, nos indica que ambos cumplen las condiciones para ser considerados como ruido blanco. No obstante, el modelo 2.3 puede ser mejor desde el punto de vista del error estándar de la ecuación. Ambos modelos presentan residuos atípicos en la observación 87:1 y en la 92:1 y la raíz del polinomio media móvil roza la unidad, lo que puede estar indicando sobrediferenciación. Se deja al alumno que pruebe con la serie original EMPLEO, sin diferenciación, y corrija la serie de atípicos y pruebe con especificaciones alternativas. Correlograma de los residuos del modelo 2.1 25 Grafico de residuos del modelo 2.1 8 4 0 8 -4 4 -8 0 -4 1965 1970 1975 1980 Residual Actual Correlograma de los residuos del modelo 2.3 26 1985 1990 Fitted Grafico de residuos del modelo 2.3 8 4 0 8 -4 4 -8 0 -4 1965 1970 1975 1980 Residual Actual 1985 1990 Fitted 4. Ejemplo 3. Ventas de cigarros puros de una empresa tabaquera La serie a modelizar es el volumen de ventas mensual de puros de una empresa tabaquera para el periodo muestral 1989:01 1996:12. El objetivo que se 27 persigue con este ejercicio es que el alumno aprenda a construir un modelo univariante de una serie de frecuencia mensual que tiene una marcada tendencia y estacionalidad. Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores, se realiza la representación gráfica de la serie objeto de análisis. La serie se denomina puros Instrucciones: Quick/Graph/ puros/Line graph Ventas de puros de una empresa tabaquera 800 700 600 500 400 300 200 1989 1990 1991 1992 1993 1994 1995 1996 PUROS Este gráfico es indicativo de una serie en la que el nivel disminuye con el tiempo y muestra, por tanto, una tendencia decreciente. La media no se mantiene constante y disminuye con el tiempo y la serie muy probablemente no será estacionaria en media, por lo que necesitará una diferencia regular. También se observa un marcado patrón estacional con picos en octubre y valores bajos en 28 diciembre. La varianza es visualmente un tanto mayor al principio de la muestra (año 1989) que al final, años 1995 y 1996, pero en el resto de los años parece muy uniforme. Tomamos logaritmos en la serie puros y realizamos su representación gráfica. Para ello en Eviews: GENR Lpuros= log(puros) Quick/Graph/ Lpuros/Line graph Evolución logaritmica de las ventas de puros 6.6 6.4 6.2 6.0 5.8 5.6 5.4 1989 1990 1991 1992 1993 1994 1995 1996 LPUROS Este gráfico del logaritmo de la variable carga (Lpuros ) es muy similar al anterior y la varianza parece estable, por lo que en adelante decidimos trabajar con la transformación logarítmica o sin ella es indiferente, por lo que decidimos trabajar con la métrica original. 29 Como hemos visto en los dos ejemplos anteriores el correlograma es un instrumento útil para verificar la estacionariedad de la serie. A continuación se presentan los correlogramas. Instrucciones: Una vez en el objeto serie puros, View/ Correlogram El correlograma de la serie puros decae lentamente, tanto en la parte regular (1,2,3,etc) como en la estacional (12,24,36,etc), por lo que confirma la no estacionariedad apuntada anteriormente. Pasamos, en primer lugar, a corregir la no estacionariedad en la parte regular tomando una diferencia de orden 1 y representamos el gráfico de esa serie transformada y su correspondiente correlograma. Instrucciones Eviews: Genr dpuros=D(puros,1) Quick/Graph/dpuros/Line graph Quick/series statistic/correlogram/dpuros 30 150 100 50 0 -50 -100 -150 -200 -250 1990 1991 1992 1993 1994 1995 1996 DPUROS Según la gráfica de la primera diferencia regular, d(puros,1), la transformación parece que ha eliminado la tendencia regular pero persiste una cierta la tendencia estacional. El análisis del correlograma indica que, si bien se ha corregido la no estacionariedad de la parte regular, persiste la no estacionariedad en el componente 31 estacional, al ser significativos en el correlograma simple los retardos 12, 24 y también podría serlo el de 36, por lo que se debe tomar una diferencia de tipo estacional junto con la regular. Instrucciones: Genr dd12puros=d(puros,1,12) Quick/Graph/Line Graph/dd12puros Quick/series statistic/correlogram/dd12puros 150 100 50 0 -50 -100 -150 1990 1991 1992 1993 1994 1995 1996 DD12PUROS El gráfico de dd12puros muestra una clara estacionariedad en media y el correlograma de esta variable que se muestra a continuación parece que no ofrece dudas sobre la estacionariedad. 32 No obstante, se elabora el test de DFA para la serie dd12puros para verificar si esta transformación es estacionaria Test DFA de la serie dd12puros Null Hypothesis: DD12PUROS has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=11) Augmented Dickey-Fuller test statistic Test critical values: 1% level 5% level 10% level *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(DD12PUROS) Method: Least Squares Date: 04/13/08 Time: 14:33 Sample (adjusted): 1990M04 1996M12 Included observations: 81 after adjustments 33 t-Statistic Prob.* -12.63026 -3.513344 -2.897678 -2.586103 0.0001 Variable Coefficient Std. Error t-Statistic Prob. DD12PUROS(-1) D(DD12PUROS(-1)) C -2.275417 0.447603 -0.630273 0.180156 0.101841 4.413679 -12.63026 4.395103 -0.142800 0.0000 0.0000 0.8868 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.828732 0.824341 39.71255 123012.8 -411.6206 2.110029 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) -0.086420 94.75286 10.23755 10.32623 188.7137 0.000000 Los resultados del test DFA son concluyentes sobre la estacionariedad de la serie dd12lcarga, el estadístico t (-12.630) supera ampliamente los valores críticos de la distribución ADF, lo que confirma la estacionariedad de esta transformación ya adelantada por el análisis gráfico y el del correlograma. A la vista de los resultados anteriores, la transformación que se sugiere es: Zt =(1-B) (1-B12)puros Para finalizar la etapa de especificación inicial debemos determinar cuales son los modelos estacionales multiplicativos ARMA (p,q) Χ ARMA(P,Q)S que pueden generar la serie. Del análisis del correlograma de la serie dd12puros se deduce que el proceso generador de datos puede tener un componente media móvil regular de orden 1 MA(1), puesto que en el correlograma simple después del primer coeficiente significativo el resto son ceros, y otro estacional de orden MA(1)12 , puesto que después del coeficiente de orden 12 significativo el resto son ceros, es decir un ARMA (0,1)(0,1)12. 3.1. ARIMA(0,1,1)×(0,1,1)12 o (1-B)(1-B12)puros= (1+ θ1B)(1+θ12B12)at Estimación del modelo 3.1 34 Dependent Variable: DD12PUROS Method: Least Squares Date: 04/13/08 Time: 18:09 Sample (adjusted): 1990M02 1996M12 Included observations: 83 after adjustments Convergence achieved after 14 iterations Backcast: 1987M12 1988M12 Variable Coefficient Std. Error t-Statistic Prob. MA(1) SMA(12) -0.677779 -0.867044 0.066918 0.034549 -10.12847 -25.09612 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted MA Roots 0.662434 0.658267 30.88643 77271.69 -401.4760 .99 .49-.86i -.49-.86i -.99 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat .86-.49i .49+.86i -.49+.86i -0.481928 52.83531 9.722312 9.780597 2.546859 .86+.49i .00+.99i -.86+.49i .68 -.00-.99i -.86-.49i Grafico residuos del modelo 3.1 80 40 0 -40 -80 1990 1991 1992 1993 1994 1995 DD12PUROS Residuals 35 1996 Correlograma residuos del modelo 3.1 3.2. ARIMA(2,1,0)×(0,1,1)12 ,, (1- φ1B-φ2B2) (1-B)(1-B12) puros= (1+θ12B12)at Dependent Variable: D(PUROS,1,12) Method: Least Squares Date: 04/10/06 Time: 02:01 Sample (adjusted): 1990M04 1996M12 Included observations: 81 after adjustments Convergence achieved after 7 iterations Backcast: 1988M01 1988M12 Variable Coefficient Std. Error t-Statistic Prob. -0.952059 -0.562088 -0.903840 0.096127 0.095416 0.022752 -9.904132 -5.890927 -39.72502 0.0000 0.0000 0.0000 31 AR(1) AR(2) MA(12) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Inverted AR Roots Inverted MA Roots 0.732067 0.725197 28.01044 61197.62 -383.3443 -.48-.58i .99 .50+.86i Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat -.48+.58i .86-.50i .00+.99i 36 .86+.50i -.00-.99i -0.148148 53.43293 9.539365 9.628049 2.068255 .50-.86i -.50+.86i -.50-.86i -.86+.50i -.86-.50i -.99 Validación El modelo 3.1 presenta todos su coeficientes significativos, según el t ratio, la matriz de coeficientes que se puede consultar en la ventana de la ecuación no proporciona coeficientes de correlación elevados por lo que no presentan signos de multicolinealidad. Analizando los correlogramas de los residuos se observa que todos los coeficientes de autocorrelación no son distintos de cero ya que entran dentro de las bandas de confianza. El gráfico de residuos también indica que los residuos son ruido blanco. El modelo, en principio, parece válido pero presenta alguna raíz de la media móvil próxima a la unidad lo que puede indicar sobrediferenciación. No obstante, la identificación del grado de diferenciación a través del análisis gráfico, los correlogramas de la serie y el test DFA de raíces unitarias se decantaban por una raíz de tipo regular y otra estacional. El modelo 3.2 también tiene todos los coeficientes significativos, los residuos que se pueden consultar en la ventana de la ecuación son ruido blanco a través de la observación del gráfico de los residuos y de su correlograma. Este modelo tiene también una raíz de la media móvil próxima a la unidad, sin embargo, tiene un Akaike inferior al 3.1 y también un error estándar de la ecuación menor por lo que será preferido al 3.1. La mejora del modelo puede venir por corregir algunos residuos atípicos que pueden distorsionar el análisis y la especificación. 37