Análisis de cointegración y factores comunes en sistemas de indicadores económicos Ignacio Dı́az-Emparanza 11 de Junio, 1993 2 Índice general 1. Introducción 5 2. Modelos de factores comunes 2.1. Introducción . . . . . . . . . . . . . . . . . . 2.2. Modelos de tendencias comunes . . . . . . . 2.3. Modelos de factores estacionales comunes . . 2.4. Mod. de tendencias y factores estac. comunes . . . . . . . . . . . . . . . . . . . . 9 9 11 13 15 3. Cointegración y factores comunes 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Relación entre cointegración y factores comunes . . . . . . . . . 3.3.1. Modelos con tendencias comunes . . . . . . . . . . . . 3.3.2. Modelos con factores comunes estacionales . . . . . . . 3.3.3. Modelos con tendencias y factores estacionales comunes . . . . . . . . . . . . . . . . . . . . . . . . 17 17 19 21 21 22 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. Contrastes de r.u. y de cointegración 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Contrastes de raı́ces unitarias en la frecuencia cero . . . . . . 4.2.1. Contrastes de Dickey y Fuller . . . . . . . . . . . . . 4.2.2. Contraste de Bhargava . . . . . . . . . . . . . . . . . 4.2.3. Contrastes de Phillips . . . . . . . . . . . . . . . . . . 4.3. Contrastes de Cointegración en la frecuencia cero . . . . . . . 4.4. Contrastes de r.u. en las frecuencias estacionales . . . . . . . . 4.4.1. Contrastes de Hasza y Fuller . . . . . . . . . . . . . . 4.4.2. Contrastes de Dickey, Hasza y Fuller . . . . . . . . . 4.4.3. Contraste de Bhargava . . . . . . . . . . . . . . . . . 4.4.4. Contraste de Hylleberg, Engle, Granger y Yoo (HEGY) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 31 32 32 33 34 34 35 36 37 38 38 5. Contrastes de integración estacional 5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Contraste con un estadı́stico tipo F . . . . . . . . . . . . . . . . . 5.3. Potencia del contraste . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1. Hipótesis alternativas con igual módulo en todas sus raı́ces . . . . . . . . . . . . 41 41 42 43 43 3 . . . . . . . . . . . 4 ÍNDICE GENERAL 5.3.2. Hipótesis alternativas con raı́ces de distinto módulo . . . . . . . 5.4. Series con estructura en el componente no estacional . . . . . . . . . . 5.5. Método de contraste basado en un estadı́stico de tipo t . . . . . . . . . 5.5.1. Potencia del contraste . . . . . . . . . . . . . . . . . . . . . . 5.5.1.1. Igual módulo en todas las raı́ces estacionales . . . . . 5.5.1.2. Hipótesis alternativas con raı́ces de módulo diferente 46 49 52 53 53 54 Apéndices 5.A. Polinomio con raı́ces del mismo módulo . . . . . . . . . . . . . . . . . 5.B. Modelos para hipótesis alternativas con diferente número de raı́ces unitarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 57 6. Estimación de modelos de factores comunes 6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2. Estimación de modelos con tendencias comunes . . . . . . . . . . . . . 6.2.1. Maximización de la función de verosimilitud espectral del modelo 6.2.2. Método de estimación basado en el modelo de correción de error 6.3. Est. de mod. con factores comunes estacionales . . . . . . . . . . . . . 6.3.1. Maximización de la función de verosimilitud espectral del modelo 6.3.2. Método basado en el modelo de corrección de error . . . . . . . 6.3.2.1. Estimación . . . . . . . . . . . . . . . . . . . . . . . 6.3.2.2. Estimación de factores completos . . . . . . . . . . . 61 61 62 62 65 68 68 69 75 77 7. Indicadores económicos 7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2. Modelo teórico . . . . . . . . . . . . . . . . . . . . . . . . 7.3. Indicadores cı́clicos . . . . . . . . . . . . . . . . . . . . . . 7.3.1. Cointegración en sistemas de indicadores . . . . . . 7.3.2. Análisis de los indicadores de la Economı́a Española 7.3.2.1. Punto de partida . . . . . . . . . . . . . . 7.3.2.2. Estudio de cointegración . . . . . . . . . 7.3.2.2.1. El ciclo de referencia. . . . . . . 7.3.2.2.2. Indicadores adelantados . . . . . 7.3.2.2.3. Indicadores retrasados . . . . . . 7.3.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . 7.4. Indicadores de producción . . . . . . . . . . . . . . . . . . 7.4.1. Cointegración completa . . . . . . . . . . . . . . . 7.4.2. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 81 81 82 83 85 86 86 88 88 98 101 103 104 106 112 8. Conclusiones 115 A. Los datos 119 B. Gráficos 121 Capı́tulo 1 Introducción Los objetivos principales de los distintos métodos de análisis de series económicas temporales son: en primer lugar, explicar el comportamiento que históricamente han seguido los valores observados de las series, y en segundo lugar, obtener predicciones para valores futuros de dichas series. Para llevar a cabo tanto el primer como el segundo objetivo, es importante realizar una observación detallada de cada una de las series de interés. La observación de series económicas proporciona una información que, más tarde, será utilizada de forma diferente por cada uno de los distintos métodos de series temporales (modelos ARIMA, modelos estructurales, etc) con vistas a conseguir alguno de los objetivos anteriormente citados (o ambos). El presente trabajo se va a centrar en series de datos temporales recogidos a intervalos de tiempo inferiores al año, tomando como referencia, mientras no se mencione expresamente lo contrario, el perı́odo mensual. La inspección visual de muchas series económicas temporales suele llevar a varias conclusiones: por un lado, es frecuente que sus medias no sean constantes en el tiempo, sino que muestren alguna tendencia (casi siempre creciente), y por otro lado, si las series son mensuales o trimestrales, suelen presentar un comportamiento de tipo “periódico” donde picos y valles se presentan “casi en los mismos perı́odos” cada año; esto se conoce como estructura estacional. En la literatura de series temporales se suele considerar que las series de datos de perı́odo inferior al año, están formadas por varios componentes, que normalmente se resumen en tres: componente de tendencia, componente estacional y componente irregular1 . El componente de tendencia recoge las fluctuaciones de largo plazo, incluyendo también las variaciones debidas a los ciclos económicos (o ciclos de negocios) si es que existen en la serie. El componente estacional recoge la evolución de la serie que es motivada por los ciclos de frecuencias estacionales. Estos ciclos, normalmente se atribuyen a la influencia de factores fı́sicos (clima, etc) o factores de tipo sociológico (costumbres) y, en cualquier 1 Algunos autores además mencionan un componente cı́clico, pero aquı́ este componente se considerará incorporado dentro de la tendencia (Uriel (1985), pág. 16) 5 6 CAPÍTULO 1. INTRODUCCIÓN caso son ciclos de perı́odo corto, aunque pueden ser permanentes a largo plazo. El componente irregular refleja las variaciones no sistemáticas de la serie, que se suponen aleatorias y no predecibles. El comportamiento del componente de tendencia de una serie temporal ha sido ampliamente estudiado (Ver Fuller, 1976; Nerlove, Grether y Carvalho, 1979; Harvey, 1981, 1985, 1989, ,... etc). Al principio, el interés estuvo en la estimación de los componentes de tendencia como estructuras deterministas; para ello se utilizaron diversos métodos, siendo uno de los más aceptados el que considera como regresor a la variable tiempo (ver p.ej Uriel, 1985). Este método se basa en el teorema de aproximación de Weierstrass, por el cual cualquier función continua definida sobre un intervalo compacto en la recta real, puede ser uniformemente aproximado mediante un polinomio. Más adelante se aceptaron modelizaciones con componentes estocásticos, en algunos modelos de forma implı́cita (modelos ARIMA y ARIMA estacionales) y en otros de forma explı́cita (modelos UCARIMA y estructurales estocásticos). El primer objetivo planteado al iniciar el presente trabajo fue el estudio sobre cointegración y factores de tendencia comunes aplicado a una clasificación de indicadores económicos del ciclo de negocios realizada comparando los puntos crı́ticos (máximos y mı́nimos locales) de una amplia gama de indicadores de la economı́a, respecto a un indicador de referencia que supuestamente refleja las variaciones cı́clicas de la actividad económica en España. Se toma como base la clasificación realizada por (Fernández Macho, 1991). Hay que señalar que al inicio de este trabajo no habı́an llegado a mi conocimiento la mayor parte de los trabajos sobre cointegración estacional y raı́ces unitarias estacionales que ahora, a la finalización del mismo, se encuentran publicados y disponibles. En unos casos esto se debe a que su publicación ha sido bastante reciente, por ejemplo: Hylleberg, Engle, Granger y Yoo (1990), Granger (1991), Lee (1992), etc; y en otros casos debido al retraso en recibir la información (Por ejemplo, Engle, Granger y Hallman, 1989). Ası́ que la primera dificultad que se ha tenido que afrontar es el hecho de que toda la literatura conocida, en un principio, sobre cointegración, estaba basada en la frecuencia cero y por lo tanto debı́a aplicarse a datos anuales o desestacionalizados. Sin embargo, en los últimos tiempos se ha producido bastante literatura en contra de los procedimientos habitulaes de desestacionalización (P.ej.: Maravall, 1992), y si se desea trabajar con indicadores cı́clicos el perı́odo de referencia ha de ser el mensual. En concreto, para desarrollar el trabajo que nos habı́amos planteado se deberı́a trabajar incluso con las mismas series de datos (mensuales) que (Fernández Macho, 1991) utilizaba. Solamente dos de los contrastes de raı́ces unitarias disponibles2 tenı́an en cuenta la posibilidad de que las series presentaran raı́ces unitarias estacionales, pero en los dos se contrastaba simultáneamente una raı́z unitaria en la frecuencia cero (ver secciones 4.4.1 y 4.4.2). De ahı́ viene el interés por el contraste del estadı́stico F desarrollado en el capı́tulo 4, en el cual bajo la hipótesis nula se contempla una raı́z unitaria en cada frecuencia estacional sin imponer necesariamente una raı́z unitaria en la frecuencia cero. La aparición del artı́culo de Hylleberg et al (1990) ha arrojado nueva luz sobre la manera de contrastar la existencia de raı́ces unitarias en una serie temporal. En dicho 2 Contrastes de (Hasza y Fuller, 1982) y (Dickey et al, 1984). 7 trabajo (ver sección 4.4.4) el interés se centra en el contraste de cada una de las raı́ces unitarias por separado. El conocimiento del artı́culo presentado por (Engle et al, 1989) nos llevó a una solución al problema estacional, planteando la hipótesis de cointegración estacional en nuestros modelos y al estudio de los modelos con factores comunes estacionales, siendo estos factores series temporales con una raı́z unitaria en cada frecuencia estacional. Si los factores comunes a un conjunto de series dado son de este tipo, cada una de las series contendrá también una raı́z unitaria en cada frecuencia estacional y por tanto, para este tipo de series cobra especial interés el contraste del estadı́stico F descrito en el capı́tulo 4, en detrimento de otro tipo de contrastes no diseñados especı́ficamente para la hipótesis nula de que todas las raı́ces estacionales son unitarias. Por otra parte, Stock y Watson (1988) han demostrado la equivalencia entre un modelo multivariante cointegrado en la frecuencia cero y un modelo de tendencias comunes. Intuitivamente, es fácil comprender que en el componente estacional ha de ocurrir algo parecido. Tomando como base la demostración de Stock y Watson es sencillo demostrar que si un vector presenta cointegración en una determinada frecuencia estacional existirá un modelo con factores comunes integrados en dicha frecuencia que lo represente, y viceversa. Sin embargo, cuando se consideran simultáneamente varias frecuencias estacionales, el resultado no se comprueba de forma tan simple. En la sección 3.3.2 se demuestra la equivalencia entre un modelo cointegrado estacional y uniformemente (con los mismos vectores cointegrantes en todas las frecuencias estacionales) y un modelo de factores estacionales comunes, donde dichos factores presentan una raı́z unitaria en cada frecuencia estacional. El capı́tulo 6 trata sobre la estimación de modelos de factores comunes. Fernández Macho (1986) propuso un método basado en la utilización del criterio de máxima verosimilitud en el dominio de la frecuencia, que antes ya se habı́a aplicado a la estimación de los modelos estructurales univariantes3 . Sin embargo, el método de estimación propuesto por Gonzalo y Granger (1991) permite una estimación de las tendencias comunes computacionalmente más rapida (y de más sencilla programación). La estimación de modelos con factores estacionales comunes se puede realizar mediante la extensión del procedimiento de Fernández, que él mismo presenta en el citado trabajo. En la sección 6.3.2 se plantea una adaptación del procedimiento de Gonzalo y Granger para la estimación de un modelo en el que los factores comunes presentan raı́ces unitarias en todas las frecuencias estacionales. Dicho procedimiento se puede extender directamente para la estimación de factores comunes que, además de las raı́ces unitarias estacionales, contengan una raı́z unitaria en la frecuencia cero. Este método presenta aún más rapidez computacional respecto al de Fernández (1986) en la estimación de los factores comunes estacionales. Disponer de una estimación de los factores comunes de un modelo permite efectuar un análisis detallado de los mismos. La aplicación de modelos de factores comunes y su estimación puede ser de utilidad en diversos campos. En el contexto de indicadores cı́clicos, es interesante la obtención de los factores comunes a varias series, para realizar el análisis del comportamiento común de todo el conjunto. Es posible plantear una 3 Harvey y Peters (1990). 8 CAPÍTULO 1. INTRODUCCIÓN interpretación de dichos factores como indicadores sintéticos de actividad, cuando las series que intervienen en el modelo son indicadores coincidentes en el con el ciclo, o indicadores sintéticos adelantados, cuando en el modelo intervienen indicadores adelantados respecto al ciclo. Si en un determinado vector de series temporales se detectan factores de tendencia común y factores comunes estacionales (o factores completos que contengan los dos componentes) el estudio de dichos factores permitirá obtener conclusiones acerca de la tendencia, o del componente estacional respectivamente, de todo el conjunto. El trabajo se ha desarrollado de la siguiente forma: En el Capı́tulo 2 se presentan las caracterı́sticas fundamentales de los modelos de factores comunes, considerando tanto factores de tendencia como estacionales. El Capı́tulo 3 analiza la relación entre el concepto de cointegración y los modelos de factores comunes, tanto en la frecuencia cero como en las frecuencias estacionales. En el Capı́tulo 4 se hace una revisión de los principales contrastes de raı́ces unitarias y cointegración, considerando en primer lugar los contrastes relativos a la frecuencia cero y después los contrastes de raı́ces unitarias estacionales. En el Capı́tulo 5 se presentan dos métodos para el contraste de la hipótesis de existencia de una raı́z unitaria en cada frecuencia estacional. Se incluyen las respectivas pruebas sobre la potencia de los mismos. El Capı́tulo 6 revisa los métodos de estimación de modelos con factores comunes. Se incluyen dos métodos para la estimación de modelos con tendencias comunes (Fernández Macho, 1986; Gonzalo y Granger, 1991), se describe el método propuesto también por Fernández Macho (1986) para estimar modelos con factores estacionales y se propone una extensión del método de Gonzalo y Granger para efectuar la estimación de este tipo de modelos. En el Capı́tulo 7 se presentan dos aplicaciones de los modelos de factores comunes a series económicas. La primera de ellas se basa en una clasificación de los indicadores cı́clicos en función de su comportamiento respecto al ciclo económico, tratando de extraer los factores comunes de series que sean del mismo tipo en cuanto a su retraso o adelanto respecto al ciclo. En la segunda se tratan de extraer los componentes permanentes comunes de diversos indicadores de producción. Capı́tulo 2 Modelos de factores comunes 2.1. Introducción En Economı́a es muy frecuente que las series de datos temporales sean no estacionarias. En la mayorı́a de los casos se observa que las series no son estacionarias en media y, muchas veces, tampoco lo son en varianza. Siguiendo la metodologı́a del análisis ARIMA clásico (Box y Jenkins, 1970) la transformación más utilizada para este tipo de series es la toma de diferencias. Tomando diferencias sobre las series no estacionarias se suele conseguir estacionariedad, sin embargo, al tomar diferencias se pierde la estructura de largo plazo de las series, quedando sólo en ellas el componente transitorio. Cuando se comparan gráficamente varias series temporales económicas, algunas veces se puede apreciar que la trayectoria de largo plazo de distintas variables parece seguir una evolución con reacciones simultáneas a lo largo del tiempo, es decir, una evolución común. Al observar la tendencia de las series, algunos investigadores pensaron en la posibilidad de que exista algún motivo por el cual las tendencias de distintas series puedan presentar una evolución común. Estas ideas, por una parte, han llevado a proponer modelos con factores de tendencia común (Stock y Watson, 1988; Fernández Macho, 1986; Fernández Macho, Harvey y Stock, 1987) y, por otra parte, han llevado a formular definiciones como las de paralelismo (Raveh, 1989) o cointegración de series temporales (Engle y Granger, 1987). De la misma manera en que se ha apreciado la posibilidad de que distintas series económicas presenten caracterı́sticas comunes en su tendencia, también se puede pensar que los componentes estacionales de diferentes series pueden estar influenciados por los mismos impulsos. Ası́, la idea de cointegración estacional que ha sido ya planteada por Engle, Granger y Hallman (1989), refleja la posibilidad de que los componentes estacionales de distintas series guarden una relación de carácter permanente a lo largo del tiempo. Una forma más explı́cita de considerar este fenómeno es mediante un modelo con factores comunes estacionales, que podrı́a ser1 : 1 Este es un caso particular del modelo presentado por Fernández Macho (1986) y también del recientemente comentado por Granger (1991) 9 10 CAPÍTULO 2. MODELOS DE FACTORES COMUNES yt n×1 S(L) st k×1 = = A st n×k k×1 + εt (2.1) n×1 ωt k×1 (2.2) donde: S(L) = (1 + L + L2 + · · · + LS−1 ), siendo L un operador de retardos, tal que L xt = xt−1 ; S es la periodicidad estacional. Por ejemplo, S = 12 si la serie es mensual; yt es el vector que contiene las observaciones t-ésimas de cada una de las n series temporales que interesa analizar. st es un vector formado por k factores estacionales comunes a las n series. Se supone k < n. A es la matriz de pesos de los factores. εt y ωt son dos vectores de n y k variables aleatorias, tales que: εt Σε 0 ∼ N ID 0, ωt 0 Σω (2.3) En este modelo los componentes estacionales de las n series que forman el vector yt resumen o aglutinan su estructura en torno a sólo k factores de tipo puramente estacional. En los siguientes apartados del presente capı́tulo se van a revisar las caracterı́sticas fundamentales de los modelos de tendencias comunes (2.2), se van a estudiar los modelos de factores estacionales comunes (2.3), incluyendo el que aquı́ se ha propuesto, y finalmente se van a estudiar los modelos que presentan factores estacionales y tendencias comunes conjuntamente (2.4). 11 2.2. MODELOS DE TENDENCIAS COMUNES 2.2. Modelos de tendencias comunes Dada la estructura del componente de tendencia de las series temporales, algunos autores pensaron en la posibilidad de que distintas series presenten caracterı́sticas comunes en sus tendencias. Ası́ investigadores como Stock y Watson (1988), Fernández Macho et al (1987) y Fernández Macho (1986) han formulado modelos con factores de tendencia común. Box y Tiao (1977, pág 362) comentan que si se trabaja con un vector de series no estacionarias, diferenciarlas a todas ellas puede no ser lo más adecuado si es sólo un pequeño conjunto de factores no estacionarios el que origina la estructura dinámica a largo plazo de los datos. Sin embargo, un modelo de análisis factorial dinámico puede tratar con series no estacionarias de manera bastante obvia. Puede plantearse un modelo de la forma: yt n×1 = A µt n×k k×1 + εt t = 0, . . . , T. (2.4) n×1 (2.5) µt = µt−1 + β + ηt con εt ηt ∼ N ID 0, Σε 0 0 Ση , (2.6) donde µt es el vector que contiene los k factores comunes, A es la matriz de pesos de los factores, β es el vector de pendientes de los factores y εt y ηt son vectores de variables aleatorias estacionarias. Aquı́ los factores comunes (µt ) se modelan especı́ficamente como paseos aleatorios con rumbo, de forma que se pueden interpretar como tendencias lineales comunes. Dado que µt es de dimensión k, éste es el número de tendencias comunes en el modelo. Como se puede apreciar, el modelo descrito en (2.4-2.5) no es identificable, ya que mediante cualquier matriz P de orden k × k no singular pueden redefinirse la matriz A y los componentes de tendencia µt como A P −1 y P µt de manera que sigue cumpliendose la ecuación (2.4) del modelo. En otras palabras, hay un número infinito de conjuntos de parámetros para los cuales el modelo generarı́a idénticas series {yt } y, por tanto, es necesario elegir un miembro dentro de cada clase de equivalencia de manera que pueda estimarse la estructura del modelo. Para que (2.4-2.5) sea identificable es necesario imponer restricciones sobre Ση y A. Hay muchas formas de hacerlo, Fernández Macho (1986) y Fernández Macho et al (1987) proponen construir Ση de forma que sea una matriz diagonal y que A esté formada por las primeras k columnas de una matriz triangular hacia abajo, es decir: A = (aij | aij = 0 para i < j y aii = 1) (2.7) 12 CAPÍTULO 2. MODELOS DE FACTORES COMUNES La primera de estas restricciones no es demasiado fuerte, implica que los k factores de tendencia comunes han de ser ortogonales entre sı́. Esta es una condición que se suele exigir en cualquier modelo de factores comunes no observables, ya que significa que la información que recoge cada uno de los factores es independiente de la que aportan los demás. La ecuación (2.5) propone un término de tendencia estocástica que es un paseo aleatorio con rumbo β. Esto significa que cada una de las series que forman el vector yt , diferenciada una vez, es igual a una constante más un proceso estacionario. Un caso particular se produce cuando β = 0, esto significa que la tendencia es solamente un paseo aleatorio. En este caso el modelo quedarı́a: yt n×1 = A µt n×k k×1 + εt t = 0, . . . , T. (2.8) n×1 (2.9) µt = µt−1 + ηt con εt ηt ∼ N ID 0, Σε 0 0 Ση . La ecuación (2.5) puede generalizarse de manera que la tendencia recoja alteraciones estocásticas tanto en su nivel como en su pendiente, para ello sólo habrı́a que modificarla e incluir otra ecuación que determine el cambio en las pendientes (Theil y Wage, 1964), quedando ası́ el modelo: yt n×1 = A µt n×k k×1 + εt t = 0, . . . , T. (2.10) n×1 µt = µt−1 + β + ηt (2.11) βt = βt−1 + ξt (2.12) con εt Σε 0 0 ηt ∼ N ID 0, 0 Ση 0 , ξt 0 0 Σξ siendo βt la pendiente de los factores, que ahora es estocástica puesto que contiene un término de perturbación aleatoria que es ξt . 13 2.3. MODELOS DE FACTORES ESTACIONALES COMUNES 2.3. Modelos de factores estacionales comunes Como ya se ha mencionado en la introducción del capı́tulo, al igual que se puede postular la existencia de tendencias comunes entre diversas series, se puede pensar en la existencia de componentes estacionales comunes a varias series. Una posible forma de recoger este comportamiento es por medio del análisis factorial dinámico, construyendo un modelo donde los factores comunes sean de tipo estacional. Esto se puede hacer de diversas formas. Por ejemplo, supongamos que yt es un vector compuesto por n series temporales sin tendencias, pero que siguen un comportamiento estacional común, se puede diseñar un modelo como el propuesto en la introducción de este Capı́tulo: yt n×1 = A st n×k k×1 (2.13) + εt n×1 (2.14) S(L) st = ωt donde: S(L) = (1 + L + L2 + · · · + LS−1 ); S es la periodicidad estacional. Por ejemplo, S = 12 si la serie es mensual; st es un vector formado por k factores estacionales comunes a las n series. Se supone que k < n. εt y ωt son dos vectores de n y k variables aleatorias, tales que: εt ωt ∼ N ID 0, Σε 0 0 Σω . (2.15) Igual que ocurrı́a en los modelos de tendencias comunes, este modelo no es identificable ya que la matriz A y el vector st no están unı́vocamente determinados. Para que el modelo esté identificado se pueden añadir las mismas restricciones que se utilizan en los modelos de tendencias comunes. En este caso se pueden concretar en la restricción (2.7) y en que los k factores sean ortogonales, de forma que Σω sea una matriz diagonal. En este caso, el filtro S(L) se ha utilizado para definir el comportamiento de los k factores estacionales. La estructura de este filtro implica que, con datos mensuales (S = 12), cada uno de esos factores presenta 11 raı́ces unitarias estacionales. Por lo tanto, cada uno de estos factores seguirá un fuerte comportamiento estacional. Para definir el comportamiento de los factores, se podrı́an haber propuesto otros tipos de filtros estacionales, pero no se ha encontrado a priori ningún motivo para inclinarse por otro filtro y el que aquı́ se ha utilizado ha sido considerado en muchos trabajos anteriores como filtro estacional (Unas veces explı́citamente y otras de forma implı́cita al utilizar ∆S = [1 − LS ]) y tiene la ventaja de permitir las comparaciones de resultados. 14 CAPÍTULO 2. MODELOS DE FACTORES COMUNES Además, la definición de los factores se ha hecho de manera que refleja un comportamiento puramente estocástico, es decir, no incluye una parte determinista2 . Si se desea introducir una parte determinista en la estructura de los factores estacionales, una forma de hacerlo es incluir S variables ficticias en la segunda ecuación del modelo y añadir una restricción sobre los coeficientes: S(L) st = S X γj Djt + εt (2.16) γj = 0 (2.17) j=1 con S X j=1 La restricción (2.17) es necesaria, ya que si no se considerara, la suma de los componentes estacionales deterministas serı́a distinta de cero y, por tanto, existirı́a una tendencia determinista, cuando al principio se ha supuesto que los componentes del vector yt no tienen tendencia. 2 Lo mismo ocurre en el modelo de tendencias comunes cuando β = 0. 15 2.4. MOD. DE TENDENCIAS Y FACTORES ESTAC. COMUNES 2.4. Modelos de tendencias y factores estacionales comunes Si se tiene en cuenta la posibilidad de presentar factores comunes en la tendencia y en el componente estacional, se puede plantear el siguiente modelo3 : yt n×1 = A µt n×k k×1 + B st n×mm×1 + εt (2.18) n×1 S(L) st = ωt µt = µt−1 + β + ηt (2.19) (2.20) donde: β es un vector de constantes. Cada elemento de µt es un componente de tendencia que sigue un paseo aleatorio con rumbo. A es la matriz de ponderaciones de los factores de tendencia. st es un vector que recoge los m factores estacionales. B es la matriz de pesos de los factores de estacionales. εt , ωt y ηt son vectores de variables aleatorias de dimensiones n, m y k respectivamente, tales que: εt Σε 0 0 ωt ∼ N ID 0, 0 Σω 0 . ηt 0 0 Ση Este modelo es una generalización del propuesto por Fernández Macho (1986), donde ahora se permite que la matriz de ponderaciones de los factores de tendencia sea distinta de la matriz de pesos de los factores estacionales. Para que el modelo esté identificado es necesario imponerle algunas restricciones: una posibilidad es construir la matriz A de forma que esté constituı́da por las primeras k columnas de una matriz triangular hacia abajo y la matriz B por las m primeras columnas de una matriz triangular hacia abajo. Si además se supone que todos los factores son ortogonales entre sı́, se tendrá que Ση y Σω son matrices diagonales, y ası́ el modelo será identificable. Si se desea permitir que la pendiente de la tendencia cambie de manera aleatoria a lo largo del tiempo, se debe incluir una ecuación más en el modelo quedando de la forma: 3 Granger (1991) menciona un modelo similar a este aplicado a un problema bivariante. 16 CAPÍTULO 2. MODELOS DE FACTORES COMUNES yt n×1 = A µt n×k k×1 + B st n×mm×1 + εt µt = µt−1 + βt + ηt (2.22) βt = βt−1 + ξt (2.23) (2.24) S(L) st = ωt con (2.21) n×1 εt Σε 0 0 0 ηt 0 Ση 0 0 ξt ∼ N ID 0, 0 0 Σξ 0 ωt 0 0 0 Σω . Capı́tulo 3 Cointegración y factores comunes 3.1. Introducción Cuando se analiza a lo largo del tiempo la evolución de una variable determinada, se suelen apreciar movimientos notables en su trayectoria. Sin embargo, si se consideran dos series temporales, algunas veces se puede esperar que no difieran o se aparten demasiado la una de la otra. La teorı́a económica suele proponer modelos en los que se recogen las fuerzas que se activan para que las series se mantengan unidas. Es fácil encontrar ejemplos, como: tipo de interés a corto y a largo plazo, renta disponible y gasto de las economı́as domésticas, precios del mismo bien en diferentes mercados, o precios de bienes sustitutivos en el mismo mercado, etc. Engle y Granger (1987) intentaron formalizar la idea de equilibrio1 entre distintas series económicas, introduciendo el concepto de cointegración entre series temporales. A partir de este artı́culo el desarrollo de la teorı́a sobre series cointegradas ha sido vertiginoso. Una de las cuestiones derivada de estos trabajos, que ha ido desarrollándose hasta la actualidad, ha sido la de integración y cointegración en diferentes frecuencias, con especial énfasis en las frecuencias estacionales. A este respecto, merece la pena resaltar los trabajos de Engle, Granger y Hallman (1989) (EGH), Lee (1992) y el de Hylleberg, Engle, Granger y Yoo (1990) (HEGY). En el trabajo de EGH se establecen las definiciones de integración y cointegración en diferentes frecuencias, ası́ como una serie de propiedades para los estimadores de Mı́nimos Cuadrados Ordinarios (MCO) de las ecuaciones cointegrantes, tanto de la frecuencia cero como de las frecuencias estacionales. Por otro lado, el artı́culo de HEGY (1990) establece un método para contrastar la existencia de raı́ces unitarias en las frecuencias estacionales que tiene la particularidad 1 El término equilibrio tiene muchos significados en Economı́a y su uso en la literatura sobre cointegración es muy distinto de la mayorı́a de los usos que se le asignan en la Teorı́a Económica. En la literatura de cointegración la existencia de equilibrio entre un conjunto de series significa que existe una relación observada que se mantiene durante un largo perı́odo de tiempo. Esto no conlleva ninguna de las implicaciones teóricas habituales, como el vaciado de mercados o el pleno empleo ni implica que el sistema haya llegado al estado estacionario. 17 18 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES de servir para hacer contrastes en cada una de las frecuencias por separado. Es importante también señalar la existencia de otro tipo de modelos, los modelos de factores comunes (de los cuales se ha hablado ampliamente en el capı́tulo anterior) que se ha demostrado que están ı́ntimamente relacionados con el concepto de cointegración. Se ha demostrado (Stock y Watson, 1988; King, Plosser, Stock y Watson, 1987) que si un conjunto de series están cointegradas (en la frecuencia cero) entonces tienen tendencias comunes (y viceversa). Tomando esto como base, uno de los objetivos de este capı́tulo será comprobar si ocurre lo mismo en las frecuencias estacionales, es decir, demostrar que cuando un conjunto de series están cointegradas estacionalmente, tienen factores estacionales comunes (y viceversa). Pero, antes de entrar en materia, se hace necesario presentar las definiciones de integración y cointegración, tanto en el sentido original de Engle y Granger como en diferentes frecuencias. En la sección 3.2 se presentan las definiciones fundamentales de la literatura sobre cointegración y cointegración estacional. En la sección 3.3 se estudia la relación entre el concepto de cointegración entre un conjunto de variables y el concepto de factor común (o factores comunes) tanto en el componente de tendencia como en el estacional. 3.2. DEFINICIONES 3.2. 19 Definiciones Definición 1. (Engle-Granger, 1987) Se dice que una serie xt sin componente determinista es integrada de orden d y se denota xt ∼ I(d) si, después de diferenciarla d veces, se obtiene una serie con representación ARMA estacionaria e invertible. Entre las series que son I(0) y las series I(1) hay diferencias importantes. Engle y Granger mencionan que si xt es I(0) con media cero, entonces: 1. La varianza de xt es finita. 2. Una innovación tiene sólo un efecto transitorio sobre el valor de xt . 3. El espectro de xt , f (ω), tiene la propiedad de que 0 < f (0) < ∞. 4. La duración esperada de los intervalos entre cruces consecutivos de la serie con el eje x = 0 es finita. 5. Los coeficientes de autocorrelación, ρk , decrecen uniformemente en magnitud para valores de k suficientemente grandes, de manera que su suma es finita. Sin embargo, si xt es I(1) con x0 = 0, entonces: 1. La varianza de xt tiende a infinito cuando t tiende a infinito. 2. Una innovación tiene un efecto permanente sobre el valor de xt , ya que xt es la suma de todas las innovaciones anteriores. 3. El espectro de xt tiene aproximadamente la forma2 f (ω) = A ω −2 para valores pequeños de ω; esto implica que, en particular, f (0) = ∞. 4. El intervalo de tiempo esperado entre cruces consecutivos de la recta x = 0 es infinito. 5. Los coeficientes de correlación teóricos, ρk , tienden a uno, para todo k, cuando t tiende a infinito. Definición 2. (Engle y Granger, 1987) Los componentes del vector xt se dice que son cointegrados de órdenes d, b, y se denota xt ∼ CI(d, b), si: i) Todos los componentes de xt son I(d) y ii) existe un vector α (6= 0) tal que zt = α0 xt ∼ I(d − b), con b > 0. Al vector α se le denomina vector cointegrante. 2 La transformada de Fourier de (1 − L)d xt es f (ω) = c · (sen ω/2)−2d lo que, para valores pequeños de ω (sen ω/2 ≈ ω/2), da f (ω) = c/2 ω −2d . 20 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES Si se trabaja con series de datos recogidos a intervalos inferiores al año (p.ej. mensuales o trimestrales), suele hacer falta tomar un cierto número de diferencias de orden uno para conseguir hacerlas estacionarias, y de esta forma es fácil introducir inadvertidamente un componente de medias móviles no invertible en la representación de la serie. Hablando en el sentido de la definición 1 de Engle-Granger, las series de este tipo no serı́an integradas de ningún orden. Por ello se hace necesaria la introducción de nuevas definiciones, que sean aplicables a datos de periodicidad inferior al año y sirvan ası́ para aclarar este punto. Estas definiciones las aportan Engle et al (1989): Definición 3. (Engle, Granger y Hallman, 1989) Se dice que una serie xt es integrada de orden d en la frecuencia θ, y se denota xt ∼ Iθ (d), si xt tiene un espectro f (ω) que toma la forma: f (ω) = c(ω − θ)−2d (3.1) para valores de ω cercanos a θ. Definición 4. (EGH, 1989) Si la serie xt es generada por (3.2) S(L)dxt = C(L)t + µ 2 S−1 donde S(L) = (1 + L + L + · · · + L ) (3.3) y el espectro de C(L)t tiene una cota superior c, con 0 < c < ∞ para todas las frecuencias estacionales, entonces se dice que xt es integrada estacionalmente de orden d, con rumbo si µ 6= 0, y se denota xt ∼ SI(d). (También se suele llamar integración estacional uniforme). Definición 5. (EGH, 1989) Se dice que un vector xt , formado por series temporales, es cointegrado en la frecuencia θ si: a) Cada componente de xt es Iθ (d). b) Existe un vector αθ tal que zt = αθ0 xt es integrada de orden menor que d en la frecuencia θ. Como ayuda, para aclarar algunos detalles posteriores, se añade aquı́ la definición del concepto de cointegración estacional uniforme. Definición 6. Se dice que un vector xt formado por series temporales es estacional y uniformemente cointegrado, y se denota SC(d, b) si: Cada componente de xt es SI(d). Existe al menos un vector α∫ 6= 0 tal que zt = α∫0 xt es integrada estacionalmente (y uniformemente) de orden (d - b), con b > 0. Como se puede apreciar, la cointegración estacional uniforme supone que existe cointegración en cada una de las frecuencias estacionales y que el vector cointegrante αθ es el mismo para todas ellas. 3.3. RELACIÓN ENTRE COINTEGRACIÓN Y FACTORES COMUNES 3.3. Relación entre cointegración y factores comunes 3.3.1. Modelos con tendencias comunes 21 La relación entre el concepto de tendencia común y el de cointegración ha sido estudiada por King et al (1987); Stock y Watson (1988) y Fernández Macho (1986). Fernández Macho señala que un modelo de tendencias comunes como el descrito en el capı́tulo anterior, yt n×1 = A µt n×k k×1 + εt t = 0, 1, . . . , T. (3.4) n×1 (3.5) µt = µt−1 + β + ηt con εt ηt ∼ NID 0, Σε 0 0 Ση , (3.6) es adecuado cuando se consideran dos o más variables relacionadas de manera que evolucionan en forma similar a lo largo del tiempo. O, en otras palabras, parecen seguir tendencias comunes. Aunque separadamente cada una de estas series necesite ser diferenciada para transformarla en estacionaria, diferenciar una serie temporal múltiple como yt no será apropiado si se sospecha la existencia de factores comunes. En general, al hacer esto se impondrı́an más raı́ces unitarias de las necesarias sobre el vector yt y sólo se podrı́an estudiar las relaciones entre sus incrementos, mientras que se perderı́an, en gran parte, las relaciones entre los niveles de las series. Suponiendo que haya k tendencias comunes (con k < n) sólo deberı́an imponerse al vector y k raı́ces unitarias. Considérese el modelo (3.4-3.5); como la matriz de pesos A es de rango completo (k), si denominamos à a la matriz complemento ortogonal de A en una base de Rn , à también será de rango completo (n − k) y sus columnas serán ortogonales a las de A, es decir: Ã0 A = 0. Entonces, si se multiplica la ecuación (3.4) por Ã: Ã0 yt = Ã0 εt = νt para t = 0, 1, . . . , T. (3.7) donde νt ∼ NID(0, Ã0 Σε Ã) Esto significa que existen n − k combinaciones lineales de las variables observadas, para las cuales los componentes de tendencia se cancelan; aún cuando cada uno de los n elementos del vector yt tiene una raı́z unitaria (en la frecuencia cero). En los términos de la definición 2 de Engle y Granger, esto significa que las variables que forman el vector 22 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES yt están cointegradas y los vectores cointegrantes son, precisamente, las n − k filas de la matriz Ã0 . En este caso, esto implica que las series que constituyen el vector yt en (3.4) son cointegradas de órdenes (1, 1), C(1, 1). La inversa también es cierta. King et al (1987) y Stock y Watson (1988) han demostrado que los datos generados por un proceso yt multivariante cointegrado, con n − k vectores cointegrantes linealmente independientes, pueden ser representados como combinaciones lineales de k variables con tendencia (paseos aleatorios) más n − k variables estacionarias. 3.3.2. Modelos con factores comunes estacionales Sea yt un vector compuesto por n series temporales que siguen un modelo de factores comunes de la forma: yt n×1 = A st n×k k×1 + εt (3.8) n×1 (3.9) S(L) st = ωt donde: st es un vector formado por k factores estacionales comunes a las n series. Se supone que k < n. S(L) es el operador definido en (3.3); A es la matriz de pesos de los factores (de rango k), εt es un vector de variables aleatorias NID(0, Σε ) y ωt es un vector NID(0, Σω ) De aquı́ en adelante, supondremos que se cumplen las restricciones de identificación señaladas en (2.7). Proposición 1. Sea yt = (y1t , . . . , ynt )0 un vector formado por n series temporales. yt es cointegrado estacionalmente y únicamente de forma uniforme3 si y solo si el vector yt sigue una representación de factores comunes estacionales como la siguiente: yt n×1 = A st n×k k×1 S(L) st = ωt 3 + at (3.10) n×1 (3.11) Esto significa que es cointegrado estacionalmente sólo de manera uniforme, es decir, existe al menos un vector α∫ tal que α∫0 yt es SI(0) pero no existe ningún vector α que sea vector cointegrante sólo para algunas frecuencias. 3.3. RELACIÓN ENTRE COINTEGRACIÓN Y FACTORES COMUNES 23 siendo at y ωt procesos vectoriales independientes SI(0), es decir, procesos tales que su matriz de densidad espectral tiene determinante finito, no nulo, para las frecuencias estacionales. Demostración. (Condición suficiente) Si se multiplica la primera ecuación del modelo (3.10) por S(L), para cada uno de los componentes de yt se obtiene: S(L) yit = Ai ωt + S(L) ait i = 1, . . . , n. siendo Ai la fila i-ésima de la matriz A y ait el elemento i-ésimo del vector at . Supongamos que Ω es la matriz de varianzas y covarianzas de ωt . Dado que ωt es SI(0), vt = Ai ωt también es SI(0), su varianza es Ai ΩA0i y su función de densidad espectral fv (λ) toma valores no nulos (y finitos) para las frecuencias estacionales, es decir, para λ = 2πj/S con j = 1, . . . , S − 1. Por otra parte, como ait es un proceso SI(0), S(L) ait es un proceso con S − 1 raı́ces unitarias (correspondientes a las frecuencias estacionales) en su representación de medias móviles y, por tanto (Ver Lütkepohl, 1987, p.13) su función de densidad espectral fS(L)ai (λ) toma valor cero en cada una de estas frecuencias. Como consecuencia de todo esto, la función de densidad espectral de S(L) yit , que es: fS(L)yi (λ) = fv (λ) + fS(L)ai (λ) toma valores distintos de cero para las frecuencias estacionales, entonces el proceso S(L) yit no presenta raı́ces unitarias en su representación MA y, por tanto, es SI(0). Esto necesariamente implica que el proceso yit , ∀i : 1, . . . , n, es SI(1). Sea à una matriz complemento ortogonal de A en Rn , si se multiplica la ecuación (3.10) por la izquierda por la traspuesta de esta matriz, se obtiene Ã0 yt = Ã0 at = ut siendo ut un proceso SI(0). Por tanto, yt es un vector formado por n elementos que son SI(1), pero existen n − k combinaciones lineales de todos ellos Ã0 yt que son integradas de orden cero en su componente estacional. Por lo tanto, en este caso yt es cointegrado estacional y uniformemente SC(1, 1), y además los vectores cointegrantes son las n − k filas de la matriz Ã0 . Demostración. (Condición necesaria) Sea yt un vector (n × 1) de series temporales que es cointegrado estacional y uniformemente SC(1, 1), siendo r el rango de cointegración y α la matriz n × r que contiene como vectores columna los r vectores cointegrantes. Cada elemento de yt es SI(1), pero existen r combinaciones lineales de los elementos de yt que son SI(0). Siempre existe para yt una representación de Wold multivariante4 : S(L) yt = C(L) εt con ∞ X j |Cj | < ∞ (3.12) j=1 4 Ver Hannan (1970, p.66) o Engle y Granger (1987, p. 256) para el caso de cointegración en la frecuencia cero. 24 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES P∞ i donde C(z) = i=0 Ci z con C(0) = In (matriz identidad). εt es iid con media cero y matriz de varianzas y covarianzas G. Si λ1 , λ2 , . . . , λS−1 son las S − 1 raı́ces unitarias estacionales del polinomio S(L), entonces C(λ1 ), . . . , C(λS−1 ) son de rango5 k = n − r, igual para todas ellas. Si yt es SC(1, 1)6 , existe una matriz α de orden n × r tal que α0 C(λ1 ) = 0, α0 C(λ2 ) = 0, ..., α0 C(λS−1 ) = 0, es decir, C(λ1 ),..., C(λS−1 ) pertenecen al Ker(α0 ) (o espacio nulo de α0 ). Además, al ser k + r = n, las r columnas linealmente independientes de cualquiera de las matrices C(λj ), por ejemplo las de C(λ1 ), forman una base del espacio Ker(α0 ) y el resto de los C(λj ) se pueden expresar como combinaciones lineales de C(λ1 ), es decir: C(λ2 ) = C(λ1 ) B2 , C(λ3 ) = C(λ1 ) B3 , ··· C(λS−1 ) = C(λ1 )BS−1 (3.13) siendo B2 , . . . , BS−1 las matrices n×n de ponderaciones. Estas matrices no son únicas, pero siempre es posible elegir un grupo de matrices que presenten rango completo n. Por ejemplo, veámoslo para B2 . Como C(λ1 ) es de rango reducido k, se puede expresar como (Ver, por ejemplo Johansen, 1988): " # Ξ1 .. (3.14) C(λ1 ) = D Ξ1 = D . · Θ 0 1 n×k k×n n × (n − k) n×n teniendo D y Ξ1 rango k. Θ1 es una matriz cualquiera de orden (n − k) × n, entonces Ξ1 se puede seleccionar esta matriz de forma que tenga rango completo n. Dado Θ1 que los vectores columna de D forman una base del subespacio de Rn Ker(α0 ), C(λ2 ) se puede expresar: " # Ξ2 .. C(λ2 ) = D Ξ2 = D . · Θ (3.15) 0 2 n×k k×n n × (n − k) n×n donde Ξ2 también tiene rango k y Θ2 se puede elegir de manera que completo n. De la ecuación (3.14) se obtiene: " # −1 .. Ξ1 D . = C(λ1 ) 0 Θ1 n × (n − k) Ξ2 Θ2 tenga rango que sustituyendo en (3.15) queda: C(λ2 ) = C(λ1 ) 5 Ξ1 Θ1 −1 Ξ2 Θ2 Por el Teorema de Representación de Granger, sección 1 (Engle y Granger, 1987), perfectamente aplicable al caso estacional. 6 Por el mismo Teorema, sección 2. 3.3. RELACIÓN ENTRE COINTEGRACIÓN Y FACTORES COMUNES 25 −1 Ξ1 Ξ2 y tienen rango completo n, su producto también lo tieΘ1 Θ2 ne y, por tanto, hemos encontrado al menos una matriz con rango completo n, B2 = −1 Ξ1 Ξ2 · tal que C(λ2 ) = C(λ1 ) B2 . Θ1 Θ2 Lo mismo se puede hacer para el resto de las matrices de la expresión (3.13) de manera que dispongamos de un conjunto de matrices de ponderaciones B2 , ..., BS−1 todas ellas con rango n. PN Sea νt = G−1/2 εt y ξt = r=1 νSr+m , donde N es la parte entera de (t/S), es decir, el número de años transcurridos, y m = t − S N , o sea, un número entero m ∈ {0, 1, 2, . . . , S−1} que indica el perı́odo del año en que se encuentra la observación t. Supongamos, por convención (Ver Dickey y Fuller, 1979) que εj = 0 para j ≤ 0 y que yt tiene unos valores iniciales fijos y−(S−1) , y−(S−2) , . . . , y−1 , y0 . Sustituyendo recursivamente en (3.12) se obtiene: Dado que yt = y−m + C(L)(1 − L) N X (3.16) εSr+m r=1 C(L) se puede escribir como (Ver Hylleberg et al, 1990; Dolado, 1990): C(L) = C(λ1 ) z1 (L)/z1 (λ1 ) + C(λ2 ) z2 (L)/z2 (λ2 ) + · · · + +C(λS−1 ) zS−1 (L)/zS−1 (λS−1 ) + C ∗ (L)S(L) (3.17) donde λ1 , . . . , λS−1 son las S−1 raı́ces unitarias del polinomio S(L), zj (L) = S(L)/(1− (1/λj )L) para j = 1, . . . , S − 1 y C ∗ (L) tiene todas sus raı́ces estacionales fuera del cı́rculo unidad. Entonces, la ecuación (3.16) se puede escribir: yt = y−m +(1 − L) [C(λ1 ) z1 (L)/z1 (λ1 ) + C(λ2 ) z2 (L)/z2 (λ2 )+ + · · · + C(λS−1 ) zS−1 (L)/zS−1 (λS−1 )] G1/2 ξt + +(1 − LS )C ∗ (L) N X (3.18) εSr+m r=1 y, por tanto, teniendo en cuenta (3.13), yt = y−m + C(λ1 )(1 − L) M (L) G1/2 ξt + C ∗ (L) G1/2 νt (3.19) h i zS−1 (L) (L) z2 (L) siendo M (L) = zz11(λ I + B + · · · + B . 2 S−1 z2 (λ2 ) zS−1 (λS−1 ) 1) Como C(λ1 ) tiene rango k < n, esto implica que existe una matriz H1 de orden n × r y rango r tal que C(λ1 ) H1 = 0. Si H2 es una matriz n × k de rango k y columnas ortogonales a las de H1 , entonces A ≡ C(λ1 ) H2 tiene rango k. La matriz . H = (H1 .. H2) es no singular y multiplicándola por la izquierda por C(λ ) se obtiene: 1 . C(λ1 ) H = (0 .. A) = A Sk 26 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES siendo Sk la matriz de selección de orden (k × n): Sk = 0 .. . k × (n − k) La ecuación (3.19) se puede expresar: ! Ik k×k . yt = y−m + C(λ1 ) H H −1 (1 − L) M (L) G1/2 ξt + C ∗ (L) G1/2 νt (3.20) yt = y−m + A Sk H −1 (1 − L) M (L) G1/2 ξt + C ∗ (L) G1/2 νt , (3.21) y proporcionando una representación de factores estacionales comunes para yt que se puede escribir como: yt = β + A st + at (3.22) siendo β = y−m , st = Sk H −1 (1 − L) M (L) G1/2 ξt , y at = C ∗ (L) G1/2 νt Dada la estructura de st se cumple que N X st = Sk H −1 (1 − L) M (L) G1/2 νSr+m = = Sk H −1 (1 − L) M (L) G1/2 r=1 N −1 X νSr+m + r=1 +Sk H −1 (1 − L) M (L) G1/2 νt es decir, st = st−S + (1 − L)Sk H −1 M (L) G1/2 νt y, por tanto, S(L) st = ωt siendo ωt = Sk H −1 M (L) G1/2 νt . (3.23) Para demostrar que ωt es un proceso vectorial SI(0), desarrollaremos a continuación su matriz de densidad espectral. Como z1 (λ1 ), . . . , zS−1 (λS−1 ), términos que participan en M (L), son escalares, podemos redefinir las matrices B2 , . . . , BS−1 de manera que incluyan los términos 1/z2 (λ2 ), . . . , 1/zS−1 (λS−1 ) y definir ϑ = 1/z1 (λ1 ) y Ψ = Sk H −1 , la ecuación (3.23) queda entonces: ∗ ωt = Ψ ϑ z1 (L) In + z2 (L) B2∗ + · · · + zS−1 (L)BS−1 εt (3.24) 3.3. RELACIÓN ENTRE COINTEGRACIÓN Y FACTORES COMUNES 27 Sabemos, por hipótesis, que εt ∼ NID(0, G), por tanto, δ1t = Ψ ϑ εt ∼ NID 0, (ψ ϑ) G (ψ ϑ)0 y δjt = Ψ Bj∗ εt ∼ NID 0, (ψ Bj∗ ) G (ψ Bj∗ )0 para j = 2, . . . , S − 1. Las matrices de varianzas y covarianzas de δ1t , . . . , δS−1,t son todas definidas positivas ya que las Bj∗ tienen rango completo n, Ψ que es de orden (k × n) tiene rango k y las (ΨBj∗ ) = Sk H −1 Bj∗ también tienen rango k. La matriz de densidad espectral de εt es (Hannan, 1970): fε (λ) = (2π)−1 G por tanto, fδ1 (λ) = (2π)−1 (Ψ ϑ) G (Ψ ϑ)0 y fδj (λ) = (2π)−1 (Ψ Bj∗ ) G (Ψ Bj∗ )0 para j = 2, ..., S − 1. Tomando como base la ecuación (3.24) se puede obtener la matriz de densidad espectral de ωt : fω (λ) = (2π)−1 |z1 (e−iλ )|2 (Ψ ϑ) G (Ψ ϑ)0 + +|z2 (e−iλ )|2 (Ψ B2∗ ) G (Ψ B2∗ )0 + ········· ∗ ∗ +|zS−1 (e−iλ )|2 (Ψ BS−1 ) G (Ψ BS−1 )0 Para toda frecuencia estacional λj con j = 1, . . . , S−1, los polinomios |zı (e−iλ )|2ı6=j se hacen cero, pero el polinomio |zj (e−iλ )|2 es distinto de cero. Dado que todas las matrices de varianzas y covarianzas tienen rango completo, la asociada a δj también lo tiene y por tanto fω (λj ) tiene rango completo, lo cual implica (Ver Lütkepohl, 1987, p.13) que ω no presenta raı́z unitaria en la frecuencia λj para j = 1, . . . , S − 1 y, por tanto, ωt es SI(0). 3.3.3. Modelos con tendencias y factores estacionales comunes Sea yt un vector compuesto por n series temporales que siguen un modelo de tendencias y factores estacionales comunes de la forma: yt n×1 = A µt n×k k×1 + B st n×mm×1 µt = µt−1 + β + ηt k×1 S(L) st = ωt m×1 + εt (3.25) n×1 (3.26) k×1 (3.27) 28 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES donde ahora µt es un componente de tendencia que sigue un paseo aleatorio con rumbo, β es un vector de constantes y ηt es una variable aleatoria NID(0, Ση ). Multiplicando la ecuación (3.25) por S(L), para un elemento i cualquiera del vector yt se obtiene: S(L) yit = Ai S(L) µt + Bi ωt + S(L) εit = uit (3.28) siendo uit un proceso que no tiene raı́ces unitarias en las frecuencias estacionales [es SI(0)], por lo tanto, cada componente de yt es SI(1). Si se multiplica esa i-ésima ecuación por (1 − L): (1 − L) yit = Ai β + Ai ηt + Bi (1 − L) st + (1 − L) εit = rt (3.29) donde rt es un proceso sin raı́z unitaria en la frecuencia cero [I0 (0)], es decir, cada elemento de yt es I0 (1). Supongamos que à es una matriz complemento ortogonal de A y B̃ es un complemento ortogonal de B, esntonces, si se multiplica la ecuación (3.25) por la izquierda por Ã0 , se obtiene: Ã0 yt = Ã0 B st + Ã0 εt (3.30) donde st y, por tanto, Ã0 B st , es una variable que no tiene raı́ces unitarias en la frecuencia cero (sólo las tiene en las frecuencias estacionales) y Ã0 εt es un vector de variables aleatorias NID ∼ (0, Ã0 Σε Ã) estacionarias. Esto implica que Ã0 yt no tiene raı́ces unitarias en la frecuencia cero y, por tanto, el vector yt es cointegrado de tipo C(1, 1) en dicha frecuencia. Los vectores cointegrantes son las n − k filas de la matriz Ã0 . Si, en cambio, se multiplica la ecuación (3.25) por la izquierda por B̃ 0 se obtiene: B̃ 0 yt = B̃ 0 A µt + B̃ 0 εt . (3.31) En tal caso, se comprueba que B̃ 0 A µt tiene una raı́z unitaria que corresponde a la frecuencia cero, pero no tiene raı́ces unitarias en las frecuencias estacionales, y B̃ 0 εt es un vector de variables NID(0, B̃ 0 Σε B̃) estacionario. Por lo tanto, B̃ 0 yt no tiene raı́ces unitarias en las frecuencias estacionales [es SI(0)], lo cual implica que yt es un vector cointegrado SC(1, 1). En este caso los vectores cointegrantes son las n − m filas de la matriz B̃ 0 . En algunos casos, es posible conseguir cointegración simultánea en la frecuencia cero y en las frecuencias estacionales con los mismos vectores cointegrantes7 como se puede ver en la siguiente proposición. Proposición 2. (Condición para Cointegración completa) Sea el modelo definido por las ecuaciones (3.25), (3.26) y (3.27) y supongamos, sin pérdida de generalidad, que k ≥ m. Si existe una matriz C de orden (k × m) y de rango m tal que A · C = B, entonces hay cointegración completa. 7 Es lo que Granger (1991) denomina cointegración completa (Full cointegration). 3.3. RELACIÓN ENTRE COINTEGRACIÓN Y FACTORES COMUNES 29 Demostración. Supongamos que k ≥ m, si todas las columnas de la matriz B son combinaciones lineales de las columnas de la matriz A; es decir, si existe una matriz C tal que A · C = B, entonces al multiplicar la ecuación (3.25) por Ã0 se obtiene: Ã0 yt = Ã0 A µt + Ã0 B st + Ã0 εt = Ã0 A C st + Ã0 εt = Ã0 εt siendo Ã0 εt un vector NID ∼ (0, Ã0 Σε Ã) y, por tanto, sin raı́ces unitarias en la frecuencia cero ni en las estacionales. En este caso, el vector yt es cointegrado simultáneamente en la frecuencia cero y en las estacionales, los vectores cointegrantes son las n − k filas de la matriz Ã0 y son comunes a todas las frecuencias. 30 CAPÍTULO 3. COINTEGRACIÓN Y FACTORES COMUNES Capı́tulo 4 Contrastes de raı́ces unitarias y de cointegración 4.1. Introducción Las series de datos temporales, tanto ajustadas como no ajustadas estacionalmente, suelen ser no estacionarias. En los últimos años, muchos de los autores que analizan series temporales han centrado su atención en la estimación y contrastes de modelos paramétricos de procesos con tendencia. A lo largo de la última década se ha desarrollado de forma notable la literatura relacionada con los contrastes de raı́ces unitarias, contrastes de cointegración, factores comunes, etc. De manera que ahora se entienden mejor los efectos de las tendencias deterministas y estocásticas y se conocen algunas formas de tener en cuenta su influencia sobre la distribución de los parámetros estimados y los contrastes. La presencia de estacionalidad en las series de datos temporales tiene como consecuencia un conjunto de complicaciones añadidas. En los últimos años se está avanzando en temas básicos, como contrastes de no estacionariedad y tendencias comunes, en el contexto de procesos estacionales no estacionarios. La teorı́a sobre conjuntos de variables cointegrados ha relanzado el interés por los contrastes de raı́ces unitarias. Se suelen utilizar estos contrastes, en primer lugar, para determinar el orden de integración de cada variable y, en segundo lugar, para analizar los residuos de las ecuaciones cointegrantes, determinar su orden de integración y ası́ la existencia o no de cointegración en el conjunto de series estudiado. En el presente capı́tulo se lleva a cabo una revisión de los contrastes de raı́ces unitarias y de cointegración más utilizados. En la sección 4.2 se estudian los contrastes más clásicos de raı́ces unitarias en la frecuencia cero. En la sección 4.3 se comentan algunos contrastes de cointegración en dicha frecuencia, y en la sección 4.4 se analizan varios tipos de contrastes de raı́ces unitarias estacionales. 31 32 CAPÍTULO 4. CONTRASTES DE R.U. Y DE COINTEGRACIÓN 4.2. Contrastes de raı́ces unitarias en la frecuencia cero A partir de la aparición de los conceptos de integración y cointegración se apreció la necesidad de disponer de un contraste que ayude a decidir el orden de integración de una serie. A este respecto la propuesta de Engle y Granger fué utilizar los contrastes de Dickey y Fuller (1979). Aunque la literatura sobre contrastes de raı́ces unitarias ha avanzado enormemente desde entonces, aún ahora uno de los métodos de contraste más utilizados es el contraste de Dickey y Fuller aumentado (ADF). 4.2.1. Contrastes de Dickey y Fuller Dickey y Fuller (1979) analizan tres tipos de modelos: i) yt = α yt−1 + ut ii) yt = C + α yt−1 + ut iii) yt = C + β t + α yt−1 + ut Como se puede apreciar, el modelo i) no admite constante ni tendencia determinista, en el ii) sólo se admite la presencia de constante y en el iii) se admite una constante y una tendencia determinista lineal. Consideran, en los tres modelos, la hipótesis nula de que α = 1 y utilizan el estadı́stico t para efectuar el contraste (se le suele denominar estadı́stico DF). Dado que en las tres ecuaciones interviene una variable endógena retardada, que bajo la hipótesis nula presenta una raı́z unitaria, la distribución de ese estadı́stico no es una t de Student. Dickey y Fuller se encargan, por medio de simulaciones, de hallar los valores crı́ticos de la distribución empı́rica de este estadı́stico. Esos valores están recogidos en Fuller (1976, tabla 8.5.2, pág.373.). El estadı́stico DF calculado en cualquiera de las tres ecuaciones es válido cuando la alternativa es un modelo autorregresivo de orden uno estacionario y la hipótesis nula es un modelo como el i), ii) o iii) con α = 1. Sin embargo, cuando se espera que la serie contenga más de una raı́z unitaria, o la alternativa es un proceso AR de orden mayor que uno, o un proceso de medias móviles, el procedimiento aquı́ descrito no serı́a válido. Por ello, Dickey y Fuller consideran la posibilidad de que yt siga un proceso ARM A(p0 , q) estacionario e invertible. Teniendo en cuenta que todo proceso ARM A de este tipo puede ser aproximado mediante un proceso autorregresivo puro AR(p) de un orden p suficientemente elevado, postulan que: ut = p X δi yt−i + t (4.1) i=2 donde E(t ) = 0 y E(0 ) = σ 2 I. Se pueden reescribir, por tanto, los tres modelos considerados antes, de la siguiente 4.2. CONTRASTES DE RAÍCES UNITARIAS EN LA FRECUENCIA CERO 33 manera: i) yt = α yt−1 + p X δi yt−i + t i=2 ii) yt = C + α yt−1 + p X δi yt−i + t i=2 iii) yt = C + β t + α yt−1 + p X δi yt−i + t i=2 Para determinar el valor de p sugieren que se incluyan tantos retardos como sean necesarios para eliminar la autocorrelación. La hipótesis nula en estos modelos es que α = 1. Para contrastar esta hipótesis se utiliza el estadı́stico t pero, para facilitar los cálculos, se suele reparametrizar el modelo sustrayendo yt−1 en ambos lados de las ecuaciones, obteniendo: i) ∆yt = µ yt−1 + p X γi ∆yt−i + t (4.2) i=2 ii) ∆yt = C + µ yt−1 + p X γi ∆yt−i + t (4.3) i=2 iii) ∆yt = C + β t + µ yt−1 + p X γi ∆yt−i + t (4.4) i=2 Ahora la hipótesis nula, para cualquiera de los tres modelos, es µ = 0, y para contrastarla se utiliza el estadı́stico t muestral (que se suele denominar ADF, estadı́stico de Dickey-Fuller aumentado). La distribución del estadı́stico ADF es la misma que la del estadı́stico DF. Los valores crı́ticos están recogidos en la tabla que se encuentra en Fuller (1976, sec. 8.5.2, pág.373). Si el modelo que se considera adecuado es el i), los valores crı́ticos son los tabulados en la parte (a) de la tabla. Si es el ii), lo apropiado es utilizar la parte (b), y si el modelo considerado es el iii), los valores crı́ticos figuran en la parte (c) de la misma. 4.2.2. Contraste de Bhargava Bhargava (1986) desarrolla un contraste para la hipótesis nula de paseo aleatorio con rumbo. Este contraste es válido para muestras pequeñas. El modelo que considera bajo la hipótesis nula es: (4.5) yt = C + yt−1 + ut y el modelo alternativo es: yt = C + α yt−1 + ut con |α| < 1 (4.6) 34 CAPÍTULO 4. CONTRASTES DE R.U. Y DE COINTEGRACIÓN Bhargava define el estadı́stico R2 como: PT R2 = PT t=1 [(T t=1 (yt − yt−1 )2 − 1 T −1 (yT − y1 )2 − 1)yt − (t − 1)yT − (T − t)y1 − (T − 1) (ȳ − 0,5(y1 + yT ))]2 /(T − 1)2 Los valores crı́ticos de este estadı́stico al 5 % de significación se pueden encontrar en el artı́culo de Bhargava (1986, tabla 1, pág. 378). Bhargava comprueba que R2 es algo más potente que los contrastes de Dickey-Fuller. 4.2.3. Contrastes de Phillips Los contrastes desarrollados por Dickey y Fuller consideran que las innovaciones del modelo nulo pueden ser autorregresivas, y aportan una solución que valida la utilización de sus estadı́sticos en dicha situación. Estos autores, sin embargo, suponen homocedasticidad en las innovaciones, lo cual puede limitar la aplicabilidad de estos contrastes, ya que es más realista suponer que las perturbaciones pueden ser heterocedásticas. Phillips (1987) aporta una solución a este problema, desarrollando unos contrastes de raı́ces unitarias no paramétricos, en los que se permite que las innovaciones del proceso sean débilmente dependientes y heterogéneamente distribuı́das. En este sentido, los contrastes propuestos por Phillips gozan de una aplicabilidad más general que los de Dickey y Fuller. 4.3. Contrastes de Cointegración en la frecuencia cero Contrastar la existencia de un vector de cointegración entre un conjunto de variables equivale a contrastar la existencia de una raı́z unitaria en las perturbaciones de la ecuación cointegrante. Por lo tanto, se puede utilizar para ello cualquier contraste de raı́ces unitarias. La única diferencia estriba en que ahora se contrasta la presencia de una raı́z unitaria en una serie estimada (los residuos minimocuadráticos de la ecuación cointegrante), en lugar de en una serie observada. Por este motivo, los valores crı́ticos de este tipo de contrastes han de ajustarse al alza, ya que de otra forma el error de tipo I estarı́a exagerado. En la práctica, los contrastes de cointegración que más se suelen utilizar son el basado en el estadı́stico de Durbin y Watson [conocido como CRDW, Cointegrating regression Durbin-Watson. Durbin y Watson (1950)] (Ver también Sargan y Bhargava, 1983) y los contrastes de Dickey-Fuller en sus versiones simple y aumentada. Para un excelente resumen sobre estos contrastes de cointegración ver Dolado (1990). Johansen (1988) presenta un método, basado en el modelo de corrección de error, para contrastar la existencia de cointegración y decidir el número de vectores cointegrantes existentes entre un conjunto dado de series temporales. Por último hay que señalar que la literatura sobre contrastes de raı́ces unitarias ha evolucionado enormemente desde la aparición de los conceptos de integración y cointegración. A medida que avanza el tiempo van apareciendo métodos de contraste, cada vez 4.4. CONTRASTES DE R.U. EN LAS FRECUENCIAS ESTACIONALES 35 más refinados, con el objetivo de llenar las lagunas que los anteriores métodos tenı́an y de perfeccionarlos. En este sentido, es importante señalar la existencia de los estadı́sticos qcµ y qfµ de Stock y Watson (1988), basados en los modelos de tendencias comunes. Estos estadı́sticos tienen la ventaja de permitir la estructura tanto de procesos AR estacionarios como de medias móviles en las perturbaciones de la ecuación cointegrante, aparte de la posible raı́z unitaria. 4.4. Contrastes de raı́ces unitarias en las frecuencias estacionales. Utilizar series sin desestacionalizar complica los contrastes de raı́ces unitarias tradicionales para la frecuencia cero y, sin embargo, desestacionalizarlas es potencialmente peor, ya que si el componente estacional tiene raı́ces unitarias, el estimador de la tendencia y la serie ajustada estacionalmente son no invertibles y no aceptan una representación autorregresiva, como demuestra Maravall (1992). Cuando se desea contrastar la presencia de raı́ces unitarias en series que presentan estacionalidad, normalmente se suele centrar la atención sobre un proceso generador de datos caracterizado por una raı́z unitaria, posiblemente con rumbo, bajo la hipótesis nula y un proceso estacionario, o un proceso estacionario más una tendencia lineal determinista, bajo la alternativa. Para series estacionales hay cuatro tipos de procesos generadores de datos que se han utilizado con bastante frecuencia. Con datos mensuales se definen como sigue: (4.7) (1 − L)(1 − L12 ) yt = η1t 12 (1 − L ) yt = a0 + η2t 12 X s (1 − L) yt = δj Djt + η3t (4.8) (4.9) j=1 yt = a1 t + 12 X s δj Djt + η4t (4.10) j=1 Estas cuatro expresiones representan las caracterizaciones más utilizadas de series temporales no estacionarias con estacionalidad. El proceso de selección de modelos se enfrenta con varias dificultades. Casos especiales de (4.7) a (4.10) pueden presentar la misma estructura estocástica. Bell (1987) demuestra cómo cuando θ tiende a uno en la ecuación (1 − L)(1 − L12 ) yt = (1 − θL12 ) ηt en el lı́mite se obtiene un modelo del tipo (4.9) con δj 6= 0 ∀j y también, si θ tiende a uno en el modelo (1 − L12 )yt = (1 − θL12 ) ηt se obtiene un modelo del tipo (4.10) con a1 = 0 y δj 6= 0 ∀j. 36 CAPÍTULO 4. CONTRASTES DE R.U. Y DE COINTEGRACIÓN Ası́ que según una raı́z en la parte de medias móviles se acerca a la unidad, con una raı́z unitaria de la misma frecuencia en la parte autorregresiva, se llega a un proceso con estacionalidad determinı́stica. Se suelen aplicar argumentos similares, y quizás más conocidos, a las raı́ces de los polinomios autorregresivos, de forma que ası́ se distinguen las tendencias estocásticas de las determinı́sticas. En principio, los modelos (4.7), (4.8) y (4.9) tienen al menos una raı́z en la frontera del cı́rculo unidad. La mayorı́a de los contrastes considerados en la literatura utilizan el modelo (4.9) como hipótesis nula contra el (4.10) como alternativa (normalmente sin variables ficticias estacionales, ya que se utilizan datos no estacionales o ajustados estacionalmente). Como los modelos (4.7) y (4.8) tienen al menos una raı́z unitaria, se podrı́a, en principio, considerar la aplicación de tales contrastes para los datos generados por estos modelos, pero hay que señalar que aquı́ se violan las condiciones de regularidad de los contrastes usuales de raı́ces unitarias, ya que la presencia de raı́ces unitarias estacionales provoca inconsistencia en los estimadores de las ecuaciones (4.2) o (4.3) de Dickey-Fuller (Ver Engle et al, 1989, pág. 50). El polinomio (1 − L12 ) puede factorizarse como √ √ (1 − L)(1 + L)(1 + iL)(1 − iL) 1 + ( 3 + i)L/2 1 + ( 3 − i)L/2 √ √ √ √ 1 − ( 3 + i)L/2 1 − ( 3 − i)L/2 1 + (i 3 + 1)L/2 1 − (i 3 − 1)L/2 √ √ 1 − (i 3 + 1)L/2 1 + (i 3 − 1)L/2 (4.11) ası́ que cuando (4.7) o (4.8) son los verdaderos procesos generadores de los datos es inadecuado suponer bajo la hipótesis nula (4.9) que todas las raı́ces de la parte AR son estacionarias (y reales). Se han desarrollado contrastes especı́ficos para los modelos (4.7) y (4.8) por Hasza y Fuller (1982), Dickey, Hasza y Fuller (1984), Bhargava (1990), Osborn, Chui, Smith y Birchenhall (1988), además de Hylleberg, Engle, Granger y Yoo (1990) entre otros. 4.4.1. Contrastes de Hasza y Fuller Hasza y Fuller (1982) desarrollaron varios contrastes para un modelo del tipo (4.7). Estos contrastes, ası́ como los de Dickey, Hasza y Fuller (1984) para el modelo (4.8), utilizan un planteamiento similar a los ya clásicos tests de Dickey-Fuller. La distribución de los distintos estadı́sticos se tabula para innovaciones ruido blanco y su extensión para polinomios autorregresivos es fácil de desarrollar. Hasza y Fuller desarrollan tres contrastes. El primero se basa en la regresión: yt = β1 yt−1 + β2 (yt−1 − yt−S−1 ) + β3 (yt−S − yt−S−1 ) + + p X φj xt−j + t j=1 donde xt = (1 − L)(1 − LS )yt , t es iid normal con varianza σ 2 y S es el periodo al que se recogen las observaciones (S = 12 si son datos mensuales). La hipótesis nula 4.4. CONTRASTES DE R.U. EN LAS FRECUENCIAS ESTACIONALES 37 β1 = 1, β2 = 0 y β3 = 1 implica que (1 − φ1 L − φ2 L2 − · · · − φp Lp )(1 − L)(1 − LS )yt = t donde el polinomio autorregresivo φ(L) no tiene raı́ces en el cı́rculo unidad. Los parámetros φi y p se dejan sin especificar de forma que han de ser estimados y determinados. Los otros dos contrastes sugeridos por Hasza y Fuller se basan en la regresión: yt = α0 t + S X αj Djt + β1 yt−1 + β2 yt−S + β3 yt−S−1 + t (4.12) j=1 la hipótesis nula del segundo contraste es αi = 0 ∀i, β1 = β2 = 1 y β3 = −1. La hipótesis nula del tercer contraste es β1 = β2 = 1 y β3 = −1. Los contrastes basados en (4.12) tienen explı́citamente la alternativa de una tendencia lineal y una estacionalidad determinista. Desafortunadamente la alternativa es bastante restrictiva ya que solo se permiten innovaciones que son ruido blanco. La interpretación de los resultados de Hasza-Fuller es difı́cil por dos razones. Primero, el contraste impone dos raı́ces unitarias en la frecuencia cero bajo la hipótesis nula. Segundo, no está claro cómo cambia el desarrollo del test cuando sólo alguna de las frecuencias estacionales muestra una raı́z unitaria. El rechazo no demuestra que no exista ninguna raı́z unitaria en todas las frecuencias. Además, el hecho de no rechazar la hipótesis nula no ayuda a identificar las frecuencias que son integradas. Sólo se obtiene que todas las frecuencias tienen raı́ces unitarias y la frecuencia cero tiene dos. La hipótesis nula en los test de Hasza y Fuller es un modelo multiplicativo estacional con raı́ces unitarias. Es obvio que el rechazo de tal especificación puede deberse al hecho de que el supuesto de raı́ces unitarias estacionales no es adecuado o al hecho de que no haya dos raı́ces unitarias en la parte no estacional. Posteriormente Osborn, Chui, Smith y Birchenhall (1988) construyen un método para contrastar las dos hipótesis por separado. 4.4.2. Contrastes de Dickey, Hasza y Fuller Dickey, Hasza y Fuller (1984) formulan varios contrastes para el modelo con raı́ces unitarias estacionales (4.8). Bajo la hipótesis nula se supone que: (1 − φ1 L − φ2 L2 − · · · − φp Lp )(1 − LS )yt = t (4.13) evitando ası́ el supuesto de dos raı́ces unitarias en la frecuencia cero. La ecuación (4.13) de nuevo sugiere un método similar al de Dickey-Fuller aumentado (ADF), utilizando un estadı́stico t o el sesgo normalizado del coeficiente estimado. Basándose en su potencia, Dickey, Hasza y Fuller sugieren utilizar el estadı́stico del sesgo normalizado, que parece más potente contra un modelo de media determinista estacional (sin tendencia). Como el test de Hasza-Fuller, este test adolece de los problemas de la interpretación de los rechazos, baja potencia y autocorrelación residual. 38 4.4.3. CAPÍTULO 4. CONTRASTES DE R.U. Y DE COINTEGRACIÓN Contraste de Bhargava Bhargava (1990) propone un procedimiento alternativo para contrastar raı́ces unitarias estacionales. Está basado en el método que desarrollaron Sargan y Bhargava (1983) para contrastar la hipótesis de que los residuos de una ecuación de regresión siguen un paseo aleatorio, método que, a su vez, deriva del de Durbin y Watson (1950). El contraste que propone Bhargava se basa en los residuos de la regresión yt = α 0 t + S X αj Djt + µt (4.14) j=1 donde µt sigue un modelo estacional gaussiano de paseo aleatorio bajo la hipótesis nula. El método de Bhargava proporciona contrastes con distribución exacta para muestras finitas, pero no permite otro tipo de residuos que no sea el paseo aleatorio estacional gaussiano. 4.4.4. Contraste de Hylleberg, Engle, Granger y Yoo (HEGY) Hylleberg, Engle, Granger y Yoo (1990) (HEGY) consideran que la hipótesis de igual orden de integración en todas las frecuencias estacionales es demasiado fuerte. Desarrollan un método para contrastar raı́ces unitarias en cada una de las frecuencias estacionales por separado. HEGY utilizan en su estudio series trimestrales y posteriormente Franses (1990) y Beaulieu y Miron (1993) extienden este método para datos mensuales. El procedimiento de HEGY, traducido a datos mensuales por Beaulieu y Miron, consiste en lo siguiente: Sea xt la serie de interés, generada por la ecuación φ(L)xt = t (4.15) donde t es un ruido blanco y φ(L) es un polinomio en el operador de retardos. Supongamos que la serie xt no presenta componente determinista de ninguna clase. Sean γk las raı́ces de la ecuación caracterı́stica asociada a φ(L). La frecuencia asociada a una determinada raı́z es el valor de α en < eαi , la representación polar de la raı́z. Una raı́z es estacional si α = 2πj S , j = 1, 2, . . . , S − 1 donde S es el número de observaciones por año. Para datos mensuales, las raı́ces unitarias estacionales son: √ √ √ √ −1, ±i, −(1 ± 3i)/2, (1 ± 3i)/2, −( 3 ± i)/2, ( 3 ± i)/2 (4.16) El método de contraste desarrollado por HEGY consiste en linealizar el polinomio φ(L) en torno a la raı́z unitaria de la frecuencia cero y las S − 1 raı́ces unitarias estacionales de (4.16). Ası́ φ(L) se puede escribir: φ(L) = S X k=1 λk ∆(L) 1 − δk (L) + ∆(L)φ∗ (L) δk (L) (4.17) 4.4. CONTRASTES DE R.U. EN LAS FRECUENCIAS ESTACIONALES donde δk (L) = 1 − 1 θk (L), λk = Q φ(θk ) j6=k δj (θk ) y ∆(L) = 39 QS k=1 δk (L). φ∗ (L) tiene todas sus raı́ces fuera del cı́rculo unidad, y los θk son las raı́ces unitarias de frecuencia cero y estacionales. En el caso de datos mensuales, sustituyendo (4.17) en (4.15) se obtiene: 12 X ∗ φ (L) y13,t = πk yk,t−1 + t (4.18) k=1 donde: y1,t = (1 + L + L2 + · · · + L11 ) xt y2,t = −(1 − L + L2 − L3 + L4 − L5 + L6 − L7 + L8 − L9 + L10 − L11 ) xt y3,t = −(L − L3 + L5 − L7 + L9 − L11 ) xt y4,t = −(1 − L2 + L4 − L6 + L8 − L10 ) xt 1 y5,t = − (1 + L − 2L2 + L3 + L4 − 2L5 + L6 + L7 − 2L8 + L9 + L10 − 2L11 ) xt √2 3 y6,t = (1 − L + L3 − L4 + L6 − L7 + L9 − L10 )xt 2 1 y7,t = (1 − L − L2 − L3 + L4 + L5 + L6 − L7 − L8 − L9 + L10 + L11 ) xt 2√ 3 y8,t = − (1 + L − L3 − L4 + L6 + L7 − L9 − L10 ) xt 2 √ √ √ 1 √ y9,t = − ( 3 − L + L3 − 3L4 + 2L5 − 3L6 + L7 − L9 + 3L10 − 2L11 )xt 2 √ √ √ √ 1 (1 − 3L + 2L2 − 3L3 + L4 − L6 + 3L7 − 2L8 + 3L9 − L10 ) xt y10,t = 2 √ √ √ 1 √ ( 3 + L − L3 − 3L4 − 2L5 − 3L6 − L7 + L9 + 3L10 + 2L11 ) xt y11,t = 2 √ √ √ √ 1 y12,t = − (1 + 3L + 2L2 + 3L3 + L4 − L6 − 3L7 − 2L8 − 3L9 − L10 ) xt 2 y13,t = (1 − L12 ) xt Para contrastar hipótesis sobre raı́ces unitarias se estima (4.18) por mı́nimos cuadrados ordinarios y se comparan determinados estadı́sticos con las distribuciones adecuadas halladas mediante métodos de Montecarlo. Para las frecuencias cero y π se examina simplemente el estadı́stico t relevante para la hipótesis nula πk = 0 contra la alternativa de πk < 0. Para las otras raı́ces se contrasta πk = 0, donde k es par, en un test de dos colas. El coeficiente par es cero si la serie tiene una raı́z unitaria en esa frecuencia y es distinto de cero si no la tiene. Bajo la alternativa de que no hay una raı́z unitaria en la frecuencia en cuestión, el coeficiente par puede ser positivo o negativo. Si se rechaza πk = 0, entonces se contrasta πk−1 = 0 contra la alternativa de que πk−1 < 0; el test es de una cola debido a que la alternativa es que la serie contiene una raı́z fuera del cı́rculo unidad. Otra estrategia serı́a contrastar πk−1 = πk = 0 mediante un estadı́stico F. 40 CAPÍTULO 4. CONTRASTES DE R.U. Y DE COINTEGRACIÓN HEGY presentan tablas calculadas por el método de Montecarlo para todos los estadı́sticos t y F necesarios con datos trimestrales. En Beaulieu y Miron (1993) se encuentran las tablas para datos mensuales. La ventaja fundamental del procedimiento de HEGY sobre trabajos anteriores es que permite distinguir procesos que son integrados sólo en alguna de las frecuencias estacionales y no en todas. Capı́tulo 5 Contrastes de integración estacional 5.1. Introducción En el capı́tulo 3 se ha mostrado cómo la existencia de factores estacionales comunes SI(1) entre los elementos de un vector yt formado por n series temporales, implica que existe cointegración estacional uniforme entre ellas, y viceversa. Esto sugiere la utilización de un método indirecto para contrastar la especificación de un modelo de factores estacionales comunes. Se tratarı́a de contrastar la existencia de cointegración estacional entre ellas. Sin embargo, no se dispone de un método para contrastar la hipótesis de integración estacional [en los términos de la definición 4 de Engle et al (1989)] ni tampoco para contrastar la hipótesis de cointegración estacional1 . Utilizando los contrastes de HEGY se obtendrı́an valores crı́ticos erróneos para estas hipótesis, ya que HEGY intentan contrastar la presencia de raı́ces unitarias separadamente en cada frecuencia, mientras que lo que aquı́ interesa es un contraste conjunto para todas las frecuencias estacionales, ya que el modelo de referencia es un modelo de factores comunes estacionales SI(1) y, por tanto, para comprobar si un conjunto de series determinado puede haber sido generado por un modelo de este tipo se necesita contrastar que cada una de las series es SI(1) y que los residuos de las ecuaciones cointegrantes son SI(0). En la sección 5.2 se presenta un método de contraste para la hipótesis de integración estacional, basado en un estadı́stico de tipo F y siguiendo la estructura de los contrastes de raı́ces unitarias de Dickey y Fuller (1979). En la sección 5.3 se realizan las pruebas de potencia de este método, en la sección 5.4 se extiende el método para permitir alguna estructura en el componente no estacional de la serie, en la sección 5.5 se presenta un método de contraste de la hipótesis de integración estacional utilizando un estadı́stico de tipo t y en la sección 5.5.1 se realizan las pruebas de potencia de este contraste. 1 Lee (1992) propone un método, basado en el modelo de corrección de error, que permite contrastar la hipótesis de cointegración estacional, pero los estadı́sticos sólo están tabulados para el caso trimestral. 41 42 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL 5.2. Contraste de la hipótesis de integración estacional utilizando un estadı́stico de tipo F Sea xt una serie de datos mensuales (S = 12). Si la serie xt fuera SI(1), tendrı́amos que S(L) xt serı́a un proceso estacionario, generado por una ecuación del tipo: (5.1) S(L) xt = µ + ut donde µ es una constante y ut un proceso estacionario. Teniendo esto en cuenta, se puede plantear un test de integración en las frecuencias estacionales considerando la ecuación: (5.2) (1 + φ1 L + φ2 L2 + · · · + φ11 L11 ) xt = µ + t en la que t es un proceso iid2 . En esta ecuación, bajo la hipótesis nula conjunta: H0 : [φ1 = 1, φ2 = 1, . . . , φ11 = 1] la serie xt serı́a integrada estacionalmente de orden uno, SI(1). Para realizar este contraste de una forma más práctica se puede expresar el modelo como: xt = µ − φ1 xt−1 − φ2 xt−2 − · · · − φ11 xt−11 + t (5.3) y sumando (xt−1 + xt−2 + · · · + xt−11 ) en los dos miembros se obtiene, S(L)xt = µ + (1 − φ1 ) xt−1 + (1 − φ2 ) xt−2 + · · · + (1 − φ11 )xt−11 + t (5.4) que se puede escribir como (5.5) S(L) xt = µ + γ1 xt−1 + γ2 xt−2 + · · · + γ11 xt−11 + t siendo γj = (1 − φj ) para j = 1, 2, ..., 11. y ahora la hipótesis a contrastar serı́a: H0 : [γ1 = 0, γ2 = 0, . . . , γ11 = 0] Para contrastar este tipo de hipótesis, en el modelo de regresión lineal clásico se suele utilizar el estadı́stico: −1 (Rβ̂ − r)0 R(X 0 X)−1 R0 (Rβ̂ − r)/11 F = 0 ˆ ˆ / (n − 12) donde la matriz R y el vector r son: 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 R= 0 0 0 0 1 0 0 0 . . . . . . . . .. .. .. .. .. .. .. .. 0 0 0 0 .. . 0 0 0 0 .. . 0 0 0 0 .. . 0 0 0 0 .. . 0 0 0 0 0 0 0 0 0 0 0 1 2 En la sección 5.4 se relaja este supuesto. r= 11×12 y 0 0 0 0 .. . 0 11×1 (5.6) 43 5.3. POTENCIA DEL CONTRASTE Pero en el modelo que aquı́ se utiliza intervienen variables explicativas estocásticas con raı́ces unitarias y la distribución del estadı́stico F queda ahora deformada (por eso desde ahora lo llamaremos estadı́stico FD, F-deformado). Su distribución exacta en este caso es desconocida, pero se pueden aproximar sus valores crı́ticos por medio de simulaciones. Para obtener los valores crı́ticos de la distribución empı́rica del estadı́stico FD se han generado 10 000 muestras (para cada tamaño muestral: T = 50, 100, 150, 200, 250, 500 y 1000 observaciones) que cumplen la hipótesis nula a contrastar, es decir la ecuación S(L) xt = µ + t (se ha utilizado µ = 0). Una vez calculado el estadı́stico FD a partir de (5.5) para cada muestra, se obtiene la distribución empı́rica del Cuadro 5.1. Cuadro 5.1: Valores crı́ticos del estadı́stico FD. N. obs 50 100 150 200 250 500 1000 10 % 2.36 2.59 2.77 2.92 3.02 3.27 3.52 5% 2.72 2.96 3.12 3.23 3.35 3.59 3.81 1% 3.67 3.65 3.80 3.80 4.02 4.16 4.44 Esta tabla se ha generado suponiendo perturbaciones normales en la ecuación (5.5). Sin embargo la distribución del estadı́stico FD no cambia mucho si se utiliza otro tipo de distribución para las perturbaciones. Esto se puede observar en la figura 5.1, donde se han representado las distribuciones del estadı́stico FD obtenidas mediante simulación (con T = 200 y 10 000 replicaciones) cuando las perturbaciones de (5.5) siguen una distribución normal, logarı́tmico-normal y de Cauchy. 5.3. Potencia del contraste Para comprobar la potencia del contraste se debe verificar el comportamiento del estadı́stico bajo hipótesis alternativas. En este trabajo se comprobará en primer lugar la probabilidad de rechazar la hipótesis nula cuando el proceso que genera los datos, siendo estacionario, tiene igual módulo en todas sus frecuencias, es decir cuando todas sus raı́ces tienen igual módulo y están simultáneamente fuera del cı́rculo unidad. Posteriormente se comprobará lo que ocurre cuando sólo alguna de ellas se sale del cı́rculo unidad. 5.3.1. Hipótesis alternativas con igual módulo en todas sus raı́ces En el polinomio φ(L) = 1 − φ1 L − φ2 L2 − · · · − φ11 L11 existen 11 raı́ces, una es real y, de las restantes, cinco son las complejas conjugadas de las otras cinco. 44 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL .160 HNORM HLOG .140 HCAU .120 .100 .080 .060 .040 .020 .000 0.25 1.25 2.25 3.25 4.25 5.25 6.25 7.25 8.25 9.25 Figura 5.1: Distribución empı́rica del estadı́stico FD ante varias distribuciones generadoras. 45 5.3. POTENCIA DEL CONTRASTE Siendo 1/µ1 , . . . , 1/µ11 las once raı́ces de φ(L), supongamos que µ1 = m1 , µ2 = m̄1 , µ3 = m2 , µ4 = m̄2 , µ5 = m3 , µ6 = m̄3 , µ7 = m4 , µ8 = m̄4 , µ9 = m5 , µ10 = m̄5 y µ11 = m6 , donde m̄ es la compleja conjugada de m. Utilizando las coordenadas polares, cada raı́z se puede escribir de la forma: 1 i 2πj 1 = e S mj Aj y su conjugada: 1 −i 2πj 1 = e S m̄j Aj 2πj 2πj y, por tanto, mj = Aj e−i S y m̄j = Aj ei S , siendo 2πj S la frecuencia angular asociada a las raı́ces 1/mj y 1/m̄j . Si S = 12, las once raı́ces de φ(L) corresponden a las frecuencias ±π/6, ±π/3, ±π/2, ±2π/3, ±5π/6 y π. Si todas las raı́ces del polinomio tuvieran el mismo módulo (1/Aj = 1/A, constante para todo j) el polinomio φ(L) se podrı́a escribir de forma bastante sencilla en función del inverso del módulo3 , A: φ(L) = 1 + A L + (A L)2 + (A L)3 + (A L)4 + (A L)5 +(A L)6 + (A L)7 + (A L)8 + (A L)9 + (A L)10 + (A L)11 (5.7) Para comprobar la potencia del test se han generado 10 000 muestras de un proceso estacionario con 11 raı́ces de módulo 1/0,85, es decir, que provienen de la ecuación: 1 + 0,85L + (0,85L)2 + (0,85L)3 + · · · + (0,85L)11 xt = t (5.8) siendo t un ruido blanco N (0, 1). Los resultados han sido los que recoge el Cuadro 5.2. Cuadro 5.2: Potencia ante la alternativa del modelo (5.8). N. Obs. 50 100 150 200 250 Nivel de significación 10 % 5% 1% 0,7164 0,5870 0,2818 0,9919 0,9736 0,8848 1,0000 0,9999 0,9967 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 En el apéndice de gráficos B (página 122), gráficos 1 a 5, se han representado las distribuciones empı́ricas del estadı́stido FD bajo la hipótesis nula y bajo la hipótesis alternativa para cada tamaño muestral. 3 Ver prueba en el Apéndice 1 46 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL Se comprueba cómo a medida que aumenta el tamaño muestral, aumenta la probabilidad de rechazar la hipótesis nula de que el proceso tiene 11 raı́ces unitarias cuando realmente ha sido generado por la ecuación (5.8) Por tanto, el test no es inconsistente. Por otra parte, estas cantidades muestran cómo para un nivel de significación del 5 %, utilizando aproximadamente 100 observaciones o más el test es capaz de enfrentarse con bastante fiabilidad a esta hipótesis alternativa. Se ha desarrollado el mismo experimento variando el módulo de las raı́ces a 1/0,90, 1/0,95 y 1/0,97 obteniendo los resultados del Cuadro 5.3 (esta vez sólo para un valor fijo de n = 150 observaciones). Cuadro 5.3: Potencia ante diferentes módulos. Módulo 1/0,90 1/0,95 1/0,97 Nivel de significación 10 % 5% 1% 0,9999 0,9991 0,9876 0,9556 0,8969 0,6740 0,6157 0,4341 0,1614 Se comprueba cómo hasta módulos cercanos a 1/0,95 la probabilidad de rechazar la hipótesis alternativa es bastante alta y, por tanto, se puede considerar el estadı́stico como suficientemente fiable. 5.3.2. Hipótesis alternativas con raı́ces de distinto módulo En el modelo de regresión lineal clásico, con regresores fijos, cuando la hipótesis nula H0 : Rβ = r no se verifica, el vector (Rβ̂ − r) sigue una distribución normal, pero con media distinta de cero (igual a Rβ −r). Esto hace que el numerador del estadı́stico F (multiplicado por σ 2 ) siga una distribución descentrada χ2 (q, δ) donde q son los grados de libertad del numerador y δ es el parámetro de excentricidad: −1 δ = (Rβ − r)0 R(X 0 X)−1 R (Rβ − r) (5.9) La media de esta distribución es T + δ y su varianza 2(T + 2δ). Entonces, el estadı́stico F sigue una distribución F de Snedecor descentrada, F(q,T −k,δ) cuyo parámetro de excentricidad es el definido anteriormente (5.9). Sin embargo, en nuestro caso, la naturaleza estocástica de la matriz (X 0 X) impide la obtención analı́tica del parámetro de excentricidad. A pesar de ello, cabe esperar un comportamiento parecido, ya que el numerador del estadı́stico, en cualquier caso, va a tener una distribución descentrada. La potencia, por tanto, dependerı́a de un único parámetro similar al δ. A medida que crece el número de raı́ces que se alejan del cı́rculo unidad, aumentarı́a el valor de ese parámetro, haciendo que la potencia, a su vez aumente. Pero el hecho de que sea una u otra la raı́z que se aleje del cı́rculo unidad no deberı́a afectar al parámetro de excentricidad y, por tanto, a la potencia del contraste. 47 5.3. POTENCIA DEL CONTRASTE Para comprobar la potencia del estadı́stico FD ante hipótesis alternativas con raı́ces de distinto módulo, se han generado 10 000 replicaciones de tamaño muestral 150 de diez tipos de modelos4 : el primero con diez raı́ces de módulo uno y una raı́z superior a uno (1/0,85)(en la frecuencia π). el segundo con nueve raı́ces de módulo uno y dos raı́ces superiores a uno (las dos raı́ces, de frecuencias ±π/2 con módulos iguales a 1/0,85). y se ha seguido la misma pauta hasta llegar al décimo modelo con una sola raı́z unitaria y diez raı́ces superiores a uno (raı́z unitaria en la frecuencia π y en todas las demás módulos iguales a 1/0,85). Se ha calculado el estadı́stico FD para cada una de las replicaciones. Teniendo en cuenta que para T = 150 y nivel de significación de 5 % el valor que toma el estadı́stico FD bajo la hipótesis nula de que el modelo tiene once raı́ces unitarias es 3,12, se han obtenido los resultados del Cuadro 5.4. Cuadro 5.4: Potencia ante alternativas con raı́ces de distinto módulo. Modelo 10 raı́ces unitarias y una raı́z 1/0,85 9 raı́ces unitarias y 2 raı́ces 1/0,85 8 raı́ces unitarias y 3 raı́ces 1/0,85 7 raı́ces unitarias y 4 raı́ces 1/0,85 6 raı́ces unitarias y 5 raı́ces 1/0,85 5 raı́ces unitarias y 6 raı́ces 1/0,85 4 raı́ces unitarias y 7 raı́ces 1/0,85 3 raı́ces unitarias y 8 raı́ces 1/0,85 2 raı́ces unitarias y 9 raı́ces 1/0,85 1 raı́z unitaria y 10 raı́ces 1/0,85 Probabilidad de rechazar la hipótesis nula 0,0452 0,0987 0,1300 0,1709 0,2975 0,5584 0,6221 0,8332 0,9391 0,9949 Como se puede apreciar, el estadı́stico no es capaz de detectar con suficiente probabilidad de una a cinco raı́ces estacionarias, sin embargo cuando se observan seis o más se manifiesta como bastante potente. En la figura 5.2 se ha representado la distribución empı́rica del estadı́stico FD bajo la hipótesis nula y bajo siete modelos alternativos (el programa gráfico no permite más) en los que el número de raı́ces no unitarias se va cambiando paulatinamente. En este gráfico se puede apreciar cómo a medida que aumenta el número de raı́ces estacionarias, la distribución se desplaza hacia la derecha, quedando totalmente a la derecha del valor 3,12 (valor crı́tico al 5 %) cuando se presentan once raı́ces de módulo superior a la unidad. 4 Las ecuaciones que, en concreto, se han utilizado se encuentran en el apéndice 5.B 48 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL Figura 5.2: Movimiento de la distribución según aumenta el número de raı́ces no unitarias. 5.4. SERIES CON ESTRUCTURA EN EL COMPONENTE NO ESTACIONAL 5.4. 49 Series con estructura en el componente no estacional Es posible que la serie que se analiza, aparte del componente estacional (con o sin raı́ces unitarias), contenga un componente no estacional, que puede ser estacionario o no estacionario. Aquı́ se estudiarán los dos casos. En primer lugar, supongamos que es estacionario. En tal caso, puede representarse mediante una estructura ARMA estacionaria e invertible, lo cual implica que las perturbaciones de la ecuación (5.2) para esta serie están autocorrelacionadas. Entonces, los estimadores MCO de los coeficientes no son consistentes y la distribución del estadı́stico varı́a con respecto a la obtenida cuando sólo habı́a estructura estacional (cuyos valores crı́ticos se han aproximado empı́ricamente en la tabla 5.1). Para solucionar esto, sabemos que cualquier proceso ARMA invertible puede ser aproximado mediante un proceso AR de orden suficientemente elevado (llamémosle p). En este caso, se puede considerar que la serie ha sido aproximadamente generada por una ecuación como: (1 − α1 L − · · · − αq Lq ) S(L) xt = µ + t (5.10) siendo t iid. Para este tipo de series, el contraste de la hipótesis de integración estacional se puede construir de una forma análoga a como se hizo para el modelo (5.1). Siguiendo el mismo proceso, la ecuación a estimar quedarı́a: (1 − α1∗ L − · · · − αp∗ Lp ) S(L) xt = µ + γ1 xt−1 + · · · + γ11 xt−11 + t (5.11) donde p = q + 11 y (1 − α1∗ L − · · · − αp∗ Lp ) = (1 − α1 L − · · · − αq Lq )(1 + φ1 L + · · · + φ11 L11 ) −(φ1 L + · · · + φ11 L) La expresión (5.11) se puede escribir: S(L) xt = µ + γ1 xt−1 + · · · + γ11 xt−11 + α1∗ S(L) xt−1 + +α2∗ S(L) xt−2 + · · · + αp∗ S(L)xt−p + t (5.12) En la práctica, dado que p es desconocido, se debe elegir aquél valor que haga que las perturbaciones de la ecuación (5.12) no presenten autocorrelación. En tal caso, los estimadores MCO de los coeficientes son consistentes. Aquı́ la hipótesis de integración estacional uniforme significa que γ1 = 0, γ2 = 0, . . . y γ11 = 0. Esta hipótesis se puede contrastar por medio de un estadı́stico F de restricciones lineales (Como en 5.6). Dado que los estimadores de α1∗ , α2∗ , . . . , αp∗ son consistentes, la distribución de ese estadı́stico F converge hacia la del estadı́stico FD, y por tanto, se pueden utilizar sus valores crı́ticos para un tamaño muestral suficientemente grande (> 100). Supongamos, en segundo lugar, que el componente no estacional de la serie es no estacionario; en concreto, supongamos que presenta una raı́z unitaria en la frecuencia 50 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL cero. En tal caso, bajo la hipótesis de integración estacional, la serie habrı́a sido generada por la ecuación: (1 − L) S(L) xt = µ + t con t iid. Cuando se trabaja con una serie de este tipo, el procedimiento más directo es tomar una diferencia regular: δ xt = ωt ya que entonces, la serie ωt no contendrá la raı́z unitaria en la frecuencia cero y puede ser tratada como en (5.1) para contrastar la hipótesis de integración estacional. El problema que surge en la práctica es que no se sabe si las series presentan o no raı́ces unitarias en el componente no estacional. Entonces, para decidir si se diferencia o no a la serie, es necesario disponer de un método que permita contrastar la existencia de una raı́z unitaria en la frecuencia cero cuando se sospecha la existencia de raı́ces unitarias en las frecuencias estacionales. Hylleberg et al (1990) (HEGY) proporcionan un método que cumple este requisito, ya que permite contrastar la presencia de raı́ces unitarias por separado en cada una de las frecuencias estacionales y en la frecuencia cero. En el presente trabajo, sólo nos interesa realmente el contraste de la frecuencia cero. Teniendo en cuenta que en la realidad, la mayorı́a de las series económicas presentan alguna raı́z unitaria en la frecuencia cero, es casi obligatorio realizar el contraste de HEGY para esta frecuencia en todas las series que se utilicen. Sin embargo, como veremos a continuación, ambos contrastes (Para la frec. cero y para todas las frec. estacionales) se pueden integrar en una sola ecuación. Supongamos que la serie xt contiene una raı́z unitaria en cada frecuencia estacional y, además, una raı́z unitaria en la frecuencia cero, entonces responderı́a a la ecuación: (1 − L12 ) xt = µ + ut (5.13) siendo ut iid. O, escrito de otra forma: (1 − L) S(L) xt = µ + ut . (5.14) Para efectuar el contraste sobre la raı́z unitaria de la frecuencia cero, teniendo en cuenta la presencia de once raı́ces unitarias estacionales, se puede construir la ecuación: (1 − φL) S(L) xt = µ + ut (5.15) donde la hipótesis a contrastar es H0 : φ = 1 frente a la alternativa H1 : φ < 1. La ecuación (5.15) se puede reescribir: S(L) xt = µ + φ S(L) xt−1 + ut y restando S(L) xt en los dos lados de la ecuación: S(L) ∆ xt = µ + γ S(L) xt−1 + ut (5.16) 5.4. SERIES CON ESTRUCTURA EN EL COMPONENTE NO ESTACIONAL 51 siendo γ = φ − 1. El contraste de la raı́z unitaria en la frecuencia cero es un contraste de significatividad del parámetro γ y, por tanto, se hace por medio del estadı́stico t del coeficiente γ estimado, que ha de seguir la distribución del estadı́stico de Dickey-Fuller. Para, simultáneamente, realizar el contraste de integración estacional, se puede utilizar la ecuación: (1 + φ1 L − · · · + φ11 L11 )∆ xt = µ + (φ − 1) S(L) xt + ut (5.17) que, reordenando los términos, se transforma en: ∆ xt = µ + (φ − 1) S(L) xt−1 − φ1 ∆ xt−1 − · · · − φ11 ∆ xt−11 + ut (5.18) y sumando (∆xt−1 + · · · + ∆ xt−11 ) a ambos lados de la ecuación: S(L) ∆ xt = µ + (φ − 1) S(L) xt−1 + (1 − φ1 ) ∆ xt−1 + (1 − φ2 )∆ xt−2 + · · · + (1 − φ11 ) ∆ xt−11 + ut (5.19) que se puede expresar como: (1 − L12 ) xt = µ + γ0 S(L) xt−1 + γ1 ∆ xt−1 + · · · + γ11 ∆ xt−11 + ut (5.20) donde γ0 = (φ − 1), y γj = (1 − φj ) para j = 1, ..., 11. Bajo la hipótesis de que existe una raı́z unitaria en la frecuencia cero, γ0 es igual a cero. Por lo tanto se puede utilizar un estadı́stico de tipo t de Student para realizar este contraste. Ya que la influencia de los efectos estacionales viene recogida por el resto de los parámetros, la distribución del estadı́stico t en este modelo será la misma que la del estadı́stico correspondiente a la frecuencia cero en HEGY (1990). Bajo la hipótesis de integración estacional uniforme (11 raı́ces unitarias, una en cada frecuencia estacional),γj serı́a igual a cero ∀j : 1, ..., 11. Por lo tanto, para contrastar esta hipótesis múltiple se puede utilizar un estadı́stico de tipo “F”. Dado que la influencia del componente regular, bajo la hipótesis nula, está recogida en el término γ0 S(L) xt−1 , la distribución del estadı́stico F para contrastar conjuntamente las restricciones lineales: H0 : γ1 = 0, . . . , γ11 = 0 es asintóticamente la misma que la del estadı́stico FD (Cuyos valores crı́ticos aproximados se encuentran en el Cuadro 5.1). Por último, hay que señalar que también es posible extender el modelo (5.20) de manera que recoja la posibilidad de que exista además una parte autorregresiva estacionaria en el componente no estacional del modelo. Desarrollándolo tal y como se hizo para la ecuación (4.1) se obtiene una ecuación similar a la (5.12): ∆12 xt = µ + γ0 S(L) xt−1 + γ1 ∆ xt−1 + · · · + γ11 ∆ xt−11 + +α1 ∆12 xt−1 + · · · + αp ∆12 xt−p + ut (5.21) siendo ∆12 = (1 − L12 ). Los contrastes se llevan a cabo como en la ecuación (5.20), ya que los estadı́sticos t y F siguen asintóticamente las mismas distribuciones. 52 5.5. CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL Método de contraste basado en un estadı́stico de tipo t La hipótesis de integración estacional uniforme incorpora 11 restricciones sobre los coeficientes de la ecuación (5.5), en concreto: γ1 = 0, γ2 = 0, . . . , γ11 = 0. Estas restricciones se pueden plantear en dos etapas. La primera supone que la serie tiene igual módulo en todas sus raı́ces estacionales y la segunda que ese módulo, en concreto, vale uno. La forma de expresar esto matemáticamente es la siguiente. Teniendo en cuenta que las series con igual módulo en todas sus raı́ces estacionales (ver Apéndice 5.A) son generadas por una ecuación como: 1 + A L + (A L)2 + (A L)3 + · · · + (A L)11 xt = t (5.22) donde A es el inverso del módulo de todas esas raı́ces. Sobre los parámetros de la ecuación (5.5) esto significa que se cumplen las siguientes restricciones, de tipo no lineal: γj = 1 − (1 − γ1 )j para j = 2, . . . , 11. (5.23) Tomando esto como base, se puede desarrollar un contraste para la hipótesis de igualdad de módulos. Consistirı́a en estimar la ecuación (5.5) primero sin restricciones, luego imponiendo estas 10 restricciones no lineales y construir ası́ un estadı́stico F (o un test razón de verosimilitudes, o un test de Wald). Se puede desarrollar la distribución empı́rica de este estadı́stico, igual que se hizo para el estadı́stico FD anterior. Si, para una serie determinada, se acepta la hipótesis nula utilizando este nuevo estadı́stico F, es oportuno contrastar la hipótesis de que el módulo toma concretamente el valor uno. Para hacerlo, basta con utilizar el estadı́stico t del coeficiente γ̂1 de la ecuación (5.5) estimada imponiendo las restricciones (5.23): S(L) xt = µ + γ1 xt−1 + (1 − (1 − γ1 )2 ) xt−2 + · · · + (1 − (1 − γ1 )11 ) xt−11 + t (5.24) Bajo el supuesto de igualdad de módulos, el parámetro γ1 de la ecuación (5.24) es precisamente uno menos el inverso del módulo, esto implica que el contraste relevante en este caso es de una sóla cola. Bajo la hipótesis de integración estacional, las restricciones de igualdad de módulos se cumplen, el módulo de todas las raı́ces es igual a uno y por tanto γ1 = 0; pero bajo la hipótesis alternativa de estacionariedad, el módulo es mayor que uno, γ1 toma un valor positivo comprendido entre cero y uno y, por tanto, lo adecuado es comparar el valor obtenido del estadı́stico t con el valor crı́tico de la cola derecha de la distribución bajo la hipótesis nula. Se ha hallado por medio de simulaciones, una aproximación empı́rica a la distribución del estadı́stico t para el coeficiente γ1 . En el Cuadro 5.5 se presentan sus valores crı́ticos (cola derecha), basados en 10 000 replicaciones. Cabe suponer que si, para una determinada variable, las raı́ces no tienen el mismo módulo, entonces el estadı́stico t de γ̂1 en (5.24) no tendrá la distribución adecuada. Por tanto, se puede pensar que, en la práctica, para contrastar integración estacional sólo habrı́a que comprobar el valor de la t(γˆ1 ) (sin necesidad del primer paso). Nótese que la hipótesis nula contiene las dos etapas: todas las raı́ces han de tener el mismo módulo, y su valor en concreto ha de ser 1. 5.5. MÉTODO DE CONTRASTE BASADO EN UN ESTADÍSTICO DE TIPO T 53 Cuadro 5.5: Valores crı́ticos de t(γ̂1 ). N. Obs. 50 100 150 200 250 5.5.1. Nivel de significación 10 % 5 % 1% 1,38 1,72 2,42 1,43 1,78 2,36 1,48 1,81 2,46 1,54 1,89 2,56 1,55 1,90 2,54 Potencia del contraste En esta sección se va a comprobar la potencia del contraste de integración estacional basado en el estadı́stico t que se acaba de describir en la sección anterior. Para ello se va a utilizar un procedimiento similar al que se ha seguido para comprobar la potencia del estadı́stico FD en el apartado 5.3. En primer lugar, se comprueba la probabilidad de rechazar la hipótesis nula cuando el proceso que genera los datos, siendo estacionario, tiene igual módulo en todas sus frecuencias estacionales. Más adelante se analiza lo que ocurre cuando algunas de las raı́ces estacionales, aunque no todas, están fuera del cı́rculo unidad. 5.5.1.1. Igual módulo en todas las raı́ces estacionales Para comprobar la potencia del contraste se han generado 10 000 muestras de tamaños T = 50, 100, 150, 200 y 250 de un proceso estacionario con 11 raı́ces estacionales de módulo 1/0,85 (Ecuación 5.8). Al aplicar el estadı́stico t los resultados han sido los que recoge el Cuadro 5.6. Cuadro 5.6: Potencia del contraste mediante el estadı́stico t(γˆ1 ). N. Obs. 50 100 150 200 250 150 (Mod.= 1/0,95) Nivel de significación 10 % 5% 1% 0,075 0,021 0,0001 0,131 0,053 0,0042 0,178 0,086 0,0083 0,216 0,107 0,0118 0,254 0,132 0,0220 0,107 0,042 0,0031 Al igual que el contraste basado en el estadı́stico FD, este contraste no parece inconsistente, ya que al aumentar el tamaño muestral, aumenta la probabilidad de rechazar 54 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL la hipótesis nula de que el proceso tiene 11 raı́ces unitarias cuando realmente ha sido generado por un modelo estacionario. Sin embargo, se puede observar que este contraste es mucho menos potente que el del estadı́stico FD ante hipótesis alternativas de este tipo. 5.5.1.2. Hipótesis alternativas con raı́ces de módulo diferente Para comprobar la potencia del contraste ante hipótesis alternativas con raı́ces de distinto módulo, se han generado 10 000 réplicas de tamaño muestral 150 de cinco tipos de modelos: 1. Modelo con dos raı́ces fuera del cı́rculo unidad y nueve raı́ces unitarias. 2. Modelo con cuatro raı́ces fuera del cı́rculo unidad y siete raı́ces unitarias. 3. Modelo con seis raı́ces fuera del cı́rculo unidad y cinco raı́ces unitarias. 4. Modelo con ocho raı́ces fuera del cı́rculo unidad y tres raı́ces unitarias. 5. Modelo con diez raı́ces fuera del cı́rculo unidad y una raı́z unitaria. Para todas las raı́ces fuera del cı́rculo unidad se ha tomado un módulo igual a 1/0,85. Para todas las replicaciones se ha estimado la ecuación (5.24) por mı́nimos cuadrados no lineales, utilizando el algoritmo de Gauss-Newton, posteriormente se ha calculado el estadı́stico t del coeficiente γ̂1 y se han obtenido los resultados del Cuadro 5.7. Cuadro 5.7: Potencia de t(γ̂1 ) ante alternativas con raı́ces de distinto módulo. Modelo 1 2 3 4 5 Probabilidad de rechazar la hipótesis nula 0,0496 0,0845 0,1231 0,1589 0,2934 Como se puede ver, la potencia aumenta al crecer el número de raı́ces fuera del cı́rculo unidad. También se aprecia que la potencia es mayor en los cuatro últimos modelos que la que se tenı́a frente a la hipótesis alternativa con todos los módulos iguales a 1/0,85. Esto es comprensible ya que ahora se está incumpliendo también la hipótesis de igualdad de módulos, la ecuación (5.24) es una mala especificación para series generadas por procesos con módulos diferentes en sus distintas raı́ces estacionales y para estas series el estimador del parámetro γ es inconsistente. 5.5. MÉTODO DE CONTRASTE BASADO EN UN ESTADÍSTICO DE TIPO T 55 De nuevo, si se compara la potencia del estadı́stico t frente a la del estadı́stico FD, se aprecia que éste también es más potente ante hipótesis alternativas con diferentes módulos en sus raı́ces. 56 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL Apéndice 5.A. Polinomio con raı́ces del mismo módulo Si todas las raı́ces del polinomio tienen el mismo módulo (1/Aj = 1/A constante para todo j). El polinomio φ(L) se puede escribir: φ(L) = 1 + AL + (AL)2 + (AL)3 + (AL)4 + (AL)5 +(AL)6 + (AL)7 + (AL)8 + (AL)9 + (AL)10 + (AL)11 Demostración: Para verlo se ha de tener en cuenta que φ(L) = 1 − φ1 L − φ2 L2 − · · · − φ11 L11 = (1 − µ1 L)(1 − µ2 L) · · · (1 − µ11 L) que a su vez es igual a (1 − m1 L)(1 − m̄1 L)(1 − m2 L)(1 − m̄2 L) · · · (1 − m6 L). Recordemos que si mj y m̄j son dos raı́ces conjugadas, entonces: mj + m̄j = 2A cos 2πj 12 y mj · m̄j = A2 por tanto, 2πj + (AL)2 12 teniendo en cuenta esta última expresión, se obtiene que (1 − mj L)(1 − m̄j L) = 1 − 2A cos para j = 2 2π + (AL)2 6 (1 − m2 L)(1 − m̄2 L) = 1 − AL + (AL)2 para j = 3 (1 − m3 L)(1 − m̄3 L) = 1 + (AL)2 para j = 4 (1 − m4 L)(1 − m̄4 L) = 1 + AL + (AL)2 5π (1 − m5 L)(1 − m̄5 L) = 1 − 2A cos + (AL)2 6 (1 − m6 L)(1 − m̄6 L) = 1 + AL para j = 1 para j = 5 para j = 6 (1 − m1 L)(1 − m̄1 L) = 1 − 2A cos 57 (5.25) 58 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL ası́ que multiplicando, (1 − m2 L)(1 − m̄2 L)(1 − m4 L)(1 − m̄4 L) = 1 + (AL)2 + (AL)4 (1 − m1 L)(1 − m̄1 L)(1 − m5 L)(1 − m̄5 L) = 1 − (AL)2 − (AL)4 (5.26) y el producto de estas dos expresiones da: (1 − m1 L)(1 − m̄1 L)(1 − m2 L)(1 − m̄2 L)(1 − m4 L)(1 − m̄4 L)· ·(1 − m5 L)(1 − m̄5 L) = 1 + (AL)4 + (AL)8 (5.27) que multiplicado por (1 − m3 L)(1 − m̄3 L) es igual a: 1 + (AL)2 + (AL)4 + (AL)6 + (AL)8 + (AL)10 y, finalmente multiplicando por (1 − m6 L) se obtiene el polinomio original φ(L) en función del módulo (común) de todas sus raı́ces: φ(L) = 1 + AL + (AL)2 + (AL)3 + (AL)4 + (AL)5 +(AL)6 + (AL)7 + (AL)8 + (AL)9 + (AL)10 + (AL)11 5.B. (5.28) Modelos para hipótesis alternativas con diferente número de raı́ces unitarias Las ecuaciones que se han utilizado para simular el modelo bajo hipótesis alternativas son las siguientes: (Se ha utilizado A = 1 y B = 0.85) 10 raı́ces con módulo 1/A y una con módulo 1/B (Frec. π): (1 + BL + A2 L2 + A2 BL3 + A4 L4 + A4 BL5 + A6 L6 + A6 BL7 + A8 L8 + A8 BL9 + A10 L10 + A10 BL11 )xt = t (5.29) 9 raı́ces con módulo 1/A y dos con módulo 1/B (Frecs. ±π/2) (1 + AL + B 2 L2 + AB 2 L3 + A4 L4 + A5 L5 + A4 B 2 L6 + A5 B 2 L7 + A8 L8 + A9 L9 + A8 B 2 L10 + A9 B 2 L11 )xt = t (5.30) 8 raı́ces con módulo 1/A y tres con módulo 1/B (Frecs. ±π/2 y π) (1 + BL + B 2 L2 + B 3 L3 + A4 L4 + A4 BL5 + A4 B 2 L6 + A4 B 3 L7 + A8 L8 + A8 BL9 + A8 B 2 L10 + A8 B 3 L11 )xt = t (5.31) 7 raı́ces con módulo 1/A y cuatro con módulo 1/B (Frecs. ±π/6 y ±5π/6) (1 + AL + (2A2 − B 2 )L2 + (2A3 − AB 2 )L3 + (2A4 − 2A2 B 2 − B 4 )L4 + (2A5 − 2A3 B 2 − AB 4 )L5 + (A6 − 2A4 B 2 − 2A2 B 4 )L6 + (A7 − 2A5 B 2 − 2A3 B 4 )L7 + (−(A6 B 2 ) − 2A4 B 4 )L8 + (−(A7 B 2 ) − 2A5 B 4 )L9 − A6 B 4 L10 − A7 B 4 L11 )xt = t (5.32) 5.B. MODELOS PARA HIPÓTESIS ALTERNATIVAS CON DIFERENTE NÚMERO DE RAÍCES UNITARIAS59 6 raı́ces con módulo 1/A y cinco con módulo 1/B (Frecs. ±π/6, ±5π/6 y π). (1 + BL + (2A2 − B 2 )L2 + (2A2 B − B 3 )L3 + (2A4 − 2A2 B 2 + B 2 )L2 + (2A4 B − 2A2 B 3 + B 5 )L5 + (A6 − 2A4 B 2 + 2A2 B 4 )L6 + (A6 B − 2A4 B 3 + (5.33) 2A2 B 5 )L7 + (−(A6 B 2 ) + 2A4 B 4 )L8 + (−(A6 B 3 )+ 2A4 B 5 )L9 + A6 B 4 L10 + A6 B 5 L11 )xt = t Para el modelo con cinco raı́ces unitarias y seis estacionarias se ha utilizado la ecuación (5.33) pero con B = 1 y A = 0,85. De la misma forma, para el modelo con cuatro raı́ces unitarias se ha utilizado la ecuación (5.32), para el de tres la ecuación (5.31), para el de dos la ecuación (5.30) y para el de una la ecuación (5.29), utilizando en todas ellas B = 1 y A = 0,85. 60 CAPÍTULO 5. CONTRASTES DE INTEGRACIÓN ESTACIONAL Capı́tulo 6 Métodos de estimación de modelos de factores comunes 6.1. Introducción A lo largo del capı́tulo 3 se ha comprobado que el concepto de cointegración está estrechamente relacionado con el concepto de factor común. En la literatura sobre cointegración se ha puesto mucha atención y esfuerzo en la estimación de los vectores cointegrantes, tanto en lo que se refiere a la frecuencia cero (Ver por ejemplo Engle y Granger, 1987; Johansen, 1988) como a las frecuencias estacionales (Ver Engle et al, 1989; Lee, 1992; Engle et al, 1993; Hylleberg et al, 1990). Sin embargo, se ha dedicado relativamente poca atención a la estimación de los vectores de factores comunes. Hay varias razones por las que puede resultar interesante disponer de una estimación de los factores. Por ejemplo, cuando se dispone de un sistema con una gran cantidad de variables y se necesita reducir su dimensión. El modelo, para todo el conjunto de variables, puede parecer muy complejo, pero si lo que interesa es su comportamiento a largo plazo, puede utilizarse una representación formada por un conjunto más pequeño de variables, que son los factores comunes de las originales. El análisis del comportamiento a largo plazo de un sistema macroeconómico completo puede hacerse encontrando primero los factores comunes de cada sector de la economı́a y estudiando después la cointegración entre ellos. Otra razón para que interese extraer los factores es que la estimación de éstos permite descomponer el vector yt , formado por las series originales, en dos componentes ft (vector de factores comunes) y (yt − Aft ) que contienen diferentes tipos de información. Por ejemplo, los encargados de la polı́tica económica pueden estar interesados en el componente permanente ft (que puede incluir la tendencia y la parte no estacionaria del componente estacional), mientras que los empresarios, más preocupados por controlar el ciclo de negocios, estarán más interesados en el componente cı́clico o transitorio (yt − Aft ). Otra ventaja que tiene la extracción de los factores es que permite estudiar su relación con variables reales, ası́ a veces será posible establecer la similitud entre un factor y una variable o una combinación de variables reales. En lo que se refiere a la estimación de factores de tendencia común, se conocen 61 62 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES dos métodos: uno basado en la maximización de la función de verosimilitud del modelo (en el dominio de la frecuencia) (Fernández Macho, 1986), que se verá aquı́ en la sección 6.2.1 y el segundo y más reciente, de Gonzalo y Granger (1991) que, como se apreciará en la sección 6.2.2, basa la estimación en la representación como mecanismo de corrección de error (ECM) del modelo. En cuanto a la estimación de modelos con factores comunes estacionales, es posible utilizar la extensión del procedimiento de Fernández Macho (1986) que él mismo propone en su trabajo, y se recoge aquı́ en la sección refsec6.3.1. Este es el único método conocido para estimar factores estacionales comunes, aunque se puede intuir, y se tratará de comprobar en este capı́tulo, en la sección 6.3.2, que es posible adaptar el método propuesto por Gonzalo y Granger para la estimación de este tipo de factores. 6.2. Estimación de modelos con tendencias comunes 6.2.1. Maximización de la función de verosimilitud espectral del modelo Desarrollaremos aquı́ el método de Fernández Macho (1986). Sea el modelo: yt n×1 = µt k×1 = t ηt A µt n×k k×1 + t , t = 0, . . . , T (6.2) µt−1 + β + ηt k×1 k×1 ∼ NID (6.1) n×1 0, k×1 Σ 0 0 Ση (6.3) Es decir, un modelo en el que los factores comunes se determinan especı́ficamente como paseos aleatorios con rumbo, y por tanto, se interpretan como tendencias lineales comunes. En este modelo hay {k(3 + 2n − k) + n(n + 1)}/2 parámetros a estimar, que son los siguientes: k parámetros en el vector de rumbos β, nk − k(k + 1)/2 en la matriz de pesos A, k en la matriz de covarianzas de las innovaciones de las tendencias comunes, Ση , y n(n + 1)/2 en la matriz de covarianzas del componente transitorio, Σ . Como yt ∼ CI(1, 1), tomando diferencias en (6.1) se obtiene una serie estacionaria: zt = ∆yt − Aβ = Aηt + ∆t t = 1, . . . , T (6.4) 6.2. ESTIMACIÓN DE MODELOS CON TENDENCIAS COMUNES 63 Consideremos la transformación de Fourier de la serie {zt }: ωj = (2πT )−1/2 T X zt eiλj t , λj = t=1 2πj , T j = 0, . . . , T − 1. Esto puede expresarse de forma más compacta como: ⊗ In ) vec(z) vec(ω) = ( U nT × 1 T ×T n×n (6.5) nT × 1 donde ω = (ω0 , . . . , ωT −1 ), z = (z1 , . . . , zT ) y U es la matriz de Fourier (T × T ) cuyo elemento (h, k) es (2πT )−1/2 exp(i k λh−1 ). Como {zt } es un proceso no determinista, estacionario y normal multivariante, {ωj } se distribuye asintóticamente como un proceso heterocedástico normal independiente con media cero, es decir, a ωj ∼ N(0, 1 Gzj ), 2π j = 0, ..., T − 1 donde Gzj es la función generadora de matrices de autocovarianzas de {zt } evaluada en λj = 2πj T . De (6.4) es fácil ver que Gz (u) = AΣη A0 + (1 − u)(1 − u−1 )Σ Gzj = Gz (ei λj ) = AΣη A0 + cj Σ , cj = 2 − 2 cos λj Como las ωj son independientes, el logaritmo de su función de densidad conjunta es la suma de los logaritmos de sus densidades marginales: L= T −1 X `j j=0 El hecho de que Σ 0 asegura que Gzj 0 para j > 0, ası́ que `j = log det Gzj + tr[G−1 (2πP )] /2, para j > 0 zj zj siendo Pzj la parte real de la matriz de periodogramas de {zt } en la frecuencia λj . Es obvio que, para j = 0, Gz0 = AΣη A0 es de rango deficiente. Ası́ que ω0 tiene una distribución normal multivariante degenerada y no es posible una determinación explı́cita de su función de densidad en Rn . Sin embargo (Rao y Mitra, 1971), la densidad existe en un subespacio de Rn . El logaritmo de la densidad de ω0 en el hiperplano K 0 ω0 = 0 (donde K es una matriz n × (n − k) de rango (n − k)) puede escribirse1 : 1 1 1 + + 0 `0 = − log det(A0 A) − log det(Ση0 ) − trΣ−1 η [A (2πP0 )(A ) ] 1 2 2 1 + A es la inversa generalizada Moore-Penrose de A. Cuando A es de rango completo igual al número de columnas A+ = (A0 A)−1 A0 . Si existe A−1 entonces A+ = A−1 . 64 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES En (6.5) se aprecia que, como U U ∗ es (2π)−1/2 veces una matriz unitaria, la función de verosimilitud (es decir, la función de densidad de vec(z) con respecto a la muestra) es (2π)nT /2 veces la función de densidad de vec(ω). Entonces, el logaritmo de la función de verosimilitud puede escribirse: T −1 X nT L=− log(2π) + `j 2 j=0 El periodograma de zt no se puede calcular directamente de la muestra, pues depende del parámetro desconocido β. Sin embargo β aparece sólo en `0 , por lo que la función de verosimilitud puede concentrarse en un factor que sólo depende de los otros parámetros del modelo: T −1 X nT 1 1 L =− log(2π) − log det(A0 A) − log det(Ση ) + `j 2 2 2 c j=0 Fernández Macho (1986) propone un algoritmo de scoring para maximizar esta función de verosimilitud. Si θ es el vector de parámetros a estimar, es decir2 θ = α, (diag Ση )0 , (vΣ )0 , se plantea el procedimiento recursivo: θk+1 = θk + λk H(θk ) siendo H el vector de dirección H = φ(θ)−1 dLc (θ) con3 h P −1 i m̄j Dα0 − vec((A+ )0 ) + (Ση A0 ⊗ In ) Tj=1 PT −1 1 1 −1 0 0 0 dLc = H {− 2 vec Ση + 2 (A ⊗ A ) j=1 m̄j } P −1 D0 ( 12 Tj=1 cj m̄j ) .. .. y φ(θ) = φ1 (θ).φ2 (θ).φ3 (θ) donde: φ11 (θ) φ1 (θ) = φ12 (θ) = φ13 (θ) h i P −1 Dα0 {(A0 A)−1 ⊗ (In − AA+ )} − Cnk {(A+ )0 ⊗ A+ } + 2(Ση A0 ⊗ In )( Tj=1 Mj )Nn (AΣη ⊗ In ) Dα P −1 = H 0 {(A0 ⊗ A0 )( Tj=1 Mj )(AΣη ⊗ In )}Dα PT −1 0 D {( j=1 Mj )(AΣη ⊗ In )}Dα 2 vΣ es el vector obtenido de vec(Σ ) eliminando los elementos que están por encima de la diagonal principal de Σ , como Σ es simétrica, vΣ contendrá sólo los elementos distintos de Σ . 3 Las definiciones de Dα , D, m̄j y Mj se pueden ver en Fernández Macho (1986). 65 6.2. ESTIMACIÓN DE MODELOS CON TENDENCIAS COMUNES φ21 (θ) φ2 (θ) = φ22 (θ) φ23 (θ) φ12 (θ) PT −1 1 −1 0 0 = H 0 {− 12 (Σ−1 η ⊗ Ση ) + 2 (A ⊗ A )( j=1 Mj )(A ⊗ A)}H P −1 cj Mj )(A ⊗ A)}H D0 {( Tj=1 φ31 (θ) φ3 (θ) = φ32 (θ) φ33 (θ) φ13 (θ) = φ23 (θ) P −1 2 cj Mj )}D D0 { 21 ( Tj=1 Una vez se han estimado los parámetros que forman el vector θ, la estimación de β se obtiene como: β̃ = T −1 A+ (yT − y0 ) y se puede calcular una estimación de los factores de tendencia por medio de un algoritmo de suavizamiento de intervalo fijo (Ver Harvey, 1989, pág 154). 6.2.2. Método de estimación basado en el modelo de correción de error (Gonzalo y Granger, 1991) Sea xt un vector formado por n series temporales I(1) con media cero y rango de cointegración r. Los elementos de xt pueden explicarse en términos de un número más pequeño (n − r) de variables I(1), µt , llamados factores más unos componentes I(0): xt n×1 = A1 µt n×k k×1 + x̃t n×1 donde k = n − r. Como se vió en el capı́tulo 2, este modelo no está identificado a no ser que se imponga alguna restricción sobre los elementos que lo componen. Gonzalo y Granger proponen unas restricciones distintas a las que se han mencionado en los capı́tulos 2 y 3, y que se han utilizado en el método de estimación visto anteriormente. Una de las condiciones que servirá para identificar los factores comunes µt es imponer que µt sean combinaciones lineales de las variables xt : µt k×1 = B1 xt k×nn×1 (6.6) La otra condición que ayudará a identificar µt es la restricción de que A1 µt y x̃t constituyan los componentes permanente y transitorio, respectivamente, de xt , utilizando la siguiente definición de una descomposición en parte permanente-parte transitoria. Definición 7. (Gonzalo y Granger, 1991) Sea xt una serie estacionaria en diferencias. Una descomposición en parte permanente-parte transitoria (P-T) de xt es un par de procesos estocásticos Pt , Tt tales que: 66 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES i) Pt es estacionario en diferencias y Tt es estacionario en covarianzas, ii) var(∆Pt ), var(∆Tt ) > 0, iii) xt = Pt + Tt , iv) a) lı́m h→∞ ∂Et (xt+h ) 6= 0 ∂P t y b) lı́m h→∞ ∂Et (xt+h ) =0 ∂T t siendo Et la esperanza condicionada a la información disponible hasta el momento t, y siendo P t (T t ) la parte de las innovaciones de Pt (Tt ) que es ortogonal a las innovaciones de Tt (Pt ). Gonzalo y Granger demuestran que las dos restricciones anteriores son suficientes para identificar los factores comunes µt . Y para estimar estos factores se puede utilizar el siguiente procedimiento. Consideremos la representación autorregresiva del vector xt , xt = π1 xt−1 + · · · + πq xt−q + t t = 1, . . . , T (6.7) donde 1 , . . . , T son IINn (0, Λ) y x−q+1 , . . . , x0 son fijos. Es conveniente reescribir el modelo (6.7) en su representación como mecanismo de corrección de error (ECM): ∆xt = Πxt−1 + Γ1 ∆xt−1 + · · · + Γq−1 ∆xt−(q−1) + t donde Γi = −(πi+1 + · · · + πq ) y (6.8) i = 1, . . . , q − 1 Π = −(I − π1 − · · · − πq ) Debido a que xt está cointegrado con rango r, la matriz de multiplicadores de largo plazo Π puede descomponerse en α0 Π = γ n×n n×r r×n donde α es la matriz de vectores cointegrantes y γ son los coeficientes de ajuste. De la representación como mecanismo de corrección de error (ECM) del vector xt , se obtiene que la matriz B1 que hace que la combinación (6.6) proporcione una 0 γ = 0). Esto se descomposición (P-T) del vector xt es γ⊥ , ortogonal a γ (es decir γ⊥ explica porque el ECM del vector xt es: 0 ∆xt = γ α xt−1 + q−1 X Γi ∆xt−i + t i=1 0 x entonces: y si el factor se define como ft = γ⊥ t 0 0 ∆ft = γ⊥ ∆xt = γ⊥ q−1 X i=1 0 Γi ∆xt−i + γ⊥ t 6.2. ESTIMACIÓN DE MODELOS CON TENDENCIAS COMUNES 67 y por tanto ∆ft no depende de zt = α0 xt−1 . Los parámetros (γ, α, Γ1 , . . . , Γq−1 ) intervienen independientemente en la función de verosimilitud, de forma que se puede concentrar el modelo con respecto a Π eliminando los otros parámetros. Esto se hace regresando ∆xt y xt−1 sobre (∆xt−1 , . . . , ∆xt−(q−1) ). Esto proporciona los residuos R0t y R1t y las matrices de productos residuales Sij = T −1 T X 0 Rit Rjt con i, j = 0, 1. t=1 el análisis restante se desarrolla sobre el modelo concentrado R0t = γ α0 R1t + t (6.9) La estimación de α se determina por regresión de rango reducido en (6.9) (ver Anderson, 1984; Johansen, 1988) y se encuentra resolviendo el problema −1 S01 | = 0 |λS11 − S10 S00 para los valores propios λ̂1 > · · · > λ̂n y vectores propios V̂ = (v̂1 , . . . , v̂n ). El estimador máximo verosı́mil viene dado por α̂ = (v̂1 , . . . , v̂r ), γ̂ = S01 α̂ y Λ̂ = S00 − γ̂γ̂ 0 . El estimador máximo-verosı́mil de γ⊥ se obtiene mediante el siguiente procedimiento: En primer lugar, resolver la ecuación −1 S10 | = 0 |λS00 − S01 S11 de donde se obtienen los valores propios λ̂1 > · · · > λ̂n y vectores propios M̂ = (m̂1 , . . . , m̂n ) normalizados de manera que M̂ 0 S00 M̂ = I. Se elige γ̂⊥ tal que γ̂⊥ = (m̂r+1 , . . . , m̂n ) Para ver la distribución asintótica de γ̂⊥ es conveniente descomponerlo como sigue: γ̂⊥ = γ⊥ dˆ + γ â 0 γ )−1 γ 0 γ̂ y â = (γ 0 γ)−1 γ 0 γ̂ donde dˆ = (γ⊥ ⊥ ⊥ ⊥ ⊥ Cuando T → ∞, T 1/2 (γ̂⊥ dˆ−1 − γ) ⇒ N (0, V ) (6.10) 0 Λγ donde “⇒” significa convergencia en distribución, V = γ(γ 0 (Σ00 −Λ)γ)−1 γ 0 ⊗γ⊥ ⊥ y Σ00 = var(∆xt | ∆xt−1 , . . . , ∆xt−(q−1) ). En la práctica, antes de utilizar este procedimiento de estimación es necesario conocer el número de vectores cointegrantes r. En principio, no hay un procedimiento exacto para determinar r, pero Johansen (1988) ha planteado dos métodos que permiten contrastar el número de relaciones de cointegración existentes entre los componentes del vector xt , se conocen como el contraste de la traza y el contraste del mayor valor propio. 68 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES 6.3. Estimación de modelos con factores comunes estacionales 6.3.1. Maximización de la función de verosimilitud espectral del modelo Fernández Macho (1986) presenta una generalización de su procedimiento para posibilitar la existencia de raı́ces unitarias en el componente estacional de los datos. Propone un modelo con factores comunes formados por tendencias estocásticas con pendientes estocásticas y componentes estacionales estocásticos. Es decir, yt n×1 = ψt k×1 = µt k×1 = βt kβ × 1 = βt−1 kβ × 1 = ωt k×1 A ψt n×k k×1 µt k×1 k×1 (6.12) k×1 µt−1 + Aβ βt−1 + ηt t ηt ξt ∼ 0, ωt (6.11) n×1 + st k×1 S(L) st t = 1 − S, . . . , 0, . . . , T + t k × kβ kβ × 1 + (6.13) k×1 (6.14) ξt kβ × 1 (6.15) Σ Ση Σξ (6.16) Σω donde 0 ≤ kβ ≤ k ≤ n. Los factores ψt se suponen independientes, por tanto, las matrices Σv , v ∈ {η, ξ, ω} son diagonales. Para que los factores estén identificados, se supone que A está formada por las k primeras columnas de una matriz triangular hacia abajo. Aβ se supone formada por las kβ primeras columnas de una matriz triangular hacia abajo. Denominando ∆S a S(L) ∆, se tiene que ∆ ∆S yt = A{∆S ηt + Aβ S(L)ξt−1 + ∆2 ωt } + ∆ ∆S t es estacionario, con una función generadora de matrices de autocovarianzas: Gz (u) = (1 − uS )(1 − u−S )AΣη A0 +S(u)S(u−1 )A Aβ Σξ A0β A0 +{(1 − u)(1 − u−1 )}2 A Σω A0 +(1 − u)(1 − u−1 )(1 − uS )(1 − u−S )Σ si se considera λ = Gzj 2πj T se obtiene = Gz (eiλj ) = csj AΣηA0 + (csj /c1j )A Aβ Σξ A0β A0 + +c2ij A Σω A0 + (cij csj )Σ , 6.3. EST. DE MOD. CON FACTORES COMUNES ESTACIONALES 69 donde crj = 2 − 2 cos(rλj ), r ∈ {1, s}, y para λ = 0, Gz0 = s2 A Aβ Σξ A0β A0 como en el caso de factores de tendencia comunes, la transformación de Fourier de {zt }, ({ωj }) se distribuye asintóticamente como N(0, (2π)−1 Gzj ), j = 0, . . . , T − 1. Para este caso, de aquı́ se deduce que el logaritmo de la función de verosimilitud del modelo es: T −1 X nT L(θ) = − log(2π) + `j (θ) (6.17) 2 j=0 siendo θ el vector de parámetros desconocidos, θ = {α0 , αβ0 , (diag Ση )0 , (diag Σξ )0 , (diag Σω )0 , (vΣ )0 } `j = − i 1h log det Gzj + tr{G−1 (2πP )} , zj zj 2 j>0 `0 = −kβ log(S) − 21 log det(A0β A0 AAβ ) − log det Σξ + + 0 −(πS)−2 tr{Σ−1 ξ (AAβ ) Pz0 [(AAβ ) ] } La función L(θ) se maximiza con respecto a los elementos de θ. Una opción posible es utilizar un método de tipo Quasi-Newton como el algoritmo de Gill-Murray-Pitfield que no necesita una evaluación explı́cita de las derivadas, ya que aquı́ la construcción del Hessiano, y con él de un algoritmo de scoring es bastante complicada. Igual que en el modelo de tendencias comunes, una vez estimados los elementos de θ, se utilizarı́a un algoritmo de suavizamiento de intervalo fijo para obtener la estimación de los factores comunes. 6.3.2. Método basado en el modelo de corrección de error El método que a continuación se va a desarrollar es una adaptación del procedimiento de Gonzalo y Granger para la estimación de factores comunes estacionales. Sea xt un vector formado por n series SI(1) con media cero, cointegrado estacional y uniformemente, y con rango de cointegración r. El vector xt se puede escribir, utilizando un modelo de factores comunes, como: xt n×1 = A1 con st n×k k×1 + x̃t (6.18) n×1 S(L) st = ωt siendo ωt un vector de ruidos blancos N(0, Ω). Gonzalo y Granger (1991) para facilitar la estimación de los factores, proponen utilizar como restricciones para la identificación de estos modelos: 1. Considerar los factores como combinaciones lineales de las variables originales, es decir, suponer que st = Bxt siendo B de orden k × n. 70 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES 2. Suponer que A1 st y x̃t constituyen una descomposición de xt en sus componentes permanente y transitorio respectivamente. Ellos demuestran que éstas son dos condiciones suficientes para que los factores de tendencia estén identificados, pero su demostración es perfectamente aplicable al caso de factores estacionales comunes. De esta manera, la ecuación (6.18) se puede escribir: xt n×1 = A1 B xt n×k k×pp×1 + x̃t (6.19) n×1 Definición 8. (Descomposición Permanente-transitoria de una serie estacional) Sea xt una serie integrada estacionalmente (SI) de orden uno, es decir, tal que S(L)xt = ωt es estacionaria. Una descomposición en parte permanente-parte transitoria para xt es un par de procesos estocásticos Pt , Tt tal que: i) S(L)Pt y Tt son estacionarios en covarianzas, ii) var(S(L)Pt ) y var(S(L)Tt ) > 0, iii) xt = Pt + Tt , iv) a) ∂Et (xt+h ) 6= 0 h→∞ ∂P t lı́m y b) ∂Et (xt+h ) =0 h→∞ ∂T t lı́m siendo Et la esperanza condicionada a la información disponible hasta el momento t. Donde si 1t son las innovaciones en el componente permanente y 2t son las innovaciones en el componente transitorio, P t es la parte de las innovaciones de Pt , 1t , que es ortogonal a las innovaciones de Tt , 2t , y T t es la parte de 2t que es ortogonal a 1t . Dada la estructura que se ha supuesto para el modelo de factores4 , existe cointegración estacional uniforme entre los elementos del vector xt (y ningún otro tipo de cointegración estacional). Una vez impuesto que st = B xt , entonces x̃t se puede expresar como x̃t = A2 α0 xt con zt = α0 xt ∼ SI(0) donde α es la matriz que contiene los vectores cointegrantes. Ası́ sólo queda comprobar qué combinaciones lineales de xt hacen que zt no ejerza un impacto a largo plazo sobre xt . Para ello, a continuación se va a desarrollar la representación de mecanismo de corrección de error (ECM) del modelo. En la representación de medias móviles del modelo: S(L) xt = C(L) t (6.20) donde S(L) = 1 + L + L2 + · · · + L11 y el perı́odo al que se recogen los datos es S = 12 (mensual), se conoce (Lee, 1992) que si λ1 , . . . , λ11 son las raı́ces unitarias 4 Ver proposición 1 del capı́tulo 3. 6.3. EST. DE MOD. CON FACTORES COMUNES ESTACIONALES 71 del polinomio S(L), entonces C(λ1 ), . . . , C(λ11 ) son matrices de rango r y tales que α0 C(λ1 ) = 0, . . . , α0 C(λ11 ) = 0. La representación autorregresiva del modelo es: (6.21) A(L) xt = t de (6.20) se obtiene que S(L)C(L)−1 xt = t y, por tanto A(L) = S(L) C(L)−1 A(L) C(L) = S(L) · I y siendo I la matriz identidad (n × n). Dado que λ1 , . . . , λ11 son las raı́ces del polinomio S(L), se tiene que A(λ1 ) C(λ1 ) = 0 A(λ2 ) C(λ2 ) = 0 .. .. . . A(λ11 ) C(λ11 ) = 0 Como C(λ1 ), . . . , C(λ11 ) son combinaciones lineales unas de otras (ya que todas ellas son de rango k y pertenecen al Ker(α0 )), A(λj ) C(λ1 ) = 0 para j = 1, . . . , 11; entonces A(λ1 ), . . . , A(λ11 ) ∈ Ker(C(λ1 )) teniendo en cuenta que, en la representación autorregresiva, A(λ1 ), . . . , A(λ11 ) tienen todas rango r = n − k (ver Dolado, 1990; Lee, 1992; Johansen, 1988), entonces se puede considerar que A(λ1 ), . . . , A(λ11 ) son combinaciones lineales, es decir, A(λ2 ) = A(λ1 ) D2 , . . . , A(λ11 ) = A(λ1 ) D11 siendo D2 , . . . , D11 las matrices n × n de ponderaciones. Para obtener la representación de la serie como un mecanismo de corrección de error (ECM) se utiliza la transformación (Ver Hylleberg et al, 1990; Franses, 1990): A(L) = 11 X k=1 θk S(L) + S(L) A(L)∗∗ δk (L) siendo δk = [1 − (1/λk )L] , θk = Q A(λk ) j6=k δj (λk ) (6.22) (6.23) y A∗∗ (L) un resto con todas sus raı́ces fuera del cı́rculo unidad. Una forma alternativa de escribir (6.22) es: A(L) = 11 X θk k=1 donde A(L)∗ = A(L)∗∗ + P11 S(L) (1 − δk (L)) + S(L) A(L)∗ δk (L) k=1 θk (6.24) 72 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES Desarrollando (6.24) en función de las raı́ces de S(L), λ1 , . . . , λ11 se obtiene: S(L) S(L) 1 1 A(L) = θ1 (−L) S(L) 1+L + θ2 ( i L) 1− 1 L + θ3 (− i L) 1+ 1 L + i i S(L) 1 √ +θ4 − 1 (1+i 3) L 1− + 1 √ L 2 −1 (1+i 3) 2 S(L) 1 √ +θ5 − 1 (1−i L + 1− 1 1 √ L 3) 2 − 2 (1−i 3) S(L) 1√ L + +θ6 1 (1+i 1 √ L 1− 3) 1 2 (1+i 3) 2 1√ + +θ7 1 (1−i 3) L 1− S(L) 1 √ L 1 2 2 (1−i 3) +θ8 − 1 (√1 3+i) L 1− S(L) + 1 L 1 √ 2 − 2 ( 3+i) +θ9 − 1 (√1 3−i) L 1− S(L) + 1 √ L −1 2 ( 3−i) 2 +θ10 1 (√13+i) L 1− S(L) + 1 L 1 √ 2 ( 3+i) 2 + A∗ (L) S(L) +θ11 1 (√13−i) L 1− S(L) 1 √ L 2 1( 2 (6.25) 3−i) Como A(L) es real, los pares (θ2 , θ3 ), . . ., (θ10 , θ11 ) son complejos conjugados. Para evitar los términos complejos de (6.25) se pueden definir las matrices π1 , . . . , π11 de manera que satisfagan las relaciones: θ1 = −π1 θ7 = 12 (−π6 − iπ7 ) θ2 = 21 (−π2 + iπ3 ) θ8 = 12 (−π8 + iπ9 ) θ3 = 21 (−π2 − iπ3 ) θ9 = 12 (−π8 − iπ9 ) θ4 = 21 (−π4 + iπ5 ) θ10 = 21 (−π10 + iπ11 ) θ5 = 12 (−π4 − iπ5 ) θ11 = 21 (−π10 − iπ11 ) θ6 = 12 (−π6 + iπ7 ) Entonces la ecuación (6.25) se puede expresar: A(L) = π1 S1 (L) + π2 S2 (L) + · · · + π11 S11 (L) + A∗ (L) S(L) (6.26) 73 6.3. EST. DE MOD. CON FACTORES COMUNES ESTACIONALES donde S1 (L) = L(1 + L2 + L4 + L6 + L8 + L10 ) S2 (L) = L2 (1 + L + L4 + L5 + L8 + L9 ) S3 (L) = L(1 + L + L4 + L5 + L8 + L9 ) S4 (L) = −L(1 + 2L + L3 + 2L4 + L6 + 2L7 + L9 + 2L10 ) √ S5 (L) = − 23 L(1 + L3 + L6 + L9 ) 1 2 3 4 6 8 9 10 S6 (L) = − √ 2 L(1 − 2L − 3L − 2L + L − 2L − 3L − 2L ) 3 S7 (L) = − L(1 + 2L + 2L2 + L3 + L6 + 2L7 + 2L8 + L9 ) √ 2 S8 (L) = 23 L(1 + 0,4226L + 0,4226L2 + L3 + 1,1547L5 + 0,1547L6 + 0,7320L7 + 0,7320L8 + 0,1547L9 + 1,1547L10 ) S9 (L) = − 12 L(1 − 0,7320L + 1,2679L2 − 0,4641L3 + 0,5359L4 + 0,5359L5 − 6 + 1,2679L7 − 0,7320L8 + L9 ) −0,4641L √ S10 (L) = − 23 L(1 + 1,5773L + 1,5773L2 + L3 − 1,1547L5 − 2,1547L6 − −2,7320L7 − 2,7320L8 − 2,1547L9 − 1,1547L10 ) S11 (L) = 12 L(1 + 2,7320L + 4,7320L2 + 6,4641L3 + 7,4641L4 + 7,4641L5 + +6,4641L6 + 4,7320L7 + 2,7320L8 + L9 ) Anteriormente se ha mencionado que al estar xt cointegrado, las matrices A(λ1 ), . . . , A(λ11 ) son combinaciones lineales unas de otras, esto implica (ec 6.23) que θ1 , . . . , θ11 tambien lo son y lo mismo ocurre con π1 , . . . , π11 . Por tanto, todas las matrices π se pueden expresar en función de una de ellas, por ejemplo la π1 : π2 = π1 Q2 , π3 = π1 Q3 , . . . , π11 = π1 Q11 (6.27) y, por tanto de (6.26) se obtiene A(L) = π1 [S1 (L) + Q2 S2 (L) + · · · + Q11 S11 (L)] + A∗ (L)S(L) donde A∗ (L) es un resto con todas sus raı́ces fuera del cı́rculo unidad. Cada una de las matrices πj es de rango r y se puede descomponer en: πj = γj n×n α0 j : 1, . . . 11. n×r r×n donde γj es la matriz que contiene los coeficientes de ajuste en la frecuencia j-ésima. Teniendo en cuenta (6.27): πj = π1 Qj = γ α0 Qj dado que en adelante va a ser común a todas las frecuencias se ha denominado γ al coeficiente γ1 . En esta expresión se comprueba que la matriz de coeficientes de ajuste es común a todas las frecuencias. Teniendo esto en cuenta, se obtiene A(L) = γ α0 [S1 (L) + Q2 S2 (L) + · · · + Q11 S11 (L)] + A∗ (L)S(L) entonces la ecuación (6.21) se puede expresar: γ α0 [S1 (L) + Q2 S2 (L) + · · · + Q11 S11 (L)] xt + A∗ (L)S(L)xt = t 74 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES y por tanto, A∗ (L)S(L)xt = −γ α0 [S1 (L) + Q2 S2 (L) + · · · + Q11 S11 (L)] xt + t que también se puede escribir como: S(L) xt = −γ α0 [S1 (L) + Q2 S2 (L) + · · · + Q11 S11 (L)] xt + p X + Ai S(L) xt−i + t (6.28) i=1 suponiendo que es de orden p. Esta es la representación ECM del modelo. En el modelo de factores comunes inicial, A∗ (L) (6.29) xt = A1 st + x̃t una vez impuesto que st = B xt , entonces xt se puede expresar como x̃t = A2 α0 xt con zt = α0 xt ∼ SI(0). Tomando como base la representación ECM (6.28), se puede ver que las combinaciones lineales de xt que hacen que zt no ejerza un impacto a largo plazo sobre xt son: 0 s t = γ⊥ xt k×nn×1 donde 0 γ γ⊥ = 0. Ya que 0 S(L) st = γ⊥ p X 0 t Ai S(L) xt−i + γ⊥ i=1 El modelo factorial (6.29) se puede escribir: 0 γ⊥ xt = A1 n×1 x t + A2 n×k k×n n×1 α0 xt n×r r×n n×1 (6.30) Gonzalo y Granger demuestran la proposición siguiente, que determina cuándo existe 0 α0 )0 tiene rango completo. esta descomposición, o en otras palabras, cuándo (γ⊥ Proposición 3. Si la matriz π = γ α0 no tiene más de k = n − r valores propios n×r r×n iguales a cero, entonces (γ⊥ α0 )0 es no singular y existe el modelo factorial (6.30). Si del modelo factorial xt = A1 st + A2 zt se desea obtener una descomposición ortogonal tal que S(L)st y zt estén incorrelacionados en todos los retardos y adelantos, esto se puede hacer de la siguiente forma. Se proyecta zt sobre S(L)st−j para todo j y se obtienen los residuos z̃t = zt − P [zt /S(L)st−j ∀j] entonces A1 s̃t = xt − A2 z̃t y se pueden recuperar los nuevos factores comunes, premultiplicando por la inversa generalizada de A1 : s̃t = (A01 A1 )−1 A01 (xt − A2 z̃t ) es preciso señalar que si zt no son combinaciones lineales de xt , st tampoco lo son. Es lo que se pierde si se requiere ortogonalidad. 6.3. EST. DE MOD. CON FACTORES COMUNES ESTACIONALES 6.3.2.1. 75 Estimación En esta sección se muestra cómo estimar las combinaciones lineales de xt que definen nuestro componente estacional permanente (de largo plazo). Consideremos el modelo de autorregresión vectorial (VAR): xt = φ1 xt−1 + · · · + φm xt−m + t con t = 1, ..., T donde 1 , . . . , T son iiNn (0, Λ) y x−m+1 , . . . , x0 son fijos. Es conveniente escribir el modelo en su forma ECM: S(L) xt = −π1 [S1 (L) + Q2 S2 (L) + · · · + Q11 S11 (L)] xt + p X + Ai S(L) xt−i + t (6.31) i=1 Debido a que xt está cointegrado estacionalmente con rango r, la matriz π1 puede descomponerse en π1 = γ α0 donde α es la matriz de vectores cointegrantes y n×n n×r r×n γ son los coeficientes de ajuste. Los parámetros (γ, α, Q2 , . . . , Q11 , A1 , . . . , Ap−1 ) intervienen de manera independiente en la función de verosimilitud, ası́ que se puede concentrar el modelo con respecto a π1 y Q2 , . . . , Q11 eliminando los otros parámetros. Esto se hace regresando S(L) xt , S1 (L)xt , . . . , S11 (L)xt sobre S(L)xt−1 , . . . , S(L)xt−p+1 . Esto proporciona los residuos R0t , R1t , . . . , R11t . El modelo concentrado queda: R0t = −π1 (R1t + Q2 R2t + · · · + Q11 R11t ) + t y su función de verosimilitud (Lee, 1992) es proporcional a: " T 1X L(Π, D2 , . . . , D11 , Λ) = |Λ| exp − (R0t + Π(R1t + Q2 R2t + 2 t=1 0 −1 + · · · + Q11 R11t )) Λ (R0t + Π(R1t + Q2 R2t + · · · + Q11 R11t )) (6.32) −T /2 Dados γ y α0 (o π1 ) el estimador máximo-verosı́mil de Q2 , . . . , Q11 es el mı́nimocuadrático ordinario. Una vez estimados Q2 , . . . , Q11 , la función de verosimilitud se concentra en torno al coeficiente π1 y el estimador máximo-verosı́mil es también el MCO. Como lo que realmente interesa es el coeficiente π1 se puede concentrar la ecuación en torno a él tomando: U0t : residuos de la regresión de R0t sobre R2t , . . . , R11t . U1t : residuos de la regresión de R1t sobre R2t , . . . , R11t . 76 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES La ecuación queda: U0t = π1 U1t + t y su función de verosimilitud concentrada es proporcional a: # " T X 1 (U0t − π1 U1t )0 Λ−1 (U0t − π1 U1t ) L(Π, Λ) = |Λ|−T /2 exp − 2 (6.33) (6.34) t=1 Llamaremos Sij a las matrices: Sij = T −1 T X 0 Uit Ujt (i, j = 0, 1, 2) t=1 y desde aquı́ se puede utilizar el mismo método que utilizan Gonzalo y Granger para estimar α y γ⊥ , es decir, en (6.33) se estima α por regresión de rango reducido (Ver Anderson, 1984; Johansen, 1988) y se encuentra resolviendo el problema: −1 S01 | = 0 |λS11 − S10 S00 (6.35) para los valores propios λ̂1 > · · · > λ̂n y los vectores V̂ = (v̂1 , . . . , v̂n ). El cálculo de estos valores y vectores propios se puede llevar a cabo por el siguiente procedimiento: En primer lugar, obtener una descomposición de Choleski de la matriz S11 , es decir, encontrar una matriz S tal que SS0 = S. Después, multiplicar la ecuación (6.35) por la izquierda por S−1 y por la derecha por (S0 )−1 obteniendo: −1 S01 (S0 )−1 | = 0 |λ I − S−1 S10 S00 −1 S01 con respecto a la matriz S11 son entonces, los valores propios de la matriz S10 S00 −1 −1 S01 (S0 )−1 con respecto a la matriz los mismos que los de la matriz M = S S10 S00 identidad. Estos valores se hallan por los métodos habituales, ya que cualquier programa de ordenador dedicado a la econometrı́a o estadı́stica (por ejemplo RATS) suele presentar un método para hallarlos. Si X es la matriz de los vectores propios de M (ordenados en función de sus valores propios asociados) y D es la matriz diagonal que contiene los valores propios de M (ordenados) en su diagonal principal, entonces ha de cumplirse que −1 S−1 S10 S00 S01 (S0 )−1 X = X D esto es equivalente a −1 S−1 S10 S00 S01 (S0 )−1 X = S0 (S0 )−1 X D y multiplicando en ambos lados de la ecuación, por la izquierda, por S se obtiene −1 S10 S00 S01 (S0 )−1 X = S11 (S0 )−1 X D 6.3. EST. DE MOD. CON FACTORES COMUNES ESTACIONALES 77 −1 por lo tanto, los vectores propios de S10 S00 S01 con respecto a S11 son (S0 )−1 X. Los estimadores máximoverosı́miles de α, γ y Λ vienen dados por α̂ = (v̂1 , . . . , v̂r ), γ̂ = S01 α̂ y Λ = S00 − γ̂γ̂ 0 . Bajo la hipótesis nula de cointegración estacional, H0 : π1 = γ α0 el estimador de máxima verosimilitud de γ⊥ , se encuentra mediante el siguiente procedimiento: Primero, resolver la ecuación −1 |λS00 − S01 S11 S10 | = 0 (6.36) obteniendo los valores propios λ̂1 > · · · > λ̂n y vectores propios M̂ = (m̂1 , . . . , m̂n ) normalizados de forma que M̂ 0 S00 M̂ = I. Ahora la elección de γ⊥ es: (6.37) γ̂⊥ = (m̂r+1 , . . . , m̂n )) La distribución asintótica de γ̂⊥ se puede observar en (6.10). 6.3.2.2. Estimación de factores completos El método de estimación propuesto en la sección anterior se puede extender fácilmente para realizar la estimación de modelos con factores completos, es decir, factores que son simultáneamente I(1) y SI(1). El modelo planteado serı́a entonces: (6.38) xt = A1 ft + x̃t con (6.39) 12 (1 − L ) ft = ωt Es necesario ahora plantear una nueva definición de descomposición permanentetransitoria: Definición 9. Definición. Sea xt una serie SI(1) y I0 (1), es decir, una serie tal que ∆12 xt = (1 − L12 )xt es estacionaria. Una descomposición en parte permanente-parte transitoria para xt es un par de procesos estocásticos Pt , Tt tal que: i) ∆12 xt , Pt y Tt son estacionarios en covarianzas. ii) var(∆12 Pt ), var(∆12 Tt ) > 0 iii) xt = Pt + Tt iv) a) lı́m h→∞ ∂Et (xt+h ) 6= 0 ∂P t y b) lı́m h→∞ ∂Et (xt+h ) =0 ∂T t donde 1t son las innovaciones en el componente permanente, 2t son las innovaciones en el componente transitorio, P t es la parte de 1t que es ortogonal a 2t y T t es la parte de 2t que es ortogonal a 1t . 78 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES Utilizando el mismo método que en el apartado anterior, se busca un factor que sea una combinación lineal de las variables originales, ft = B xt y que refleje la parte permanente de la descomposición de las series. El modelo de corrección de error es ahora: ∆12 xt = −π1 [Z1 (L) + Q∗2 Z2 (L) + · · · + Q∗12 Z12 (L)] xt + p X + Ai ∆12 xt−i + t (6.40) i=1 donde Q∗2 , . . . , Q∗12 son matrices de coeficientes similares a las de la expresión (6.28) y los polinomios Zj con j : 1, . . . , 12 son5 : Z1 = (1 + L + L2 + · · · + L11 ) Z2 = −(1 − L + L2 − L3 + L4 − L5 + L6 − L7 + L8 − L9 + L10 − L11 ) Z3 = −(L − L3 + L5 − L7 + L9 − L11 ) Z4 = −(1 − L2 + L4 − L6 + L8 − L10 ) 1 Z5 = − (1 + L − 2L2 + L3 + L4 − 2L5 + L6 + L7 − 2L8 + L9 + L10 − 2L11 ) √2 3 Z6 = (1 − L + L3 − L4 + L6 − L7 + L9 − L10 ) 2 1 (1 − L − L2 − L3 + L4 + L5 + L6 − L7 − L8 − L9 + L10 + L11 ) Z7 = 2√ 3 Z8 = − (1 + L − L3 − L4 + L6 + L7 − L9 − L10 ) 2 √ √ √ 1 √ Z9 = − ( 3 − L + L3 − 3L4 + 2L5 − 3L6 + L7 − L9 + 3L10 − 2L11 ) 2 √ √ √ √ 1 Z10 = (1 − 3L + 2L2 − 3L3 + L4 − L6 + 3L7 − 2L8 + 3L9 − L10 ) 2 √ √ √ 1 √ Z11 = ( 3 + L − L3 − 3L4 − 2L5 − 3L6 − L7 + L9 + 3L10 + 2L11 2 √ √ √ √ 1 Z12 = − (1 + 3L + 2L2 + 3L3 + L4 − L6 − 3L7 − 2L8 − 3L9 − L10 ) 2 π1 tiene rango r y se puede expresar como: π1 = γ n×n α0 n×r r×n entonces el modelo ECM se puede escribir: ∆12 xt = −γ α0 [Z1 (L) + Q∗2 Z2 (L) + · · · + Q∗12 Z12 (L)] xt + p X + Ai ∆12 xt−i + t i=1 5 Se puede ver su obtención en la sección 4.4.4 (6.41) 6.3. EST. DE MOD. CON FACTORES COMUNES ESTACIONALES 79 En el modelo de factores comunes (6.38-6.39), una vez impuesto que ft = B xt , entonces x̃t se puede expresar como x̃t = A2 zt con zt = α0 xt estacionario. Tomando como base la representación ECM (6.41), se puede ver que las combinaciones lineales de xt que hacen que zt no ejerza un impacto a largo plazo sobre xt son: 0 ft = γ⊥ xt 0 γ = 0. Ya que donde γ⊥ ∆12 ft = 0 γ⊥ p X 0 Ai ∆12 xt−i + γ⊥ t i=1 El modelo factorial (6.38-6.39) se puede escribir entonces: x t = A1 n×1 0 γ⊥ x t + A2 n×k k×nn×1 α0 xt n×r r×n n×1 (6.42) 0 se puede realizar por el mismo procedimiento que el La estimación de la matriz γ⊥ utilizado para los modelos que presentan factores comunes sólo estacionales y que se ha descrito en el apartado anterior. 80 CAPÍTULO 6. ESTIMACIÓN DE MODELOS DE FACTORES COMUNES Capı́tulo 7 Indicadores económicos 7.1. Introducción En el análisis de la coyuntura macroeconómica es frecuente trabajar con series de indicadores económicos. El análisis de factores comunes, en este contexto sirve para conseguir varios objetivos: en primer lugar uno de ellos, que es común a la mayorı́a de los modelos de análisis factorial clásico, consiste en reducir la dimensión de un conjunto de variables más o menos amplio a un pequeño número de factores comunes a todas ellas; en segundo lugar, un objetivo más especı́fico de este tipo de modelos es comprobar si el componente permanente de diferentes series económicas es común a todas ellas y, en caso de que lo sea, extraerlo y analizarlo. El estudio de estos componentes proporcionará información sobre la estructura de largo plazo de todo el conjunto. La interpretación de los factores es diferente dependiendo del problema que se esté estudiando. En este Capı́tulo se van a realizar dos aplicaciones de modelos de factores comunes a series económicas. La primera de ellas está basada en el análisis de indicadores cı́clicos. Veremos cómo, en este contexto, un modelo de factores comunes puede servir para obtener un ı́ndice sintético de actividad de la economı́a si se aplica a series coincidentes con el ciclo, y un indicador adelantado si se aplica a series adelantadas respecto al ciclo. En tales modelos, la obtención de los factores es de interés en sı́ misma, ya que su análisis puede permitir el conocimiento de aspectos del ciclo económico que en las propias series no se distinguen, o quedan enmascarados junto a las variaciones transitorias y el componente irregular. La segunda aplicación se basa en el estudio de indicadores de producción. El análisis de factores comunes, en este contexto, tiene como objetivo el incorporar en una o varias series la estructura que es común a varios indicadores. En España no se dispone de las publicaciones de los datos del PIB más que anualmente, es decir no se publica trimestral o mensualmente. Cuando se necesita utilizar datos de producción en trabajos econométricos, se suele utilizar como aproximación la serie del ı́ndice de producción industrial, cuyos datos se publican mensualmente. Sin embargo hay que tener en cuenta que la industria en España no representa más que la tercera parte de la producción interior, por lo que si se necesita trabajar con datos más representativos es necesario 81 82 CAPÍTULO 7. INDICADORES ECONÓMICOS considerar, además del IPI, algunas otras variables que no están en él incluidas y cuya publicación es también mensual. En este sentido, el análisis de factores comunes puede llevar a la obtención de un ı́ndice más general (de largo plazo) de producción, ó al menos a determinar si existen series guı́a que afecten en general a la producción en varios sectores y, en su caso, a la determinación de cuáles son los componentes que guı́an a las series de producción. 7.2. Modelo teórico Si se observan los gráficos de las series de datos que se pueden considerar indicadores de la realidad económica, se aprecia fácilmente que en la mayorı́a de ellos existe una fuerte tendencia, además de un componente estacional. Un forma de modelar este tipo de procesos es mediante un modelo estructural. En este caso podrı́a ser: xt = µt + st + t (7.1) µt = β + µt−1 + ηt (7.2) (7.3) S(L) st = ωt siendo {xt } con t : 1, . . . , T una serie temporal, µt el término de tendencia de dicha serie y st el componente estacional; t , ηt y ωt ruidos blancos normal e independientemente distribuidos con media cero y varianzas σ2 , ση2 y σω2 respectivamente. En algunas series se puede apreciar la presencia de una tendencia con pendiente variable a lo largo del tiempo. Para estas series se ajusta mejor que (7.2) una tendencia con pendiente estocástica: µt = µt−1 + βt + ηt (7.4) βt = βt−1 + ξt (7.5) siendo βt la pendiente de la tendencia1 . La existencia de cointegración entre varias series de este tipo, implica (Capı́tulo 3) la existencia de factores comunes. Por tanto, la relación existente entre los distintos indicadores de un mismo grupo, en caso de existir cointegración, se puede expresar por medio de un modelo de factores comunes. Si existiera cointegración sólo en la frecuencia cero, el modelo podrı́a ser: yt n×1 = A µt n×k k×1 + t µt = µt−1 + ηt (7.6) n×1 (7.7) k×1 1 das. Otra posibilidad es plantear un modelo como el definido por (6.1, 6.2 y 6.3) para las series diferencia- 83 7.3. INDICADORES CÍCLICOS siendo yt el vector n × 1 formado por las series de indicadores I0 (1) que pertenecen al mismo grupo, µt el vector k × 1 de factores de tendencia comunes, siendo t y ηt vectores n × 1 y k × 1 respectivamente con elementos I0 (0) y A una matriz n × k de ponderaciones. Si existiera sólo cointegración estacional uniforme el modelo serı́a: yt = A st + t S(L) st = ωt (7.8) (7.9) donde st es el vector k × 1 de factores comunes estacionales, t y ωt son vectores n × 1 y k × 1 respectivamente, formados por elementos que son SI(0). Si hay cointegración completa, el modelo adecuado es: yt = A ft + t S (1 − L )ft = ut (7.10) (7.11) siendo ahora ft el vector k × 1 de factores comunes, t y ut los vectores n × 1 y k × 1 respectivamente, formados por elementos que son simultáneamente I0 (0) y SI(0). La estimación de los factores, en cualquiera de los tres modelos, se puede realizar por los procedimientos descritos en el capı́tulo 5. El método que se va a utilizar para contrastar la existencia de cointegración será el siguiente: en primer lugar se estimarán por MCO todas las posibles normalizaciones, con coeficiente unitario en una de las variables, de la ecuación cointegrante entre el conjunto de series considerado. Es decir, si las series son x1t , x2t y x3t , se plantearán las regresiones: x1t = α10 + α11 x2t + α12 x3t + u1t (7.12) x2t = α20 + α21 x1t + α22 x3t + u2t (7.13) x3t = α30 + α31 x1t + α32 x2t + u3t (7.14) (7.15) se utilizarán los residuos de estas ecuaciones para detectar si existe alguna relación cointegrante. En caso de encontrarse alguna, en segundo lugar, se utilizará el estadı́stico de la traza de Johansen (1988) para determinar el número de vectores cointegrantes. La propiedad de superconsistencia de los estimadores MCO en ecuaciones de cointegración permite mediante la estimación de las ecuaciones (7.12-7.14) encontrar de forma rápida (si es que lo hay) alguno de los vectores cointegrantes. El método de Johansen será útil entonces para contrastar de manera conjunta el número de relaciones cointegrantes existente en el conjunto de series dado. 7.3. Indicadores cı́clicos Los agentes que intervienen en actividades económicas, tanto si pertenecen a empresas como a la administración del Estado, se enfrentan a problemas de tipo muy diferente 84 CAPÍTULO 7. INDICADORES ECONÓMICOS cuando la economı́a del Estado está en crisis que cuando se encuentra en etapa de auge económico. En momentos de crisis es normal enfrentarse a restricciones en los gastos, disminución de empleo, disminución de inversiones, congelación de salarios, etc. mientras que en etapas de auge económico se suelen aumentar las inversiones, el empleo, salarios, gastos, etc. La actividad económica de un paı́s que basa su organización de comercio y producción en una estructura de Economı́a de mercado suele presentar, a corto plazo, fases de crisis y auges que forman fluctuaciones más o menos pronunciadas en torno a su trayectoria de largo plazo. Estas fluctuaciones se suelen denominar ciclos económicos. Los individuos reaccionan de forma diferente cuando la economı́a está en una etapa de crisis que cuando está en un perı́odo de auge, por ello es muy importante conocer en qué punto del ciclo se encuentra la economı́a y hacia dónde está evolucionando. Sin embargo, no es una sola variable la que determina el estado de la economı́a. Hay un sinfı́n de variables macroeconómicas que influyen sobre el estado general de la economı́a y no existe una única variable real que indique el nivel en que se encuentra la actividad económica. Esto hace que los dos objetivos más importantes del análisis cı́clico sean: 1. Detectar en qué etapa del ciclo se encuentra la economı́a. 2. Prever la dirección en que se va a mover a corto plazo, en particular detectar las crisis o auges inminentes. Entre las técnicas para realizar el análisis de la coyuntura, una de las de mayor tradición es la utilización de indicadores cı́clicos. Los indicadores cı́clicos son series de datos que, midiendo aspectos relevantes de la actividad económica, son capaces de reflejar las variaciones cı́clicas de la economı́a. Dentro del análisis de indicadores cı́clicos, uno de los problemas que más atención ha recibido ha sido la determinación de indicadores cı́clicos adelantados. La metodologı́a usada tradicionalmente es bastante sencilla (ver p.ej. Melis, 1982; DGPC, 1983). En primer lugar se toma un gran número de series con un reconocido comportamiento cı́clico. Es decir, un conjunto de series suficientemente largas y donde se aprecien con claridad los periodos recesivos y expansivos. Se comparan las fechas de los picos y valles de cada una de ellas con una cronologı́a de referencia. Se eligen aquellas que de forma sistemática preceden a las crisis y/o los auges de la cronologı́a de referencia y se agregan de algún modo en un indicador compuesto, que será el indicador avanzado de la economı́a. Sin embargo, a partir de los años 70 el perfil de la mayorı́a de las series económicas aparece dominado por una fuerte tendencia, por lo que no serı́a ya correcto hablar de recesiones y expansiones más que en un sentido relativo. Aparece ası́ un nuevo concepto de ciclo económico, llamado ciclo de crecimiento. En él las crisis se caracterizan como perı́odos en los que el ritmo de crecimiento es bajo en relación a la evolución global de la serie y las fases expansivas por un ritmo de crecimiento alto en relación a esa evolución global. Por ello, en el análisis cı́clico actual es normal ver trabajos en los que el ciclo de referencia es un ciclo en términos de crecimiento respecto a una trayectoria global, o tasas de crecimiento. 7.3. INDICADORES CÍCLICOS 85 Uno de los requisitos fundamentales que han de cumplir los indicadores económicos es la disponibilidad de sus datos a frecuencia mensual. Esto implica la aparición en las series de un componente estacional que, unido al irregular, dificulta la observación de su trayectoria de largo plazo. Sin embargo, el tipo de ciclo que el análisis de indicadores trata de detectar corresponde a fluctuaciones que suelen ser de perı́odo superior al año. Por eso, suele interesar trabajar con datos desestacionalizados y suavizados (a los que se ha extraı́do el componente estacional e irregular). Ya en 1982, Melis propuso utilizar las tasas de crecimiento interanual en lugar de las series obtenidas directamente de la realidad. Pero a la luz de las últimas teorı́as sobre raı́ces unitarias estacionales (Engle et al, 1989; Hylleberg et al, 1990) toma mayor relevancia el hecho de que una diferencia estacional (lo que Melis 1982 utiliza para obtener las tasas interanuales) extrae de la serie S raı́ces unitarias ([S − 1] estacionales y una en la frecuencia cero). Esto puede no ser lo más adecuado si la serie no presenta raı́ces unitarias en todas las frecuencias estacionales, ya que aparece un componente de media móvil no invertible que puede llegar a inducir un ciclo estacional en principio inexistente. Además, con este filtro no se desestacionaliza totalmente la serie, ya que después de pasar el filtro puede quedar aún un componente estacional de tipo estacionario (con todas sus raı́ces fuera del cı́rculo unidad). Fernández Macho (1991) propone trabajar con el crecimiento anual de la tendencia (CAT) de las series; utilizando los modelos estructurales de series temporales (MEST) para extraer la tendencia y la tasa de crecimiento subyacente de las series y, posteriormente, trabajar con las tasas de crecimiento subyacentes como estimaciones del CAT. 7.3.1. Cointegración en sistemas de indicadores Siguiendo el esquema tradicional (por ejemplo el presentado por Melis, 1982; DGPC, 1983; Fernández Macho, 1991), es posible realizar una clasificación de los indicadores económicos en función de su comportamiento respecto al ciclo económico. Distinguiremos tres grandes grupos: 1. Indicadores coincidentes con el ciclo. Los picos y valles se encuentran aproximadamente en las mismas fechas que las de la cronologı́a de referencia. 2. Indicadores adelantados. Las épocas de crisis o de auge económico se presentan, en general, en fechas anteriores a las de la cronologı́a de referencia. 3. Indicadores retrasados. Las expansiones y recesiones se presentan, en general, en fechas posteriores a las de la cronologı́a de referencia. Una vez obtenida una clasificación, dentro de un grupo determinado todas las variables se comportarán de modo parecido respecto al ciclo de referencia. Los picos y valles estarán uniformemente adelantados en las series del grupo 2 y uniformemente retrasados en las del grupo 3. Dicho de otra forma, las series de un mismo grupo seguirán aproximadamente una evolución común, aparentando un equilibrio a largo plazo. Si varias series no estacionarias están en equilibrio a largo plazo, deben cumplir una relación de 86 CAPÍTULO 7. INDICADORES ECONÓMICOS cointegración. Por tanto, cabe la posibilidad de que variables pertenecientes al mismo grupo estén cointegradas. Además, como se ha visto en el Capı́tulo 2, la existencia de cointegración implica la presencia de factores comunes a todas las series del grupo. Es posible que sea sólo un pequeño número de factores comunes el que determine la senda por la que se mueven a largo plazo todos los componentes del grupo. En el contexto de indicadores económicos, los factores comunes pueden tener una interpretación bastante lógica. Por ejemplo, supongamos que el grupo de series coincidentes con el ciclo presentara un único factor común; ese factor podrı́a interpretarse como un (único) indicador de la actividad económica a largo plazo. Si existiera un factor común en el grupo de indicadores adelantados, este factor se podrı́a considerar como un representante de todo el grupo, proporcionando ası́ un nuevo indicador adelantado (sintético) que recogerı́a la estructura de largo plazo común a todas las series del grupo. En el grupo de indicadores retrasados se puede hacer una interpretación similar. 7.3.2. 7.3.2.1. Análisis de los indicadores de la Economı́a Española Punto de partida En este apartado se partirá de la clasificación realizada por Fernández Macho (1991) para comprobar las posibles relaciones de cointegración y los posibles factores comunes existentes en el grupo de indicadores que constituye su ciclo de referencia, en el grupo de indicadores adelantados y en el grupo de retrasados. Fernández Macho utilizando datos desde 1968 hasta 1989 y proyecciones para el año 1990 construye en primer lugar un ciclo de referencia basado en el CAT (crecimiento anual de la tendencia) de un conjunto de series afines a la producción, el empleo y el consumo (Toma como base las mismas series utilizadas en 1983 por la Dirección General de Previsión y Coyuntura (DGPC)): a) IPI: Indice general de producción industrial. b) DEMELE: Demanda de energı́a eléctrica. c) DISCEM: Disponibilidades de cemento d) PERHOT: Pernoctaciones en establecimientoes hoteleros. e) TRAMER: Transporte de mercancı́as por ferrrocarril. f) IMNENE: Importaciones reales no energéticas. g) CREPRI: Crédito al sector privado (deflactado por el IPRI general). h) PARNAG: Paro registrado no agrario (considerado inversamente). Para constituir el ciclo de referencia se siguen las recomendaciones del grupo de trabajo sobre análisis cı́clico de la OCDE, según las cuales el ciclo de referencia deberı́a reflejar la producción, en un sentido amplio del término. Se ha seleccionado un conjunto de series representativas de los sectores de la industria, de la construcción y de los servicios, tratando con ello de reflejar la evolución del PIB no agrario, puesto que el 7.3. INDICADORES CÍCLICOS 87 sector primario suele excluirse de este tipo de estudios por su comportamiento especı́fico, ajeno, en gran medida, a las fluctuaciones cı́clicas de la economı́a en general. Se ha descartado la utilización del IPI como único indicador fundamentalmente debido a su insuficiente cobertura, ya que la actividad industrial representa en torno al 30 por ciento del PIB. Tomando como base las ocho series mencionadas, se construye un ı́ndice mensual de actividad y, apartir de él, el ciclo CAT de referencia. El fechado de los puntos crı́ticos del ciclo CAT determina la cronologı́a de referencia de las aceleraciones y desaceleraciones en la actividad económica. Esta cronologı́a de referencia sirve para determinar el grupo al que pertenecen los 31 indicadores parciales estudiados, correspondientes a todas las ramas de actividad de la economı́a. El grupo de los indicadores adelantados está formado por 12 series, de las cuales Fernández Macho utiliza sólo 5 para construir su indicador sintético adelantado. Teniendo en cuenta la dificultad que supone, en el análisis de cointegración, trabajar con un número de series elevado, aquı́ se considerarán como integrantes del grupo solamente estas cinco últimas: a) COLOCA: Colocaciones totales. Es un representante del empleo. b) PROIND: Tendencia de la producción industrial. Representante de producción y consumo. c) NIVCON: Opiniones empresariales sobre el nivel de contratación en la producción. d) STOCON2 : Opiniones empresariales sobre el stock de productos terminados de consumo (tratado inversamente). Representante de la inversión en inventarios. e) M3d: Disponibilidades lı́quidas (deflactadas por el IPC). Representante de la circulación de medios de pago. Nueve de los 31 indicadores estudiados se pueden considerar retrasados respecto a la cronologı́a de referencia. De ellos sólo se seleccionan cinco para formar el indicador sintético retrasado. En el presente trabajo se considerarán sólo estas cinco series como integrantes del grupo de indicadores retrasados respecto al ciclo económico. Las series son: a) IVEGAL: Indice de ventas en grandes almacenes. Representante de la producción y el consumo. b) STOCON: Opiniones empresariales sobre el stock de productos terminados de consumo. Representante de la inversión en inventarios. 2 Fernández Macho (1991) clasifica la variable STOCON multiplicada por -1 como adelantada respecto al ciclo, con un adelanto mediano de +3.5 meses. Sin embargo, clasifica la variable STOCON original como retrasada respecto al ciclo, con un retraso mediano de -11.5 meses. Como en el contexto de factores comunes no es relevante el signo de la variable (quedará determinado en la estimación de la matriz de ponderaciones) aquı́ se utiliza la misma variable en el grupo de adelantados y en el de retrasados. 88 CAPÍTULO 7. INDICADORES ECONÓMICOS c) IPC: Indice general de precios al consumo. Representante del nivel de precios. d) IMPORT: Importaciones totales. e) EXPORT: Exportaciones totales. Los dos últimos, representantes del comercio con el exterior. 7.3.2.2. Estudio de cointegración El análisis de cointegración se va a iniciar tomando como base el conjunto de series que formaron el ciclo de referencia. Los datos utilizados son de periodicidad mensual y comprenden desde Enero de 1977 hasta Noviembre de 1991 (167 observaciones). Las ocho series del grupo (en logaritmos), ası́ como sus correlogramas, periodogramas y los de su primera diferencia se representan en el apéndice de gráficos B, en las páginas 123 a 130. En todas ellas, excepto quizás TRAMER, se nota claramente una tendencia; en algunas de las series creciente (IPI, DEMELE, IMNENE, PARNAG) y en otras con tramos crecientes y decrecientes (DISCEM, CREPRI). En todas se aprecia la existencia de un componente estacional, aunque en series como DISCEM o TRAMER de carácter más débil que en las demás. Observando los correlogramas de las series y de sus primeras diferencias, se aprecian fuertes componentes estacionales en las series IPI, DEMELE, PERHOT, CREPRI y PARNAG. Para cada una de las series se estimará por MCO la ecuación (5.21). Se va a utilizar el estadı́stico t del coeficiente γ0 de la ecuación para contrastar la existencia de una raı́z unitaria en la frecuencia cero, y el estadı́stico FD de los coeficientes γ1 , . . . , γ11 para contrastar la existencia de integración estacional uniforme (ver sección 5.4). 7.3.2.2.1. El ciclo de referencia. El Cuadro 7.1 muestra los valores calculados para los estadı́sticos t(γ0 ) y FD. Para la serie TRAMER, al nivel de significación del 5 % se rechaza la existencia de una raı́z unitaria en la frecuencia cero y de once raı́ces unitarias estacionales. Por tanto, se puede considerar que es I0 (0) y SI(0). Para el resto de las series no se rechaza la existencia de raı́z unitaria en la frecuencia cero. Para las series DEMELE, PERHOT, CREPRI e IPI no se rechaza la hipótesis de integración estacional. Se puede considerar que son SI(1). Para el resto (DISCEM, IMNENE, PARNAG) se rechaza dicha hipótesis al nivel de significación del 5 %, por tanto son SI(0). A continuación, para las series en las que se ha aceptado la presencia de una raı́z unitaria en la frecuencia cero, se comprueba si existe una segunda raı́z unitaria en dicha frecuencia. Para ello se estima la ecuación (6.29) con las series en diferencias. En caso de aceptarse la segunda raı́z unitaria se efectúa el contraste para la tercera. Los resultados se muestran en el Cuadro 7.2. En resumen, tenemos una serie I0 (0) (TRAMER), tres series I0 (1) (DEMELE, IMNENE y DISCEM), y cuatro series I0 (2) (PERHOT, CREPRI, PARNAG e IPI). En 89 7.3. INDICADORES CÍCLICOS Cuadro 7.1: Contraste de raı́z unitaria en la frecuencia cero y de integración estacional uniforme t(γ0 ) FD IPI −0,77 0,21 DEMELE −0,13 1,89 DISCEM 0,76 6,25* PERHOT −1,66 2,43 TRAMER −3,17* 4,81* IMNENE 0,53 5,09* CREPRI −1,46 2,81 PARNAG −1,89 10,60* El valor crı́tico del estadı́stico t(γ0 ) para T = 240 obs. al α = 5 % es de −2,80 (Beaulieu y Miron, 1993). El valor crı́tico del estadı́stico FD para α = 5 % y T = 200 obs. es 3,23 y para T= 150 obs. es 3,12 (Cap.4). cuanto al componente estacional, cuatro series son SI(0) (TRAMER, DISCEM, IMNENE y PARNAG) y las otras cuatro son SI(1) (DEMELE, PERHOT, CREPRI e IPI). Cointegración completa. Sólamente hay tres series integradas del mismo orden estacionalmente y en la frecuencia cero: PERHOT, IPI y CREPRI. Se han estimado por MCO las tres posibles normalizaciones de la ecuación cointegrante entre las tres series, obteniéndose los siguientes resultados: V. Dependiente PERHOT IPI CREPRI t(γ0 ) −1,21 −2,21 −0,80 FD 0,43 0,32 0,26 DHF −0,81 −0,98 −1,20 Cuando, con base en los residuos, se desea contrastar la hipótesis de cointegración completa, el método adecuado es un contraste conjunto de integración en la frecuencia cero e integración estacional, o dicho de otra forma, un contraste conjunto de la existencia de once raı́ces unitarias estacionales y una en la frecuencia cero. Esto es precisamente lo que se plantea en el contraste propuesto por Dickey, Hasza y Fuller (1984) (ver Capı́tulo 4 sección 4.2). Uno de los métodos que plantean, y que utilizaremos aquı́, se basa en el estadı́stico t del coeficiente α de la ecuación: yt = αyt−S + t . Para el caso que nos ocupa, con datos mensuales y sin variables ficticias estacionales, el valor crı́tico del estadı́stico t en las tablas calculadas por Dickey-Hasza-Fuller al nivel de significación del 5 % es de −1,41. El estadı́stico t de Dickey-Hasza-Fuller figura en la tabla anterior bajo el nombre DHF. En los residuos de las tres ecuaciones, tanto usando los estadı́sticos t(γ0 ) y FD como el estadı́stico DHF se acepta la existencia de raı́ces unitarias estacionales y en la frecuen- 90 CAPÍTULO 7. INDICADORES ECONÓMICOS Cuadro 7.2: Varias raı́ces unitarias en la frecuencia cero ∆ DEMELE ∆ PERHOT ∆ IMNENE ∆ CREPRI ∆ PARNAG ∆ IPI ∆ DISCEM t(γ0 ) −3,69 −2,77 −5,43 −1,44 −1,88 −1,70 −5,38 ∆2 PERHOT ∆2 CREPRI ∆2 PARNAG ∆2 IPI −5,72 −6,63 −7,86 −8,75 → Resultados al α = 5 % DEMELE es I0 (1) → IMNENE es I0 (1) → DISCEM es I0 (1) → → → → PERHOT es I0 (2) CREPRI es I0 (2) PARNAG es I0 (2) IPI es I0 (2) cia cero, por tanto no hay cointegración completa entre estas tres series. Sin embargo, aún no se puede determinar si existe cointegración sólo en la frecuencia cero o sólo en las frecuencias estacionales. Del teorema demostrado por Engle, Granger y Hallman (1989, Pág. 50) se deduce que si no existe cointegración en la frecuencia cero, aunque exista en las estacionales, los estimadores de la ecuación cointegrante son inconsistentes; de la misma forma, si no existe cointegración estacional, aunque haya cointegración en la frecuencia cero, los estimadores MCO de la ecuación cointegrante son inconsistentes. Esto implica que para estimar la ecuación cointegrante estacional (cuando no hay cointegración completa) es necesario extraer de cada serie las raı́ces unitarias de la frecuencia cero y para estimar la ecuación cointegrante de la frecuencia cero es necesario extraer las raı́ces unitarias estacionales. Cointegración estacional De las ocho series que forman el grupo, se ha comprobado que cuatro de ellas son integradas estacional y uniformemente, SI(1): DEMELE, PERHOT, IPI y CREPRI. Como DEMELE tiene una raı́z unitaria en la frecuencia cero, es necesario tomar una diferencia (o filtro (1 − L)) para incorporarla en la ecuación cointegrante estacional. PERHOT, IPI y CREPRI tienen dos raı́ces unitarias en la frecuencia cero y, por tanto, se van a diferenciar dos veces (filtro (1 − L)2 ). Se han estimado las cuatro posibles ecuaciones cointegrantes estacionales y calculado los estadı́sticos FD de sus residuos: 91 7.3. INDICADORES CÍCLICOS V. Dependiente ∆2 PERHOT ∆2 IPI ∆2 CREPRI ∆ DEMELE FD de los residuos 2,75 0,61 2,40 1,96 Al nivel de significación del 5 % en ninguno de los cuatro casos se puede rechazar la hipótesis de integración estacional uniforme en los residuos, por lo tanto no se acepta la existencia de cointegración estacional entre las cuatro series. Cointegración en la frecuencia cero En el conjunto de series considerado, hemos visto que hay tres que son I0 (1): IMNENE, DISCEM y DEMELE; y cuatro que son I0 (2): PARNAG, PERHOT, IPI y CREPRI. Antes de empezar el análisis es necesario extraer de cada una de las series las raı́ces unitarias estacionales. Se ha comprobado que DEMELE, PERHOT, IPI y CREPRI son SI(1), por tanto, para extraer sus raı́ces unitarias estacionales lo adecuado es aplicarles el filtro S(L) = 1 + L + · · · + L11 . Sin embargo, todo lo que se sabe hasta ahora de las series PARNAG, IMNENE y DISCEM es que son SI(0) o, dicho de otra forma, que no contienen once raı́ces unitarias estacionales. Por tanto, aún cabe la posibilidad de que contengan un número inferior de raı́ces unitarias estacionales y, si esto es cierto, también es necesario extraer esas raı́ces antes de continuar con el análisis de la frecuencia cero. Para comprobar el número de raı́ces unitarias que contiene cada una de las series utilizaremos los contrastes de HEGY (ver sección 4.4.4 del presente trabajo). Aplicándolos a las series mencionadas se han obtenido los valores del Cuadro 7.3. Cuadro 7.3: Resultados de los contrastes de HEGY Serie PARNAG IMNENE DISCEM Fπ/6 2,88* 9,43 2,43* Fπ/3 12,93 1,95* 2,94* Fπ/2 10,95 3,01 1,34* F2π/3 5,96 4,73 17,36 F5π/6 10,70 2,84* 4,70 tπ 2,15* −2,02 −1,37* (*): no significativo al α = 5 %. El valor crı́tico del estadı́stico F para α=5 % , ω = π/6, . . . , 5π/6 y T = 240 es 3,01. El valor crı́tico del estadı́stico t par a α=5 % y T = 240 es -1.89 (Beaulieu y Miron, 1993) En la serie PARNAG se presentan dos raı́ces unitarias en las frecuencias ±π/6 y una en la frecuencia π. El filtro necesario para extraer estas raı́ces es3 : √ √ √ (1 − 3L + L2 )(1 + L) = 1 + (1 − 3)L + (1 − 3)L2 + L3 3 Ver ecuaciones 5.25 en el apéndice 5.A 92 CAPÍTULO 7. INDICADORES ECONÓMICOS La serie IMNENE contiene raı́ces unitarias en las frecuencias ±π/3 y ±π/6. El filtro correspondiente a estas frecuencias es: √ √ √ √ (1 − L + L2 )(1 + 3L + L2 ) = 1 − (1 − 3)L + (2 − 3)L2 − (1 − 3)L3 + L4 La serie DISCEM presenta raı́ces unitarias en las frecuencias ±π/6, ±π/3, ±π/2 y π; y por tanto, el filtro adecuado a esta serie es: √ (1 − 3L + L2 )(1 − L + L2 )(1 + L2 )(1 + L) = = 1− √ 3L + 2L2 + (1 − √ 3)L3 + (1 − √ 3)L4 + 2L5 − √ 3L6 + L7 Una vez aplicados estos filtros, se estiman las posibles ecuaciones cointegrantes. En primer lugar, se han considerado las relaciones entre las series que son I0 (2): PARNAGf , PERHOTf , IPIf y CREPRIf (el subı́ndice f indica que se han transformado con los filtros antes mencionados). Se han estimado por MCO las cuatro normalizaciones posibles entre estas series. Se va a utilizar el estadı́stico t0 de HEGY para comprobar la existencia de raı́ces unitarias en los residuos de las ecuaciones cointegrantes. El estadı́stico t0 ha tomado los siguientes valores: Vble. endógena PARNAGf PERHOTf IPIf CREPRIf Estadı́stico t0 de los residuos −1,78 −1,17 −1,28 −1,09 Valor crı́tico del estadı́stico t para α=5 % y T = 240: -2.80 (Beaulieu y Miron, 1993) En ninguno de los cuatro casos se puede rechazar la existencia de una raı́z unitaria en la frecuencia cero en los residuos, por tanto no existe cointegración de tipo C(2, 2) entre estas series. Para comprobar la cointegración de tipo C(2, 1) se toma una diferencia en cada una de ellas y se plantean y estiman de nuevo las ecuaciones. Se han obtenido los siguientes valores para el estadı́stico t0 : Vble. endógena ∆ PARNAGf ∆ PERHOTf ∆ IPIf ∆ CREPRIf Estadı́stico t0 de los residuos −2,52 −3,89 −2,79 −1,96 Como se puede observar, al nivel de significación del 5 % se rechaza la existencia de una raı́z unitaria en la ecuación que tiene a ∆PERHOTf como variable dependiente. En las ecuaciones que tienen a ∆PARNAGf y ∆IPIf como variables dependientes el valor del estadı́stico, aunque es superior, está muy cercano al valor crı́tico. Sin embargo, hay que tener en cuenta que se están haciendo contrastes individuales para cada uno de los vectores cointegrantes, cuando, en caso de haber más de uno es más adecuado proponer 93 7.3. INDICADORES CÍCLICOS un contraste conjunto. Por tanto, cabe esperar que no estemos muy lejos de la realidad si, en base a los valores que ha tomado el estadı́stico t0 , suponemos que los residuos de las ecuaciones que toman como variables dependientes a ∆PARNAGf y ∆IPIf no contienen raı́ces unitarias en la frecuencia cero. En tal caso habrı́a tres distintos vectores cointegrantes. Una forma más adecuada de comprobar esto es por medio de uno de los procedimientos de Johansen (1988). Johansen construye dos estadı́sticos que sirven para determinar el rango de cointegración (número de vectores cointegrantes) existente entre un determinado número de series temporales. Aquı́ se va a utilizar el que se denomina estadı́stico de la traza. Su fórmula viene dada por: t(r) = −T n X ln(1 − λ̂h ) h=r+1 siendo n el número de series que se están considerando, r el posible rango de cointegración (se calculará el estadı́stico para distintos valores de r) y λ̂1 , . . . , λ̂n son los valores −1 S01 con respecto a S11 , siendo estas matrices Sij propios ordenados de la matriz S10 S00 las definidas en la ecuación (6.8). Bajo la hipótesis nula de que como máximo hay r vectores cointegrantes, la distribución asintótica del estadı́stico viene dada por una expresión que incluye integrales estocásticas de movimientos Brownianos de la siguiente forma: Z −1 Z Z 0 0 dB F F F du F dB 0 donde B es un vector de movimiento Browniano, y F es una función de B que incluye diferentes componentes deterministas para diferentes hipótesis nulas. La aproximación a esta distribución por medio de simulaciones ha sido tabulada por Johansen (1988) y por Osterwald-Lenum (1992). En el caso que nos ocupa, el estadı́stico de la traza ha tomado los siguientes valores4 : (se ha restado la media a cada variable) t(0) = 586,23 t(1) = 239,23 t(2) = 86,51 t(3) = 0,72 V.Crı́tico t(0) (5 %) = 47,21 V.Crı́tico t(1) (5 %) = 29,68 V.Crı́tico t(2) (5 %) = 15,41 V.Crı́tico t(3) (5 %) = 3,76 Por tanto, se rechazan las hipótesis de que como máximo hay 0, 1 y 2 vectores cointegrantes y no se rechaza la hipótesis de que el rango de cointegración sea como máximo 3. Esto ratifica la conclusión que se habı́a obtenido al analizar los residuos MCO de las ecuaciones cointegrantes, es decir, que existen tres vectores cointegrantes. Dado que el número de factores comunes a n series es n menos el rango de cointegración, esto implica la presencia de un único factor de tendencia común a estas cuatro series. 4 Valores crı́ticos tomados de Osterwald-Lenum (1992) 94 CAPÍTULO 7. INDICADORES ECONÓMICOS Utilizando el método de Gonzalo y Granger (1995) (ver sección 6.2.2) se ha estimado el factor de tendencia común (para ello se ha restado a cada variable su media), obteniendo como resultado: f actor = −8,33∆P ARN AGf − 5,39∆P ERHOTf + +5,10∆IP If − 187,67∆CREP RIf (7.16) Se ha representado gráficamente esta serie en la página 131, dado que para las series que forman el factor se disponı́a de datos desde mayo de 1972, se han añadido estos datos en la representación gráfica del mismo. Siguiendo a lo largo del tiempo la evolución de éste, se aprecia en primer lugar un decrecimiento de la serie, alcanzando un mı́nimo local a mediados del 75. Esto significa que el ritmo de crecimiento de la actividad económica fue disminuyendo hasta alcanzar esta fecha, probablemente debido al primer impacto de la crisis del petróleo. Entre finales del 75 y principios del 76 se nota una pequeña recuperación, alcanzando un máximo local en mayo del 76. Sin embargo, a partir de esa fecha continúa decreciendo la trayectoria del factor hasta alcanzar un mı́nimo en marzo del 78. Esto puede corroborar lo que muchos observadores económicos han comentado, el retraso en llegar a España de la crisis del petróleo. Dado el fuerte ritmo de crecimiento de la economı́a española en los años setenta, la crisis del petróleo no significó en principio una fuerte caı́da en los niveles de actividad, sino simplemente una disminución en la tasa de crecimiento de esta actividad, que sólo al cabo de unos años (77-78) pudo tener consecuencias en términos de nivel. En la trayectoria del factor se detectan con bastante claridad las tres grandes etapas de la economı́a española a lo largo de los últimos años. Una primera etapa de alto crecimiento, aproximadamente hasta finales de 1976; una fase de estancamiento desde principios del 77 hasta finales del 84; y una fase de recuperación que comienza a principios de 1985 y alcanza su máximo ritmo de crecimiento en el primer semestre de 1989. A partir de los últimos meses del 89 se distingue una fuerte disminución en la tasa de crecimiento de la economı́a, manteniéndose hasta el final de la muestra estudiada. Se puede comparar el factor común aquı́ estimado con el ciclo CAT de referencia utilizado en Fernández Macho (1991). Para ello hay que tener en cuenta que en la elaboración del ciclo CAT las tasas anuales están centradas respecto al año, lo cual supone un retraso respecto a las transformaciones que aquı́ se utilizan (y al factor común) de seis meses. La situación relativa de los máximos y mı́nimos locales es aproximadamente la misma en ambos ciclos. Fundamentalmente se detectan dos máximos, aproximadamente en los años 81-82 y 88-89 y dos mı́nimos en los años 77 y 84. La mayor diferencia entre ambas series está en la importancia relativa dada al mı́nimo del año 75, que en el ciclo CAT llega a ser el mı́nimo global del perı́odo analizado y sin embargo en nuestro factor común, aunque se detecta, parece tener poca importancia. Hay que tener en cuenta que la diferencia fundamental entre las dos series es que en la de Fernández intervienen las ocho series del grupo con las mismas ponderaciones y sin embargo en el factor aquı́ estimado intervienen sólo las cuatro series que son I0 (2), y la ponderación otorgada a cada una no se ha fijado de antemano, sino que ha sido determinada en base a los coeficientes que se derivan del modelo de corrección de error. El modelo de corrección de error correspondiente a este conjunto de series sigue la 95 7.3. INDICADORES CÍCLICOS ecuación: ∆ xt = γ zt−1 + Γ1 ∆ xt−1 + · · · + Γq ∆ xt−q + t (7.17) siendo xt = (∆P ARN AGf , ∆P ERHOTf , IP If , CREP RIf )0 y zt = α0 xt siendo α0 la matriz que tiene como filas los vectores cointegrantes. La estimación de las relaciones cointegrantes (por el método de Johansen 1988) ha proporcionado los siguientes resultados: ẑ1t = 752,9∆P ARN AGf + 1481,4∆P ERHOTf + 18818,7∆IP If +1476,2∆CREP RIf ẑ2t = 352,0∆P ARN AGf + 1292,6∆P ERHOTf + 12027,2∆IP If −965,4∆CREP RIf ẑ3t = 839,1∆P ARN AGf + 8233,2∆P ERHOTf + 9351,6∆IP If −362,8∆CREP RIf En la estimación de los coeficientes del modelo de corrección de error (7.17), se ha utilizado el estadı́stico Q de Ljung-Box para determinar el número de retardos autorregresivos q a incluir en la ecuación, y se han obtenido los siguientes valores estimados5 : (N.Obs utiles = 148, Grados de libertad = 76, q = 18) ∆2 (P ARN AGf )t = 0,88z1t−1 + 6,57z2t−1 + 26,9z3t−1 + +retardos de ∆2 (P ARN AGf )t , ∆2 (P ERHOTf )t , ∆2 (IP If )t , ∆2 (CREP RIf )t + ˆ1t ∆2 (P ERHOT ) = 2,38z1t−1 + 7,64z2t−1 + 1,21z3t−1 + +retardos de ∆2 (P ARN AGf )t , ∆2 (P ERHOTf )t , ∆2 (IP If )t , ∆2 (CREP RIf )t + ˆ2t ∆2 (IP I) = 114,11z1t−1 − 111,46z2t−1 + 60,95z3t−1 + +retardos de ∆2 (P ARN AGf )t , ∆2 (P ERHOTf )t , ∆2 (IP If )t , ∆2 (CREP RIf )t + ˆ3t ∆2 (CREP RI) = 34,39z1t−1 + 26,65z2t−1 + 0,56z3t−1 + +retardos de ∆2 (P ARN AGf )t , ∆2 (P ERHOTf )t , ∆2 (CREP RIf )t + ˆ1t 5 Las variables se han expresado en desviaciones con respecto a sus medias. 96 CAPÍTULO 7. INDICADORES ECONÓMICOS El vector de ponderaciones se ha estimado aplicando MCO a la ecuación: (7.18) xt = κ + A1 ft + A2 zt + ut en el modelo factorial se ha añadido un vector de constantes κ debido a que las variables6 no parecen tener media cero, el resultado de la estimación de los vectores κ y A ha sido: 0,410E − 03 0,404E − 02 (0,55E − 11) (0,49E − 10) −0,628E − 03 0,152E − 01 (0,85E − 11) (0,75E − 10) A1 = κ= 0,824E − 04 ; 0,618E − 02 (0,11E − 11) (0,98E − 11) −0,536E − 02 0,196E − 01 (0,73E − 10) (0,64E − 09) En los gráficos de las páginas 131-133 se representan las cuatro series filtradas y diferenciadas, con el factor común ponderado por el peso correspondiente a cada variable más la constante. Tanto en los gráficos como en los propios coeficientes del factor (7.16) se aprecia cómo está fundamentalmente dominado por la variable ∆CREPRIf . Para comprobar si se puede considerar que ∆CREPRIf es realmente el factor común a las cuatro series, se ha estimado la ecuación (7.18) sustituyendo el factor ft por la variable ∆CREPRIf . Si esto fuera cierto, el vector de perturbaciones de dicha ecuación habrı́a de ser ruido blanco. Sin embargo, los residuos de las ecuaciones que tienen como variables endógenas a ∆IPIf y ∆PARNAGf muestran autocorrelación (Q(36) = 288,5 en el IPI y Q(36) = 87,24 en PARNAG) y el estadı́stico t(γ0 ) aplicado a estas series de residuos toma los valores −1,32 y −2,58 respectivamente, reflejando la existencia de una raı́z unitaria en cada una de ellas. La variable ∆CREPRIf por sı́ sola no es capaz de recoger toda la estructura de largo plazo de las series ∆IPIf y ∆PARNAGf y, por tanto, no se puede considerar que ella sea el factor común. La varianza total del conjunto se ha estimado en 0,0143 y la explicada por el factor ha sido 0,0022, que supone el 15, 81 % del total. Multiplicando el factor por el coeficiente correspondiente a ∆PARNAGf en la matriz de ponderaciones, se obtiene una forma de expresar el factor acorde con las restricciones mencionadas en el capı́tulo 2, es decir, un factor cuya matriz de ponderaciones está formada por la primera columna de una matriz triangular hacia abajo y con los elementos de la diagonal unitarios (Ecuación 2.8). Entonces el modelo de factores comunes se puede escribir: xt = κ + A∗1 ft∗ + νt (7.19) siendo ft∗ = 0,410E − 03 ft , νt un vector de elementos I0 (0) y 1,00 −1,53 A∗1 = 0,20 13,07 6 Aquı́ se han tomado las variables originales, sin restarles las medias. 97 7.3. INDICADORES CÍCLICOS Como las variables PERHOT, IPI, CREPRI y PARNAG forman un conjunto cointegrado de tipo C(2, 1), los residuos de las ecuaciones cointegrantes planteadas en niveles son I0 (1) y, a su vez, pueden estar cointegrados con otras variables de tipo I0 (1), como pueden ser IMNENE, DISCEM y DEMELE. De esta forma, es posible que las siete variables formen un conjunto cointegrado aún cuando no son todas integradas del mismo orden. Denominaremos ˆP AR a la serie de residuos de la ecuación cointegrante que tiene como variable dependiente a PARNAGf y como variables explicativas a PERHOTf , IPIf y CREPRIf además de una constante. Llamaremos ˆP ER a la serie de residuos de la ecuación que tiene como variable dependiente a PERHOTf y como variables explicativas a PARNAGf , IPIf y CREPRIf ; y denominaremos ˆIP I a la serie de residuos de la ecuación que tiene como variable dependiente a IPIf y como variables explicativas a PARNAGf , PERHOTf y CREPRIf . Consideraremos los tres posibles conjuntos cointegrados: Conjunto 1 IMNENEf DISCEMf DEMELEf ˆP ER Conjunto 2 IMNENEf DISCEMf DEMELEf ˆIP I Conjunto 3 IMNENEf DISCEMf DEMELEf ˆP AR La estimación de las cuatro posibles normalizaciones de la ecuación cointegrante dentro del conjunto 1, produce cuatro series de residuos cuyos estadı́sticos t0 son: Vble. Dependiente IMNENEf DISCEMf DEMELEf ˆP ER t0 −1,97 −1,03 −2,20 −1,99 Al nivel de significación del 5 % en ninguno de los cuatro casos se puede rechazar la existencia de una raı́z unitaria en los residuos, por tanto ninguna de ellas es una ecuación de cointegración. La estimación de las cuatro normalizaciones dentro del conjunto 2 presenta los siguientes resultados: Vble. Dependiente IMNENEf DISCEMf DEMELEf ˆIP I t0 −3,02 −1,00 −3,36 −2,49 En dos de las series de residuos (IMNENEf y DEMELEf ) se puede rechazar la existencia de una raı́z unitaria al nivel de significación del 5 % y en una tercera (ˆ IP I ) el 98 CAPÍTULO 7. INDICADORES ECONÓMICOS valor del estadı́stico t0 , aunque superior, se encuentra muy cercano al valor crı́tico de la distribución. La estimación de las cuatro normalizaciones dentro del conjunto 3 presenta los siguientes resultados: Vble. Dependiente IMNENEf DISCEMf DEMELEf ˆP AR t0 −2,78 −2,23 −2,57 −2,31 En ninguna de las cuatro ecuaciones se rechaza claramente la existencia de una raı́z unitaria en los residuos; por tanto, ninguna de ellas se acepta como ecuación cointegrante. Sólo se ha encontrado cointegración dentro del conjunto 2. Se han encontrado como mı́nimo dos vectores cointegrantes y muy probablemente un tercero. Sin embargo, como la situación de los valores crı́ticos cuando se trabaja con series de residuos no está muy bien definida, pasaremos a construir el contraste de la traza de Johansen para ver si se pueden ratificar los resultados antes mencionados. Al aplicarlo a las cuatro series que forman el conjunto 2 se han obtenido los siguientes resultados: t(0) = 130,4 t(1) = 25,74 t(2) = 2,57 t(3) = 1,13 V.Crı́tico = 47,21 V.Crı́tico = 29,68 V.Crı́tico = 15,41 V.Crı́tico = 3,76 Se rechaza la existencia de cero vectores cointegrantes (α = 5 %), pero se acepta la existencia de al menos uno. Esto contradice los resultados que aparentemente se obtenı́an mediante el estadı́stico t0 , pero dado que los valores crı́ticos de t0 no están bien definidos para series de residuos, se puede considerar más fiable el resultado que indica el estadı́stico de la traza. Esto implica la existencia de tres factores comunes a estas series. Sin embargo, la existencia de un componente común de largo plazo determinado por tres factores, cuando el número de series considerado es de cuatro, no facilita mucho la interpretación de la información común, al contrario de lo que ocurre en un modelo en el que sólo haya uno o dos factores comunes. Aunque la capacidad explicativa del modelo, en términos cuantitativos puede ser alta, la explicación desde un punto de vista descriptivo del componente común de largo plazo se complica bastante, por ello no se ha considerado interesante la estimación de los factores en este caso. 7.3.2.2.2. Indicadores adelantados A continuación se va a analizar el grupo de los indicadores adelantados. Las cinco series del grupo junto con sus correlogramas, periodogramas y los de sus primeras diferencias se recogen en las páginas 134 a 138. En primer lugar, se comprueba el orden de integración estacional uniforme y el orden de integración en la frecuencia cero. Para ello se utilizan los estadı́sticos FD y t(γ0 ) ya mencionados. 99 7.3. INDICADORES CÍCLICOS Cuadro 7.4: Contraste de raı́z unitaria en la frecuencia cero y de integración estacional uniforme (Indicadores adelantados) t(γ0 ) FD COLOCA −1,14 2,62 PROIND −1,85 3,16 NIVCON −1,34 11,04 STOCON −1,73 44,52 M3d 1,62 3,79 El valor crı́tico del estadı́stico t(γ0 ) para T = 240 obs. al α = 5 % es de −2,80 (Beaulieu y Miron, 1993). El valor crı́tico del estadı́stico FD para α = 5 % y T = 200 obs. es 3,23 y para T= 150 obs. es 3,12 (Cap.4). El estadı́stico FD muestra que, al nivel de significación del 5 %, se puede admitir que COLOCA es una serie integrada estacionalmente de orden uno, sin embargo las demás son SI(0). Tomando como base el estadı́stico t(γ0 ) se aprecia que todas ellas contienen al menos una raı́z unitaria en la frecuencia cero. Aplicando el estadı́stico a las series diferenciadas se han obtenido los siguientes valores: Serie ∆COLOCA ∆PROIND ∆NIVCON ∆STOCON ∆M3d t(γ0 ) −2,85 −5,68 −6,23 −5,07 −2,90 Como se puede apreciar, al nivel de significación del 5 % se rechaza en todos los casos la existencia de una segunda raı́z unitaria, por tanto todas las series son I0 (1). Antes de analizar si existe o no cointegración en este grupo, es necesario filtrar las raı́ces unitarias estacionales que contenga cada una de las series. Para detectarlas utilizamos los estadı́sticos de HEGY. Los resultados se presentan en el Cuadro 7.5. El filtro adecuado a la serie COLOCA es S(L), ya que esta serie es integrada estacional y uniformemente SI(1). La serie PROIND presenta raı́ces unitarias en las frecuencias ±π/3, ±π/2, ±5π/6 y π; por lo tanto, el filtro apropiado para esta serie es: √ (1 − L + L2 )(1 + L2 )(1 + 3L + L2 )(1 + L) = = 1+ √ √ √ √ 3L + 2L2 + (1 + 3)L3 + (1 + 3)L4 + 2L5 + 3L6 + L7 Las series NIVCON y STOCON no presentan raı́ces unitarias estacionales, por lo que no es necesario filtrarlas. M3d contiene raı́ces unitarias en las frecuencias ±π/3, ±π/2 y ±2π/3. El filtro adecuado a estas frecuencias es: (1 − L + L2 )(1 + L2 )(1 + L + L2 ) = 1 + 2L + 2L4 + L6 100 CAPÍTULO 7. INDICADORES ECONÓMICOS Cuadro 7.5: Resultados de los contrastes de HEGY (Indicadores adelantados) Serie PROIND NIVCON STOCON M3d Fπ/6 6,30 14,02 9,50 5,82 Fπ/3 0,45* 7,11 10,10 2,79* Fπ/2 1,41* 10,21 3,65 2,97* F2π/3 4,15 5,76 13,18 1,81* F5π/6 2,35* 4,52 8,36 3,60 tπ −1,34* −2,23 −3,38 −2,08 (*): no significativo al α = 5 %. El valor crı́tico del estadı́stico F para α=5 % , ω = π/6, . . . , 5π/6 y T = 240 es 3,01. El valor crı́tico del estadı́stico t par a α=5 % y T = 240 es -1.89 (Beaulieu y Miron, 1993) Se han estimado las cinco posibles normalizaciones de las relaciones de cointegración existentes entre las cinco series debidamente filtradas. Se utiliza el estadı́stico t(γ0 ) para comprobar el grado de integración de los residuos. Vble. endógena STOCON PROINDf COLOCAf NIVCON M3df t(γ0 ) −2,12 −1,61 −2,69 −1,80 −2,85 Al α = 5 % sólo se rechaza la existencia de una raı́z unitaria en los residuos de la ecuación que tiene como variable endógena a M3d filtrada. Sin embargo el valor del estadı́stico t(γ0 ) está muy cerca del valor crı́tico correspondiente y el gráfico de la serie y sus correlogramas parecen indicar la presencia de una raı́z unitaria. Si se calcula el estadı́stico t0 de HEGY, éste toma un valor de −1,90 lo cual confirma la existencia de la raı́z unitaria. Por tanto, consideraremos que ninguna de las cinco es una relación de cointegración en la frecuencia cero, lo cual implica que no existe ningún factor común a estas cinco series. Cabe aún la posibilidad de que un subconjunto de ellas esté cointegrado. Sin embargo en ninguno de los cuartetos o trı́os probados se ha encontrado evidencia de cointegración. Ante esta aparente contradicción entre los modelos aquı́ utilizados y el método utilizado por Fernández Macho (1991), hay que señalar que al realizar la clasificación en el artı́culo de Fernández Macho se permite, dentro de cada grupo, que las series tengan distintos desfases en sus puntos crı́ticos. En concreto se han clasificado como adelantadas aquellas series cuyos puntos crı́ticos presentan un adelanto mediano de más de dos meses, y como retrasadas las que presentan un retraso mediano de más de dos meses. Dentro de un mismo grupo se encuentran entonces series con distintos intervalos de adelanto respecto al ciclo de referencia; por ejemplo COLOCA, PROIND y M3d tienen un adelanto mediano de 6,5 meses, sin embargo el adelanto mediano de NIVCON es de 16 101 7.3. INDICADORES CÍCLICOS meses, y el de STOCON(multiplicado por -1) sólo de 3,5 meses. A esto hay que añadir el hecho de que cada una de las series no presenta un adelanto homogéneo respecto al ciclo de referencia, sino que, en general presentan mayor adelanto en los valles que en los picos. Sin embargo estos pequeños desfases no se tienen en cuenta en los modelos de factores comunes, en los que las variaciones en el componente de largo plazo han de ser simultáneas para todas las series del modelo, y la relación entre dicho componente y cada una de las series ha de permanecer constante a lo largo de todo el periodo muestral. La no homogeneidad de los desfases de cada serie, en todos los puntos, respecto al ciclo de referencia es un problema conflictivo y de difı́cil solución. 7.3.2.2.3. Indicadores retrasados Seguidamente se seguirá el mismo procedimiento para analizar el grupo de los indicadores retrasados respecto al ciclo. En las páginas 137 y 139 a 142 se muestran los gráficos de estas series ası́ como sus correlogramas, periodogramas y los de sus primeras diferencias. La aplicación de los estadı́sticos FD y t(γ0 ) a estas series, proporciona los siguientes resultados: Serie IVEGAL STOCON IPC IMPORT EXPORT t(γ0 ) −2,13 −1,73 −2,69 −1,59 −3,07 FD 0,85 44,52 7,94 8,54 3,27 Sólamente en la serie IVEGAL se acepta la existencia de once raı́ces unitarias estacionales. Por tanto esta serie es SI(1), pero las demás son SI(0). En lo que se refiere a la frecuencia cero, en todas las series se acepta la existencia de al menos una raı́z unitaria excepto en EXPORT. Sin embargo, si se analizan el gráfico de esta serie y sus correlogramas es fácil detectar la existencia de una tendencia; y el valor que ha tomado el estadı́stico t(γ0 ) para esta serie, aunque inferior, está muy cercano al valor crı́tico de la distribución correspondiente, por tanto su importancia no debe ser determinante en este caso y, teniendo en cuenta el gráfico y los correlogramas, se puede aceptar que contenga también una raı́z unitaria. A continuación se calcula el estadı́stico t(γ0 ) sobre las series diferenciadas para intentar detectar la existencia de una segunda raı́z unitaria en la frecuencia cero: Serie ∆IVEGAL ∆STOCON ∆IPC ∆IMPORT ∆EXPORT t(γ0 ) −5,07 −4,69 −2,89 −5,88 −6,69 102 CAPÍTULO 7. INDICADORES ECONÓMICOS Para las cinco series se rechaza a un nivel de significación α = 5 % la existencia de una segunda raı́z unitaria, aunque el valor que ha tomado el estadı́stico para la variable IPC está muy cercano al valor crı́tico (−2,80) y en su gráfico y los de sus correlogramas parece apreciarse que la serie aún no es estacionaria. Como no puede existir cointegración estacional, ya que sólo una variable (IVEGAL) está integrada estacional y uniformemente, pasamos a estudiar la cointegración en la frecuencia cero. Antes de estimar las posibles relaciones cointegrantes, igual que se hizo para los dos grupos de indicadores anteriores, es necesario extraer las raı́ces unitarias estacionales de cada serie. Para detectarlas, de nuevo, se utilizan los estadı́sticos de HEGY, que pueden verse en el Cuadro 7.6. Cuadro 7.6: Resultados de los contrastes de HEGY (Indicadores retrasados) Serie STOCON IPC IMPORT EXPORT Fπ/6 9,50 9,87 11,98 4,91 Fπ/3 10,10 4,12 2,45* 1,33* Fπ/2 3,65 7,71 5,61 2,66* F2π/3 13,18 2,46* 6,63 3,13 F5π/6 8,36 9,41 6,43 0,97* tπ −3,38 −2,05 −2,86 −1,72* (*): no significativo al α = 5 %. El valor crı́tico del estadı́stico F para α=5 % , ω = π/6, . . . , 5π/6 y T = 240 es 3,01. El valor crı́tico del estadı́stico t par a α=5 % y T = 240 es -1.89 (Beaulieu y Miron, 1993) Del Cuadro, se deduce que la serie STOCON no contiene ninguna raı́z unitaria estacional, por tanto no es necesario filtrarla. La serie IPC tiene raı́ces unitarias en las frecuencias ±2π/3; esto implica que ha de transformarse con el filtro: (1 + L + L2 ). La serie IMPORT contiene raı́ces unitarias en las frecuencias ±π/3 y, por tanto, con ella ha de utilizarse el filtro: (1 − L + L2 ). EXPORT presenta raı́ces unitarias en ±π/3, ±π/2, ±5π/6 y π. El filtro correspondiente a estas frecuencias es: √ (1 − L + L2 )(1 + L2 )(1 + 3L + L2 )(1 + L) = =1+ √ 3L + 2L2 + (1 + √ 3)L3 + (1 + √ 3)L4 + 2L5 + √ 3L6 + L7 La serie IVEGAL presenta once raı́ces unitarias estacionales, lo cual implica que ha de filtrarse mediante el polinomio S(L). Una vez filtrada la serie IPC se comprueba cómo efectivamente presenta una segunda raı́z unitaria en la frecuencia cero, pues el estadı́stico t(γ0 ) aplicado a la serie ∆IP Cf toma el valor −1,97, por lo tanto se considerará que es I0 (2). Seguidamente se estiman por MCO las cuatro posibles especificaciones de la relación entre IVEGALf , STOCON, IMPORTf y EXPORTf y se comprueba el orden de integración de los residuos. 103 7.3. INDICADORES CÍCLICOS Vble. endógena IVEGALf STOCON IMPORTf EXPORTf t(γ0 ) −1,15 −1,99 −2,19 −1,57 En las cuatro ecuaciones se obtienen residuos I0 (1), lo cual indica la inexistencia de cointegración en este grupo y, por tanto, no se puede representar este grupo mediante un modelo de factores comunes. 7.3.3. Conclusiones Esta primera parte del capı́tulo ha tomado como base una clasificación de los indicadores cı́clicos realizada por Fernández Macho (1991). En dicho trabajo se presenta un agrupamiento de los indicadores en función de su comportamiento con respecto al ciclo económico, obteniendo tres grandes grupos: indicadores adelantados, indicadores coincidentes con el ciclo e indicadores retrasados respecto al ciclo. En el presente trabajo se ha realizado un estudio de la posible cointegración dentro del grupo de indicadores que formaron el ciclo de referencia, después dentro del grupo de adelantados respecto al ciclo y finalmente en el grupo de indicadores retrasados. En ninguno de los grupos se ha encontrado cointegración estacional. Esto ha sido debido fundamentalmente a que no existe un mismo patrón estacional en la estructura permanente de las series. El número de raı́ces unitarias estacionales que presenta cada serie es distinto, y además estas raı́ces no se presentan para todas las series en las mismas frecuencias. El análisis de la frecuencia cero ha mostrado que cuatro de las series consideradas son integradas de orden 2 y forman un conjunto cointegrado de tipo C(2, 1). En este conjunto se encuentran tres vectores cointegrantes, y por tanto un sólo factor común. La existencia de cointegración de tipo C(2, 1) entre las series en niveles (sin diferenciar) implica que las cuatro series, diferenciadas, presentan cointegración de tipo C(1, 1). Por tanto, hay un sólo factor común (paseo aleatorio) entre las series de crecimientos de las variables originales. Este hecho sirve para ratificar, de alguna manera, la opinión reflejada en DGPC (1983) o en Fernández Macho (1991) de que en los tiempos actuales los ciclos más relevantes son los ciclos de crecimiento, y no los de nivel. Además los ciclos que se obtienen a partir del análisis de cointegración son ciclos en términos de tasas de crecimiento, y no en términos de desviaciones con respecto a una trayectoria, como se hacı́a en DGPC (1983). Dado que las cuatro series, que se suponen en fase con el ciclo económico, presentan un factor común en sus crecimientos, esto significa que la evolución de estas cuatro series de crecimientos se ve guiada por un crecimiento común, y por tanto ese factor se puede interpretar como un ı́ndice de crecimiento de la actividad económica. El análisis gráfico y numérico del factor con respecto a las cuatro series muestra cómo en éste interviene con la mayor importancia la serie ∆CREPRIf y de forma menos relevante las series ∆PARNAGf y ∆IPIf , la intervención de la serie ∆PERHOTf es casi 104 CAPÍTULO 7. INDICADORES ECONÓMICOS anecdótica. En la serie ∆PERHOTf se aceptaba muy marginalmente una raı́z unitaria, esto implica que la tendencia de esta serie era muy leve y por ello su participación en el factor común y los valores que le corresponden en la matriz de ponderaciones han sido muy pequeños. Las demás series que componı́an el ciclo de referencia no están cointegradas entre sı́ y al añadir al conjunto los residuos de las ecuaciones cointegrantes entre las series ∆PERHOTf , ∆IPIf , ∆CREPRIf y ∆PARNAGf sólo en un caso se obtiene cointegración, y con sólo un vector cointegrante, de manera que podrı́a haber tres factores comunes a cuatro series; este hecho, sin embargo, no ayuda mucho en la explicación, desde un punto de vista económico, de la evolución a largo plazo de las series. El hecho de no encontrar cointegración en la frecuencia cero en el grupo de indicadores adelantados implica que las series consideradas no siguen una tendencia común a largo plazo, y por tanto, no tendrı́a sentido elaborar un indicador sintético adelantado en función de estas series, ya que en ellas no se ha encontrado implı́citamente un ciclo común adelantado respecto al ciclo económico general. Hay que señalar, sin embargo que al realizar la clasificación de los indicadores, se ha permitido que series del mismo grupo presenten diferentes desfases respecto al ciclo de referencia. Es posible que la corrección de estos desfases mejore el ajuste a largo plazo de las series, posibilitando la existencia de cointegración y factores comunes. Exactamente lo mismo ha ocurrido con los indicadores retrasados. 7.4. Indicadores de producción El objetivo fundamental de la presente aplicación es obtener el (los) componente(s) permanente(s) común(es) de un amplio conjunto de variables relacionadas con la producción. La intención primordial del trabajo es integrar series que son componentes del IPI con otras series de sectores industriales no contenidos en el IPI y con series del sector de servicios7 . Para ello se van a utilizar variables que son aproximaciones a las cifras de producción de los distintos sectores de la actividad económica. En concreto, se han elegido diez series de datos temporales relativos a la producción de bienes y servicios en varios sectores de la economı́a. Las series relativas a la producción, al igual que ocurre con las de consumo, suelen presentar componentes estacionales muy acentuados. Las series que aquı́ se han considerado son las siguientes: 7 Se excluye explı́citamente el sector primario debido a que su comportamiento especı́fico es ajeno, en gran medida a las fluctuaciones cı́clicas de la economı́a en general. 105 7.4. INDICADORES DE PRODUCCIÓN MET: TRA: MAQ: CON: INT: VIV: GRA: HOT: PAC: CEM: Producción de estructuras metálicas y caldererı́a (IPI) Producción de material de transporte (Excepto turismos y motos) (IPI) Producción de maquinaria y otro material de equipo (IPI) Producción de bienes de consumo (IPI) Producción de bienes intermedios (IPI) Construcción de viviendas. Índice de ventas en grandes almacenes. Pernoctaciones de viajeros en hoteles. Producción de acero. Producción de cemento. Los gráficos de las diez series (Páginas 143-152) muestran cierta tendencia y en todos los casos se aprecia la existencia de un fuerte componente estacional. Al estimar la ecuación (5.21) para cada serie, los estadı́sticos t(γ0 ) también reflejan el hecho de que todas las series tienen raı́ces unitarias en la frecuencia cero, ya que han tomado los valores que, junto con el estadı́stico FD, se presentan en la siguiente tabla: Serie MET TRA MAQ CON INT VIV GRA HOT PAC CEM t(γ0 ) −1,40 −1,48 −1,65 −0,69 −1,74 −1,12 −0,47 −1,10 −2,58 −1,77 FD 0,31 0,33 0,16 0,27 0,18 5,78 0,82 1,30 0,63 4,59 Se han utilizado datos mensuales desde enero de 1975 hasta diciembre de 1991. Por consiguiente, el número de observaciones al calcular los estadı́sticos ha sido de 192. Si se comparan los valores muestrales del estadı́stico FD obtenidos para estas series con el valor crı́tico del estadı́stico en la tabla del Capı́tulo 5 sección 2, al nivel de significación del 5 % (3.23), estadı́sticamente se ha de rechazar la hipótesis nula de existencia de once raı́ces unitarias estacionales para las series VIV y CEM, y no se puede rechazar la hipótesis en el resto de las series. Por otra parte, en ninguna serie se rechaza la existencia de una raı́z unitaria en la frecuencia cero. Es necesario calcular el estadı́stico t(γ0 ) de las series diferenciadas, para comprobar la posible existencia de una segunda raı́z unitaria en la frecuencia cero. 106 CAPÍTULO 7. INDICADORES ECONÓMICOS Serie ∆MET ∆TRA ∆MAQ ∆CON ∆INT ∆VIV ∆GRA ∆HOT ∆PAC ∆CEM t(γ0 ) −4,32 −4,84 −2,76 −3,28 −2,68 −6,02 −2,95 −4,98 −7,31 −4,61 El estadı́stico t(γ0 ) sólo en dos casos (∆MAQ y ∆INT) ha tomado valores mayores que el valor crı́tico de la distribución correspondiente (−2,80), sin embargo esos valores han estado muy cercanos al valor crı́tico por lo que la hipótesis no se puede aceptar de forma concluyente; tomando como base el gráfico de las series diferenciadas y sus correlogramas consideraremos que estas dos series no contienen más de una raı́z unitaria y, por tanto, todas las series estudiadas se pueden considerar I0 (1). Hasta este momento, las series MET, CON, INT, GRA, TRA, MAQ, HOT y PAC se comportan como series integradas de orden uno estacionalmente8 al mismo tiempo que integradas de orden uno en la frecuencia cero. Ante la presencia de esta estructura, cabe la posibilidad de que en el conjunto exista cointegración completa (estacional y de frecuencia cero con los mismos vectores cointegrantes). Si esto no se cumple, aún cabrı́a la posibilidad de cointegración solamente en la frecuencia cero o cointegración sólo estacional. 7.4.1. Cointegración completa A continuación se estiman las ocho posibles ecuaciones cointegrantes y se calculan los estadı́sticos DHF de sus residuos. Vble. endógena MET TRA MAQ CON INT GRA HOT PAC DHF −7,49 −8,73 −8,01 −6,05 −7,58 −3,99 −3,25 −7,33 Sorprendentemente, en todos los casos se rechaza la existencia de las doce raı́ces unitarias, por lo que todas las ecuaciones aparentan ser relaciones cointegrantes. Sin embargo, recordemos que el rechazo de la hipótesis conjunta de existencia de doce raı́ces 8 Aplicando el estadı́stico FD a las series filtradas mediante S(L) se comprueba que no son SI(2). 107 7.4. INDICADORES DE PRODUCCIÓN unitarias no implica que la serie sea estacionaria. Es posible que sea integrada en un número de frecuencias menor que doce, en cuyo caso también se rechazarı́a la hipótesis de cointegración completa. Por tanto, es necesario contrastar cada frecuencia por separado para decidir si existe o no cointegración completa. Con este propósito se realizan a continuación los contrastes de HEGY sobre las series de residuos de las ecuaciones de cointegración. Sus resultados se presentan en el Cuadro 7.1. Cuadro 7.1: Resultados de los contrastes de HEGY sobre las series de residuos de las ecuaciones de cointegración (Indicadores de producción) Serie MET TRA MAQ CON INT GRA HOT PAC t0 −3,46 −3,09 −2,97 −2,48* −2,24* −1,09* −2,65* −1,99* Fπ/6 28,86 15,33 33,89 7,25 7,06 4,57 0,28* 18,54 Fπ/3 10,53 11,14 11,93 2,31* 7,20 2,93* 8,43 15,07 Fπ/2 4,28 6,43 9,18 5,41 9,32 1,17* 2,45* 8,52 F2π/3 6,80 4,53 3,85 3,75 7,74 3,51 1,84* 3,71 F5π/6 1,46* 1,36* 1,47* 4,38 5,34 5,50 4,29 1,38* tπ −0,93* −1,06* −1,08* −1,60* −2,33 −1,67* −0,86* −1,68* (*): no significativo al α = 5 %. El valor crı́tico del estadı́stico F para α=5 % , ω = π/6, . . . , 5π/6 y T = 240 es 3,01. El valor crı́tico del estadı́stico t par a α=5 % y T = 240 es -1.89 (Beaulieu y Miron, 1993) Cuando hay cointegración completa, tanto los estadı́sticos de HEGY, como el t(γ0 ), el FD y el DHF de los residuos siguen las distribuciones adecuadas. Sin embargo cuando no se da la cointegración completa, es decir, cuando las perturbaciones presentan alguna raı́z unitaria, Engle, Granger y Hallman (1989) han demostrado que los estimadores MCO de la regresión cointegrante son inconsistentes y, por tanto no es adecuado tomar los residuos de la ecuación como estimaciones de las perturbaciones. La aplicación de los estadı́sticos de HEGY, t(γ0 ), FD y DHF a las series de residuos puede llevar a conclusiones erróneas sobre el comportamiento de las perturbaciones, ya que la hipótesis nula se rechazará con mayor probabilidad que la establecida en las tablas. Serı́a necesario desarrollar las distribuciones empı́ricas de estos estadı́sticos cuando se aplican a los residuos de ecuaciones cointegrantes. Es muy probable que sea necesario corregir los valores crı́ticos a la baja (hacia arriba en los F), como ocurre con los contrastes de Dickey-Fuller cuando se utilizan en datos anuales (sin componente estacional). Sin embargo, contrastar la hipótesis de cointegración completa significa contrastar la hipótesis nula de que los residuos de las ecuaciones cointegrantes son integrados de orden cero en todas las frecuencias estacionales y en la frecuencia cero al mismo tiempo, por lo tanto serı́a necesario disponer de un contraste global para todas las frecuencias. Utilizar para ello contrastes individuales como los de HEGY distorsiona ligeramente la realidad ya que si el interés está en la hipótesis conjunta de que todas las raı́ces son no unitarias se 108 CAPÍTULO 7. INDICADORES ECONÓMICOS deberı́an corregir los valores crı́ticos hacia arriba (hacia abajo en los F). Por consiguiente se puede considerar que hay dos fuerzas que actúan en sentido contrario sobre los valores crı́ticos de las distribuciones F y t en los contrastes de HEGY y no se dispone de evidencia sobre cuál ha de ganar. Esto implica que los estadı́sticos de HEGY sólo pueden utilizarse a nivel indicativo, y en ningún caso tomarse como pruebas concluyentes en uno u otro sentido. En el conjunto de variables estudiado, hay dos variables en las que el estadı́stico DHF toma valores notablemente inferiores a las restantes, los residuos de GRA y HOT, por lo que se puede considerar probable la existencia de doce raı́ces unitarias en esas variables. Al utilizar los estadı́sticos de HEGY se aprecia que en estas series de residuos se pueden llegar a aceptar 7 y 8 raı́ces unitarias respectivamente, sin embargo en las restantes series de residuos como máximo se aceptan cuatro y en gran parte de los casos los estadı́sticos están muy próximos a los valores crı́ticos. Teniendo esto en cuenta no se estará muy lejos de la realidad si, de los ocho vectores posibles, se supone que seis de ellos son vectores cointegrantes. Serı́a deseable disponer de un método similar al de Johansen para determinar el número de vectores cointegrantes, pero en este sentido sólo se dispone de un método para trabajar con datos trimestrales (Lee, 1992) y aunque el método puede ser similar para datos mensuales, no existen tablas corregidas para hacer los contrastes. Si se admiten seis vectores de cointegración completa, en este conjunto de ocho variables existirán dos factores completos comunes, es decir dos factores con raı́ces unitarias en la tendencia y en las frecuencias estacionales, que responden a la ecuación (7.13). Se ha utilizado el método basado en el mecanismo de corrección de error, descrito en el Capı́tulo 6 sección 3.3, para estimar estos dos factores9 . En este caso el ECM sigue la expresión: ∆12 xt = −π1 [Z1 (L) + Q∗2 Z2 (L) + · · · + Q∗12 Z12 (L)] xt + p X + Ai ∆12 xt−i + t (7.20) i=1 9 Incluyendo en el modelo de corrección de error el término correspondiente a la frecuencia cero, además de los correspondientes a las frecuencias estacionales. 7.4. INDICADORES DE PRODUCCIÓN 109 donde Q∗2 , . . . , Q∗12 son matrices de coeficientes similares a las de la expresión (6.28) y los polinomios Zj con j : 1, . . . , 12 son10 : Z1 = (1 + L + L2 + · · · + L11 ) Z2 = −(1 − L + L2 − L3 + L4 − L5 + L6 − L7 + L8 − L9 + L10 − L11 ) Z3 = −(L − L3 + L5 − L7 + L9 − L11 ) Z4 = −(1 − L2 + L4 − L6 + L8 − L10 ) 1 Z5 = − (1 + L − 2L2 + L3 + L4 − 2L5 + L6 + L7 − 2L8 + L9 + L10 − 2L11 ) √2 3 Z6 = (1 − L + L3 − L4 + L6 − L7 + L9 − L10 ) 2 1 (1 − L − L2 − L3 + L4 + L5 + L6 − L7 − L8 − L9 + L10 + L11 ) Z7 = 2√ 3 (1 + L − L3 − L4 + L6 + L7 − L9 − L10 ) Z8 = − 2 √ √ √ 1 √ Z9 = − ( 3 − L + L3 − 3L4 + 2L5 − 3L6 + L7 − L9 + 3L10 − 2L11 ) 2 √ √ √ √ 1 Z10 = (1 − 3L + 2L2 − 3L3 + L4 − L6 + 3L7 − 2L8 + 3L9 − L10 ) 2 √ √ √ 1 √ Z11 = ( 3 + L − L3 − 3L4 − 2L5 − 3L6 − L7 + L9 + 3L10 + 2L11 2 √ √ √ √ 1 Z12 = − (1 + 3L + 2L2 + 3L3 + L4 − L6 − 3L7 − 2L8 − 3L9 − L10 ) 2 La estimación de los factores proporciona los siguientes resultados: factor 1 = 3,49 M ET + 2,69 T RA − 4,89 M AQ + 14,13 CON − 18,37 IN T + +19,92 GRA − 2,81 HOT − 10,66 P AC factor 2 = −13,97 M ET + 0,57 T RA + 1,19 M AQ − 7,34 CON + 33,66 IN T + +12,27 GRA + 0,72 HOT + 12,63 P AC En la ecuacion (7.20) se ha utilizado p = 2, ya que si se utiliza el estadı́stico Q de Ljung-Box para determinar el orden del retardo autorregresivo, en este caso se pierden tantos grados de libertad que es imposible realizar la estimación. Con p = 2 aún quedan 84 grados de libertad en la estimación. Se ha utilizado este valor de p aún sabiendo que los estimadores de la ecuación (7.20) pueden ser inconsistentes debido a la existencia de autocorrelación en las perturbaciones. Sin embargo, la estimación posterior del modelo de factores comunes utilizando los factores aquı́ estimados no presenta autocorrelación residual. Para obtener factores ortogonales a los componentes estacionarios proyectan estos dos factores sobre las variables z1t , . . . , z6t y se restan estas proyecciones de los factores anteriores. 10 Se puede ver su obtención en la sección 4.4.4 110 CAPÍTULO 7. INDICADORES ECONÓMICOS Los gráficos de las series ası́ estimadas se presentan en las páginas 153 y 153. Se ha utilizado una ecuación similar a la (7.19) para estimar la matriz de ponderaciones. Se ha añadido un vector de constantes en la ecuación ya que las medias de las variables al no estar diferenciadas son distintas de cero. La estimación de la matriz de ponderaciones y el vector de constantes ha presentado los siguientes resultados: −0,359 0,409 4,45 (0,26E − 06) (0,30E − 06) (0,82E − 07) −0,600 0,678 4,45 (0,44E − 06) (0,50E − 06) (0,14E − 06) 0,410 4,75 −0,352 (0,26E − 06) (0,30E − 06) (0,82E − 07) −0,117 0,141 4,97 (0,89E − 07) (0,10E − 06) (0,27E − 07) A1 = κ = (7.21) −0,166 0,195 4,91 (0,13E − 06) (0,14E − 06) (0,38E − 07) 0,139 −0,095 4,58 (0,85E − 07) (0,96E − 07) (0,26E − 07) 1,404 −1,586 9,11 (0,10E − 05) (0,11E − 05) (0,32E − 06) −0,179 0,207 6,92 (0,13E − 06) (0,15E − 06) (0,41E − 07) En la página 154 se representa cada serie junto con la transformación κ + Ai ft . Se aprecia como los factores recogen adecuadamente la tendencia de las series y son capaces de detectar bastante bien la parte permanente del componente estacional. El ajuste gráfico de los factores a las series GRA y HOT parece casi perfecto, sin embargo la sustitución de los factores por estas dos series en la ecuación (7.20) produce series de residuos que no son estacionarios, reflejando el hecho de que los factores han de contener una mayor parte de comunalidad del resto de las series. La varianza total estimada de las ocho series es de 1,33, la varianza explicada por los factores es 0,82, representando el 61,63 % del total. El modelos de factores comunes se puede expresar: xt = κ + A1 ft + νt (7.22) donde νt es un vector de variables I0 (0) y SI(0), ft son los dos factores comunes, que cumplen (1 − L12 ) ft = ωt siendo ωt un vector con dos componentes que son simultáneamente I0 (0) y SI(0). Este modelo se puede normalizar de manera distinta, de forma que se cumplan las restricciones mencionadas en el capı́tulo 2 (Ec. 2.8) Para ello se puede multiplicar el término A1 ft por la matriz C y por su inversa, de manera que la ecuación (7.22) no cambia, siendo C 1234457,5 −204,7 C= 1083548,3 −179,6 111 7.4. INDICADORES DE PRODUCCIÓN La ecuación (7.22) queda entonces: xt = κ + (A1 C)(C−1 ft ) + νt = κ + A∗1 ft∗ + νt siendo ∗ y A1 = ft∗ = C−1 ft 1,0 0,0 −6031,6 1,0 −281728,7 −1,61 8348,7 −1,38 . 6371,9 −1,05 68652,5 −11,38 14670,7 −2,42 3326,6 −0,55 En tal caso, el primer factor representa el componente permanente de la primera variable y el segundo factor es la parte de la estructura permanente de la segunda variable que no se ha podido explicar mediante el primer factor. Análisis univariante de los factores Disponer de una estimación de los factores permite realizar un análisis univariante de los mismos como si de cualquier serie real se tratara11 . Para obtener una descomposición univariante de los factores se ha planteado un modelo estructural como el siguiente: yt = µt + st + t con y µt = β + µt−1 + ηt S(L) st = ωt en el que µt es el componente de tendencia, que se ha supuesto un paseo aleatorio alrededor de una pendiente fija β (ya que las series son I0 (1)); st es el componente estacional y t , ηt y ωt son perturbaciones aleatorias independientes con media cero y varianzas constantes σ2 , ση2 y σω2 . Estas varianzas se estiman maximizando la función de verosimilitud espectral (ver Harvey y Peters, 1990). Para el primer factor común se han obtenido las siguientes estimaciones12 : σ̂2 = 0,8131, σ̂η2 = 0,2068, σ̂ω2 = 0,1485, con desv.tı́pica: 0,1634 con desv.tı́pica: 0,0661 con desv.tı́pica: 0,1634 Se utiliza un algoritmo de suavizamiento para obtener una estimación de los componentes. Dichas estimaciones se representan en la página 155. En el gráfico superior 11 El análisis se ha hechos sobre la primera normalización de los factores ft , tal y como se obtuvieron desde el procedimiento de estimación y posteriormente ortogonalizados respecto al componente estacionario. 12 Se ha utilizado el programa STAMP 112 CAPÍTULO 7. INDICADORES ECONÓMICOS se han representado el primer factor junto a su tendencia, y en el inferior la estimación obtenida para el componente estacional. Como el factor es integrado de orden uno en la frecuencia cero, su tendencia está formada por un paseo aleatorio respecto a una lı́nea recta de pendiente β. En el componente estacional se aprecian unos picos que se repiten sistemáticamente. En los meses de diciembre y enero el componente estacional es más alto que la media anual (+7 puntos aprox.), sin embargo en abril se produce regularmente el valor más bajo de todo el año (-3.7 aprox.). También se percibe otro mı́nimo importante en agosto de cada año (-2.0 de media aprox.). Se ha efectuado la estimación del mismo modelo para la serie formada por el segundo factor común. Las estimaciones de los parámetros del modelo presentan los siguientes resultados: σ̂2 = 0,6011, σ̂η2 = 0,4056, σ̂ω2 = 0,2925, con desv.tı́pica: 0,1933 con desv.tı́pica: 0,1112 con desv.tı́pica: 0,0776 Mediante un algoritmo de suavizamiento de intervalo fijo se ha obtenido una estimación de los componentes. Dichas estimaciones se presentan en la página 156. En la parte superior se recoge el gráfico del segundo factor junto a su tendencia estimada. En la parte inferior de dicha página figura la estimación del componente estacional del segundo factor. Dado que esta serie también es I0 (1), las desviaciones de su tendencia con respecto a una recta de pendiente β han de ser y son un paseo aleatorio. El análisis del componente estacional refleja lo siguiente: igual que ocurrı́a en el factor 1, los meses de diciembre-enero son regularmente más altos que los demás (+5.0 de media aprox.). En los primeros años de la muestra (del 75 al 79) se daban dos mı́nimos anuales de similar importancia, febrero y agosto-septiembre (-3.0 de media aprox.). Sin embargo, a partir del 79 cobra mayor importancia el mı́nimo del mes de agosto (-5.0 de media aprox.) que llega a diferenciarse notablemente del resto de los meses del año. El comportamiento de cada una de las variables que intervienen en el modelo a lo largo del año, depende también de la cantidad y el signo de las ponderaciones que reciben los factores en la matriz A1 (ver ec.7.22). Dado que en esta matriz las dos columnas tienen distinto signo, el resultado final para cada una de las variables podrı́a ser cualquiera, sin embargo en los gráficos de la página 154 se aprecia que en las cinco series que son componentes del IPI y en PAC es muy importante el “bache” estacional del mes de agosto (que en GRA y HOT es un pico hacia arriba), hecho que los factores recogen con bastante exactitud, sin embargo el comportamiento estacional del resto del año no sigue una pauta tan uniforme para todas las series. 7.4.2. Conclusiones Partiendo de las diez series consideradas, se ha comprobado que ocho de ellas son integradas de orden uno en la frecuencia cero y también integradas estacional y uniformemente (SI(1)). Sin embargo dos de ellas no son SI(1), las series VIV y CEM. El análisis de cointegración aplicado a las ocho series restantes ha permitido detectar seis relaciones de cointegración completa, y por tanto la presencia de dos factores comunes 7.4. INDICADORES DE PRODUCCIÓN 113 a estas ocho series, cada uno de ellos integrado en las once frecuencias estacionales y en la frecuencia cero. Se entiende entonces que la estructura de estas series de producción se encuentra “guiada” por únicamente dos factores. La estimación de los factores, por el método propuesto en el Capı́tulo 6 y posteriormente la estimación de la matriz de ponderaciones, muestra que GRA es la variable que en mayor medida afecta al primer factor, e INT la que más participación tiene en el segundo, sin embargo no son sólo ellas las que determinan su evolución, los dos factores comunes se determinan como medias ponderadas de las ocho variables y no existen grandes diferencias entre las ponderaciones que cada variable recibe en el factor. Dichos factores son capaces de explicar el 61,63 % de la variación total de las series en su conjunto. En el modelo de factores comunes, se produce un alto ajuste a las series GRA y HOT, sin embargo no se puede considerar que estas series sean los factores comunes, pues la estimación del modelo sustituyendo los factores por estas variables produce residuos con raı́ces unitarias. Se ha planteado un modelo estructural para cada uno de los factores y se han estimado sus componentes. El análisis de los componentes estacionales estimados muestra que en ambas series el ciclo estacional presenta valles en los meses de agosto y picos en diciembre-enero. Sin embargo, la matriz de ponderaciones estimada (A1 ) muestra que en cada variable los dos factores reciben ponderaciones de signo contrario, por lo que, tomando como base los factores, es difı́cil establecer conclusiones sobre el comportamiento estacional de todo el conjunto de variables. Sin embargo, la observación de los gráficos de las páginas G35 y G36 permite extraer alguna conclusión en este sentido. En todas las series, excepto en GRA y HOT se distingue un valle estacional en el mes de Agosto, que en dichas series GRA y HOT se transforma en un pico. Los factores determinan un pico aproximadamente en diciembre para todas las series excepto HOT; por el contrario, dicho pico no se observa en todas las series originales. El hecho de haber encontrado dos factores comunes, y que estos tengan ponderaciones de signo contrario en la matriz A1 dificulta la interpretación de los resultados ya que dependiendo de las ponderaciones que se obtengan en la matriz A1 para cada serie, se pueden obtener distintos tipos de ciclos estacionales en cada una de ellas. La estimación del componente de tendencia de los factores nos muestra (páginas 155 y 156) que las dos series que “dirigen” la evolución a largo plazo de las ocho series consideradas son paseos aleatorios con rumbo. En la tendencia del primer factor se aprecia una mayor influencia de la serie GRA, siguiendo este factor una tendencia casi lineal, como en dicha serie. Por el contrario, en la tendencia del segundo factor se nota una mayor influencia de los componentes del IPI, como INT, CON o MET, reflejando una evolución a largo plazo similar a estas series. A la hora de interpretar lo que los dos factores comunes representan, hay que tener en cuenta la propia definición de lo que es un factor común. Cada uno de los factores comunes completos contiene la parte permanente de cada serie que es común a todas ellas; por lo tanto, este par de factores se puede considerar como un par de series que son representantes de la evolución permanente de todo el conjunto. Evolución que contiene un componente permanente de tendencia, ası́ como un componente estacional permanente. 114 CAPÍTULO 7. INDICADORES ECONÓMICOS Capı́tulo 8 Conclusiones En el presente trabajo se estudian modelos factoriales en los que los factores comunes son componentes de tendencia (paseos aleatorios + rumbo) y/o componentes estacionales. Para los componentes estacionales se ha supuesto una estructura SI(1), es decir, una estructura autorregresiva con una raı́z unitaria en cada frecuencia estacional. En el Capı́tulo 3 se ha demostrado que un vector de series temporales cointegrado estacional y uniformemente se puede representar mediante un modelo de factores estacionales comunes, cuyos factores tienen la estructura antes mencionada, y viceversa. La existencia o no de raı́ces unitarias en frecuencias distintas de las estacionales no afecta a la representación de factores comunes del modelo, ya que, en las ecuaciones del mismo, sólo se supone que las perturbaciones son SI(0), independientemente de lo que ocurra en las frecuencias no estacionales. Por otra parte, para que la demostración sea válida, es necesario que el número de vectores cointegrantes sea el mismo en cada una de las frecuencias estacionales. Si en alguna de ellas existieran más vectores cointegrantes que en las demás, esto implicarı́a que, en la representación de factores comunes, aparecerı́an raı́ces unitarias en el componente de medias móviles de los factores. Siguiendo la misma lı́nea que en la demostración del Capı́tulo 3, se puede considerar un vector de series temporales cointegrado al mismo tiempo en la frecuencia cero y en las frecuencias estacionales. Si los vectores cointegrantes son comunes a todas las frecuencias, la demostración del Capı́tulo 3 se extiende de manera obvia para este caso. La representación de factores comunes de este vector será entonces: yt = A ft + t con S (1 − L ) ft = ωt siendo t y ωt series I0 (0) y SI(0) simultáneamente. En el Capı́tulo 4 se revisan algunos de los más importantes contrastes de raı́ces unitarias para la frecuencia cero, contrastes de raı́ces unitarias estacionales y contrastes de cointegración. En el Capı́tulo 5 se proponen dos contrastes especı́ficos para la hipótesis de integración estacional uniforme. El primero de ellos está basado en el estadı́stico F de los 115 116 CAPÍTULO 8. CONCLUSIONES coeficientes γ1 , . . . , γS−1 en la ecuación: S(L) xt = γ0 + γ1 xt−1 + · · · + γS−1 xt−(S−1) + t . Se ha calculado su distribución empı́rica, para S = 12, por medio del método de Montecarlo y sus valores crı́ticos se recogen en el Cuadro 5.1 (pág.43). El segundo contraste está basado en el estadı́stico t del coeficiente γ en la ecuación: S(L) xt = µ + γ xt−1 + 1 − (1 − γ)2 xt−2 + · · · + 1 − (1 − γ)S−1 xt−(S−1) + t Se ha hallado, por medio de simulaciones, una aproximación empı́rica a la distribución del estadı́stico t del coeficiente γ, cuando S = 12. Los valores cı́ticos se presentan en el Cuadro 5.5 (Página 53) Las pruebas de potencia de ambos contrastes se presentan en las secciones 5.3 y 5.5.1. En general el estadı́stico FD se muestra más potente que el t(γ) ante cualquier alternativa. Se han revisado dos métodos de estimación de modelos con tendencias comunes (Fernández Macho, 1986; Gonzalo y Granger, 1991) y uno para la estimación de modelos con factores estacionales comunes (Fernández Macho, 1986). Partiendo del método de Gonzalo y Granger, dedicado a la estimación de modelos con factores de tendencia común, se plantea y desarrolla una adaptación del mismo para obtener la estimación de modelos con factores comunes estacionales (uniformes) o con factores comunes completos (con componente de tendencia y componente estacional). Este método, el relación al de Fernández se muestra computacionalmente más rápido y de más sencilla programación. El método se basa en imponer dos restricciones para la identificación del modelo de factores comunes, estas restricciones son distintas a las establecidas en el Capı́tulo 2 y, de forma resumida, implican que: 1. Los factores han de ser combinaciones lineales de las variables originales. 2. La matriz de ponderaciones de las combinaciones lineales ha de elegirse de tal forma que los factores determinen una descomposición en parte permanente-parte transitoria de las series. Se extiende la definición de Gonzalo y Granger (1991) de descomposición permanentetransitoria, poara que incluya la posibilidad de descomposición en el componente estacional, de manera que pueda existir una parte estacional permanente y una parte estacional transitoria. Se demuestra entonces que el mecanismo de corrección de error correspondiente a un vector cointegrado estacional y uniformemente, presenta una sola matriz de coeficientes de ajuste γ que afecta a todas las frecuencias y, por tanto, si se elige la matriz de 0 x determina una ponderaciones γ⊥ (tal que γ 0 γ⊥ = 0), la combinación lineal ft = γ⊥ t descomposición permanente-transitoria en el vector de series inicial. Entonces se puede considerar ft como una posible normalización de los factores comunes del modelo. La 117 matriz γ⊥ se puede estimar por un procedimiento similar al propuesto por Gonzalo y Granger (1991). En el Capı́tulo 7 se muestran dos aplicaciones de los modelos de factores comunes. En la primera de ellas se ha intentado contrastar, por medio de los contrastes de cointegración y cointegración estacional, la existencia de tendencias y factores estacionales comunes dentro de tres grupos de indicadores cı́clicos. El análisis se ha basado en la clasificación de indicadores cı́clicos realizada por Fernández Macho (1991). Los tres grupos estudiados han sido: el conjunto de indicadores que, en dicho artı́culo, formaron el ciclo de referencia; los indicadores que se consideraron adelantados respecto al ciclo económico; y el grupo de indicadores retrasados con respecto a dicho ciclo. El resultado del estudio ha sido el siguiente: 1. No se ha encontrado cointegración estacional uniforme, ni por tanto, factores comunes estacionales uniformes en ninguno de los tres grupos considerados. 2. Se han encontrado tres relaciones de cointegración en la frecuencia cero en un subconjunto formado por cuatro de las series que formaron el ciclo de referencia (PARNAG, PERHOT, IPI y CREPRI). Las relaciones de cointegración son de tipo C(2, 1), y por tanto, son relaciones entre los crecimientos de dichas series. 3. Dado que en ese conjunto de cuatro series se han encontrado tres relaciones de cointegración, esto implica la existencia de un factor común entre los crecimientos de dichas series. Este factor común se ha estimado por el procedimiento de Gonzalo y Granger (1991) y se ha representado en el gráfico G9. Dicho factor se puede interpretar como un indicador sintético de la tasa de crecimiento de la actividad económica en España. La trayectoria del factor se muestra coherente con la evolución del crecimiento de la actividad económica percibido a lo largo de todo el perı́odo muestral. También se muestra razonablemente de acuerdo con el indicador de la tasa de crecimiento de la actividad económica calculado por Fernández Macho (1991), aún teniendo en cuenta las diferencias en su composición. 4. Se ha encontrado solamente una relación de cointegración (en la frecuencia cero) entre los niveles de las demás series que formaron el ciclo de referencia y las series de residuos de las tres relaciones cointegrantes comentadas anteriormente. 5. No se ha encontrado ningún tipo de cointegración en la frecuencia cero en los grupos de indicadores adelantados y retrasados respecto al ciclo. Esto se puede atribuir a la no homogeneidad de los desfases con respecto al ciclo entre series que forman parte del mismo grupo, ya que en el momento de clasificarlas se permitieron diferentes intervalos de adelanto (o en su caso de retraso) respecto al ciclo. En la segunda aplicación se han seleccionado varios indicadores de producción, referentes a distintos sectores de la economı́a, con el objeto de hallar el componente(s) permanente(s) común a todo el conjunto. De las diez series consideradas, en ocho de ellas se detecta la existencia de once raı́ces unitarias estacionales y una en la frecuencia 118 CAPÍTULO 8. CONCLUSIONES cero, por tanto cabe la posibilidad de que exista cointegración completa entre estas ocho series. Se plantean y estiman ocho posibles ecuaciones cointegrantes. El análisis de los residuos muestra la probable existencia de seis vectores de cointegración completa. En tal caso, existen dos factores comunes a las ocho series, siendo cada factor una variable con doce raı́ces unitarias (once estacionales y una en la frecuencia cero). Se han estimado los factores mediante el procedimiento propuesto en la sección 6.3.2.2. Estos factores se representan en las páginas G33 y G34. Gráficamente, el primero de los factores parece seguir una evolución similar a la de la serie GRA. El segundo, sin embargo, parece recoger una estructura similar a alguno de los componentes del IPI estudiados. En concreto, se parece bastante a las series INT y CON. La estimación de la matriz de ponderaciones del modelo muestra que se produce un ajuste muy alto entre el modelo y las series GRA y HOT, no siendo tan elevado para el resto de las series. Sin embargo, se ha comprobado que no se puede considerar que dichas series sean los factores comunes, pues la influencia del resto de las series también es importante. Una vez obtenidos los factores, cada uno de ellos se puede tratar como una serie univariante cualquiera. Ası́, es posible plantear para ellos un modelo estructural de la forma: yt = µt + st + t (8.1) y, a partir de el, hallar los componentes de tendencia y estacional de cada una de las series y obtener conclusiones acerca de ellos. Sin embargo el hecho de que sean dos los factores comunes dentro del conjunto estudiado dificulta considerablemente la interpretación de los componentes. Los dos factores que se han obtenido se pueden considerar representantes de la estructura permanente de todo el conjunto, reflejando la existencia de un componente de tendencia común a todo el grupo ası́ como de un componente estacional que es permanente y también común. Apéndice A Los datos Los datos utilizados en las dos aplicaciones del Capı́tulo 7 provienen del Boletı́n de Indicadores Económicos del Banco de España. Se han utilizado hasta octubre de 1988 los datos disponibles en soporte magnético en el departamento de Economı́a Aplicada III (Econometrı́a y estadı́stica) de la Universidad del Paı́s Vasco (UPV/EHU) y se ha realizado una actualización de dichos datos hasta diciembre de 1991 mediante consulta a las publicaciones mensuales del Banco de España. La descripción de los datos es la siguiente: C ICLO DE REFERENCIA IPI: Índice de producción industrial. Base 1972=100. DEMELE: Consumo interior neto de electricidad. Millones de Kwh. DISCEM: Demanda de cemento. Consumo aparente. Miles de toneladas. PERHOT: Pernoctaciones en hoteles. Total residentes y no residentes. Miles de personas. TRAMER: RENFE. Transporte de mercancı́as. Toneladas por Km. IMNENE: Importaciones no energéticas. Serie deflactada por el IPSEBENE. Índice. CREPRI: Crédito al sector privado. deflactado por el IPSEBENE. PARNAG: Paro registrado no agrario. Parados con empleo anterior no agrario + parados de nueva incorporación. I NDICADORES ADELANTADOS COLOCA: Colocaciones. Total. Número de personas. PROIND: Encuesta de opiniones empresariales. tendencia prevista de la producción. 119 120 APÉNDICE A. LOS DATOS NIVCON: Encuesta de opiniones empresariales. Nivel de contratación de la empresa. Industria de la construcción. Porcentaje neto. STOCON: Encuesta de opiniones empresariales. Bienes de consumo. Porcentaje neto. Nivel de existencias de productos terminados. M3d: Agregados monetarios y crediticios. Activos lı́quidos en manos del público.M3 (Disponibilidades lı́quidas). millones de pesetas. Deflactado por el IPC. I NDICADORES RETRASADOS IVEGAL: Índice de ventas en grandes almacenes e hipermercados. Base 1990=100. STOCON: Encuesta de opiniones empresariales. Bienes de consumo. Porcentaje neto. Nivel de existencias de productos terminados. IPC: Índice de precios al consumo. General. Base 1983=100. IMPORT: Comercio exterior. Importaciones de mercancı́as (datos de aduanas). Millones de pesetas. EXPORT: Comercio exterior. Exportaciones de mercancı́as (datos de aduanas). Millones de pesetas. P RODUCCI ÓN MET: Índice de producción industrial. Bienes de inversión. Base 1972=100. Estructuras metálicas y caldererı́a. TRA: Índice de producción industrial. Bienes de inversión. Base 1972=100. Material de transporte (excepto turismos y motos). MAQ: Índice de producción industrial. Bienes de inversión. Base 1972=100. Maquinaria y otro material de equipo. CON: Índice de producción industrial. Bienes de consumo. Base 1972=100. INT: Índice de producción industrial. Bienes intermedios. Base 1972=100. VIV: Construcción de viviendas. Viviendas protegidas y libres. Visados de proyectos. Número de viviendas. GRA: Índice de ventas en grandes superficies. Base 1983=100. HOT: Turismo y viajes. Pernoctaciones de viajeros en hoteles. Miles de personas. PAC: Producción interna de acero. Miles de toneladas. CEM: Producción interna de cemento. Miles de toneladas. 121 122 APÉNDICE B. GRÁFICOS Apéndice B Gráficos T=50 T=200 El eje horizontal ha de dividirse por 4 .180 El eje horizontal ha de dividirse por 4 .175 .160 NUL50 .140 ALT50 .120 ALT200 .125 .100 .100 .080 .075 .060 NUL200 .150 .050 .040 .025 .020 .000 .000 2 12 22 32 42 52 62 2 12 22 T=100 42 52 62 T=250 El eje horizontal ha de dividirse por 4 .175 32 NUL100 .150 ALT100 .125 El eje horizontal ha de dividirse por 4 .175 ALT250 .125 .100 .100 .075 .075 .050 .050 .025 .025 .000 NUL250 .150 .000 2 12 22 32 42 52 62 T=150 El eje horizontal ha de dividirse por 4 .175 NUL150 .150 ALT150 .125 .100 .075 .050 .025 .000 2 12 22 32 42 52 62 2 12 22 32 42 52 62 123 IPI ORIGINAL CON LOG. 5.20 IPI PRIMERA DIFERENCIA 0.75 5.10 0.50 5.00 4.90 0.25 4.80 0.00 4.70 4.60 -.25 4.50 -.50 4.40 4.30 -.75 77 1.00 80 83 86 CORRELACION- IPI 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 4.0 PERIODOGRAMA- IPI .050 3.5 .040 3.0 2.5 .030 2.0 1.5 .020 1.0 .010 0.5 0.0 .000 80 83 86 CORRELACION-(1-L) IPI PERIODOGRAMA-(1-L) IPI 89 124 APÉNDICE B. GRÁFICOS DEMELE ORIGINAL CON LOG. 9.60 DEMELE PRIMERA DIFERENCIA 0.20 0.15 9.44 0.10 9.28 0.05 0.00 9.12 -.05 8.96 -.10 -.15 8.80 -.20 8.64 -.25 77 1.00 80 83 86 CORRELACION- DEMELE 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 14.0 PERIODOGRAMA- DEMELE .0100 12.0 10.0 .0075 8.0 .0050 6.0 4.0 .0025 2.0 0.0 .0000 80 83 86 CORRELACION-(1-L) DEMELE PERIODOGRAMA-(1-L) DEMELE 89 125 DISCEM ORIGINAL CON LOG. 8.00 DISCEM PRIMERA DIFERENCIA 0.30 0.20 7.80 0.10 7.60 0.00 7.40 -.10 7.20 -.20 7.00 -.30 6.80 -.40 77 1.00 80 83 86 CORRELACION- DISCEM 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 8.4 7.2 PERIODOGRAMA- DISCEM .0090 .0080 .0070 6.0 .0060 4.8 .0050 3.6 .0040 .0030 2.4 .0020 1.2 0.0 .0010 .0000 80 83 86 CORRELACION-(1-L) DISCEM PERIODOGRAMA-(1-L) DISCEM 89 126 APÉNDICE B. GRÁFICOS PERHOT ORIGINAL CON LOG. 10.00 PERHOT PRIMERA DIFERENCIA 0.50 9.75 0.25 9.50 0.00 9.25 9.00 -.25 8.75 -.50 8.50 8.25 -.75 77 1.00 80 83 86 CORRELACION- PERHOT 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 14.0 12.0 PERIODOGRAMA- PERHOT .120 .100 10.0 .080 8.0 .060 6.0 .040 4.0 2.0 0.0 .020 .000 80 83 86 CORRELACION-(1-L) PERHOT PERIODOGRAMA-(1-L) PERHOT 89 127 TRAMER ORIGINAL CON LOG. 1200 TRAMER PRIMERA DIFERENCIA 240 1100 160 1000 80 900 0 800 -80 700 -160 600 -240 500 -320 77 80 83 86 CORRELACION- TRAMER 1.00 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 140000 120000 100000 PERIODOGRAMA- TRAMER 6400 5600 4800 4000 80000 3200 60000 2400 40000 20000 0 1600 800 0 80 83 86 CORRELACION-(1-L) TRAMER PERIODOGRAMA-(1-L) TRAMER 89 128 APÉNDICE B. GRÁFICOS IMNENE ORIGINAL CON LOG. 6.00 IMNENE PRIMERA DIFERENCIA 0.60 5.75 0.40 5.50 0.20 5.25 0.00 5.00 -.20 4.75 -.40 4.50 4.25 -.60 77 1.00 80 83 86 CORRELACION- IMNENE 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 4.5 PERIODOGRAMA- IMNENE .025 4.0 3.5 .020 3.0 .015 2.5 2.0 .010 1.5 1.0 .005 0.5 0.0 .000 80 83 86 CORRELACION-(1-L) IMNENE PERIODOGRAMA-(1-L) IMNENE 89 129 CREPRI ORIGINAL CON LOG. 4.90 CREPRI PRIMERA DIFERENCIA .040 4.85 .030 4.80 .020 4.75 .010 4.70 .000 4.65 -.010 4.60 -.020 4.55 -.030 4.50 4.45 -.040 77 1.00 80 83 86 CORRELACION- CREPRI 89 77 1.00 .75 .75 .50 .50 .25 .25 .00 .00 -.25 -.25 -.50 -.50 -.75 -.75 -1.00 -1.00 3.5 3.0 PERIODOGRAMA- CREPRI .000090 .000080 .000070 2.5 .000060 2.0 .000050 1.5 .000040 .000030 1.0 .000020 .5 .0 .000010 .000000 80 83 86 CORRELACION-(1-L) CREPRI PERIODOGRAMA-(1-L) CREPRI 89 130 APÉNDICE B. GRÁFICOS PARNAG ORIGINAL CON LOG. 15.00 PARNAG PRIMERA DIFERENCIA 0.064 14.75 0.048 14.50 0.032 14.25 14.00 0.016 13.75 0.000 13.50 -.016 13.25 13.00 -.032 77 1.00 80 83 86 CORRELACION- PARNAG 89 77 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 40 PERIODOGRAMA- PARNAG .00064 35 .00056 30 .00048 25 .00040 20 .00032 15 .00024 10 .00016 5 .00008 0 .00000 80 83 86 CORRELACION-(1-L) PARNAG PERIODOGRAMA-(1-L) PARNAG 89 131 Factor comun series diferenciadas PARNAGf, PERHOTf, IPIf, CREPRIf 20 15 10 5 0 -5 -10 -15 -20 74 76 78 80 82 84 86 88 90 .080 FDPAR PARFT .060 .040 .020 .000 -.020 -.040 78 80 82 84 86 88 90 132 APÉNDICE B. GRÁFICOS .30 SDPER PERFT .20 .10 .00 -.10 -.20 -.30 78 80 82 84 86 88 90 88 90 .120 SDIPI IPIFT .080 .040 .000 -.040 -.080 -.120 78 80 82 84 86 133 .15 SDCRE CREFT .10 .05 .00 -.05 -.10 78 80 82 84 86 88 90 134 APÉNDICE B. GRÁFICOS 135 136 APÉNDICE B. GRÁFICOS 137 138 APÉNDICE B. GRÁFICOS 139 140 APÉNDICE B. GRÁFICOS 141 142 APÉNDICE B. GRÁFICOS 143 MET ORIGINAL CON LOG. 5.00 4.75 1.20 4.50 0.80 4.25 0.40 4.00 0.00 3.75 -0.40 3.50 -0.80 3.25 -1.20 3.00 -1.60 75 1.00 78 81 84 CORRELACION- MET 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 64 56 48 PERIODOGRAMA- MET .35 .30 .25 40 .20 32 .15 24 16 8 0 MET PRIMERA DIFERENCIA 1.60 .10 .05 .00 78 81 84 87 CORRELACION-(1-L) MET PERIODOGRAMA-(1-L) MET 90 144 APÉNDICE B. GRÁFICOS TRA ORIGINAL CON LOG. 5.5 TRA PRIMERA DIFERENCIA 2.7 5.0 1.8 4.5 0.9 4.0 0.0 3.5 -0.9 3.0 -1.8 2.5 2.0 -2.7 75 1.00 78 81 84 CORRELACION- TRA 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 64 PERIODOGRAMA- TRA .60 56 .50 48 40 32 .40 .30 24 .20 16 8 0 .10 .00 78 81 84 87 CORRELACION-(1-L) TRA PERIODOGRAMA-(1-L) TRA 90 145 MAQ ORIGINAL CON LOG. 5.50 MAQ PRIMERA DIFERENCIA 2.0 5.25 1.5 5.00 1.0 4.75 0.5 4.50 0.0 4.25 -0.5 4.00 -1.0 3.75 -1.5 3.50 3.25 -2.0 75 1.00 78 81 84 CORRELACION- MAQ 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 80 PERIODOGRAMA- MAQ .30 70 .25 60 50 40 .20 .15 30 .10 20 10 0 .05 .00 78 81 84 87 CORRELACION-(1-L) MAQ PERIODOGRAMA-(1-L) MAQ 90 146 APÉNDICE B. GRÁFICOS CON ORIGINAL CON LOG. 5.44 CON PRIMERA DIFERENCIA 0.64 0.48 5.28 0.32 5.12 0.16 4.96 0.00 4.80 -.16 4.64 -.32 4.48 -.48 4.32 -.64 75 1.00 78 81 84 CORRELACION- CON 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 80 70 60 PERIODOGRAMA- CON .084 .072 .060 50 .048 40 .036 30 20 10 0 .024 .012 .000 78 81 84 87 CORRELACION-(1-L) CON PERIODOGRAMA-(1-L) CON 90 147 INT ORIGINAL CON LOG. 5.20 INT PRIMERA DIFERENCIA 0.60 0.40 5.00 0.20 4.80 0.00 -.20 4.60 -.40 4.40 -.60 75 1.00 78 81 84 CORRELACION- INT 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 80 70 60 50 PERIODOGRAMA- INT .045 .040 .035 .030 .025 40 .020 30 .015 20 .010 10 .005 0 .000 78 81 84 87 CORRELACION-(1-L) INT PERIODOGRAMA-(1-L) INT 90 148 APÉNDICE B. GRÁFICOS VIV ORIGINAL CON LOG. 10.80 10.60 0.36 10.40 0.18 10.20 0.00 10.00 -.18 9.80 -.36 9.60 -.54 9.40 -.72 9.20 -.90 75 1.00 78 81 84 CORRELACION- VIV 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 350 300 250 PERIODOGRAMA- VIV .080 .070 .060 .050 200 .040 150 .030 100 50 0 VIV PRIMERA DIFERENCIA 0.54 .020 .010 .000 78 81 84 87 CORRELACION-(1-L) VIV PERIODOGRAMA-(1-L) VIV 90 149 150 APÉNDICE B. GRÁFICOS HOT ORIGINAL CON LOG. 10.00 HOT PRIMERA DIFERENCIA 0.50 9.75 0.25 9.50 0.00 9.25 9.00 -.25 8.75 -.50 8.50 8.25 -.75 75 1.00 78 81 84 CORRELACION- HOT 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 300 PERIODOGRAMA- HOT .160 .140 250 .120 200 150 .100 .080 .060 100 .040 50 0 .020 .000 78 81 84 87 CORRELACION-(1-L) HOT PERIODOGRAMA-(1-L) HOT 90 151 PAC ORIGINAL CON LOG. 7.20 PAC PRIMERA DIFERENCIA 0.75 0.50 7.00 0.25 6.80 0.00 6.60 -.25 6.40 -.50 6.20 -.75 75 1.00 78 81 84 CORRELACION- PAC 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 160 140 120 PERIODOGRAMA- PAC .045 .040 .035 .030 100 .025 80 .020 60 .015 40 .010 20 .005 0 .000 78 81 84 87 CORRELACION-(1-L) PAC PERIODOGRAMA-(1-L) PAC 90 152 APÉNDICE B. GRÁFICOS CEM ORIGINAL CON LOG. 8.00 CEM PRIMERA DIFERENCIA 0.24 7.90 0.16 7.80 0.08 7.70 0.00 7.60 -.08 7.50 -.16 7.40 -.24 7.30 7.20 -.32 75 1.00 78 81 84 CORRELACION- CEM 87 90 75 1.00 0.75 0.75 0.50 0.50 0.25 0.25 0.00 0.00 -0.25 -0.25 -0.50 -0.50 -0.75 -0.75 -1.00 -1.00 200 PERIODOGRAMA- CEM .0050 175 .0040 150 125 .0030 100 75 .0020 50 .0010 25 0 .0000 78 81 84 87 CORRELACION-(1-L) CEM PERIODOGRAMA-(1-L) CEM 90 153 Produccion.Factor comun 1 30 20 10 0 -10 -20 -30 75 77 79 81 83 85 87 89 91 87 89 91 Produccion.Factor comun 2 20 10 0 -10 -20 -30 -40 75 77 79 81 83 85 154 APÉNDICE B. GRÁFICOS 5.00 4.75 5.50 MET 5.25 MAQ FMET 5.00 4.50 FMAQ 4.75 4.25 4.50 4.00 4.25 3.75 4.00 3.50 3.75 3.25 3.50 3.00 3.25 76 79 82 85 88 76 5.5 5.44 5.0 5.28 4.5 5.12 4.0 4.96 3.5 4.80 79 82 85 88 79 82 85 88 CON FCON 3.0 4.64 TRA 2.5 4.48 FTRA 2.0 4.32 75 78 81 84 87 90 5.20 5.10 76 10.00 INT 9.75 FINT 5.00 9.50 4.90 9.25 4.80 9.00 4.70 8.75 4.60 HOT 4.50 8.50 4.40 8.25 FHOT 76 79 82 85 88 76 6.0 7.20 5.5 7.00 FPAC 80 84 88 PAC 5.0 6.80 4.5 6.60 4.0 GRA 3.5 6.40 FGRA 3.0 6.20 75 78 81 84 87 90 76 79 82 85 88 155 156 APÉNDICE B. GRÁFICOS Bibliografı́a Anderson, T. W. (1984). An Introduction to Multivariate Statistical Analysis. Wiley. New York. Beaulieu, J. y Miron, J. (1993). “Seasonal unit roots in aggregate U.S. data.” Journal of Econometrics, vol. 54, 305–28. Bell, W. R. (1987). “A note on overdifferencing and the equivalence of seasonal time series models with monthly means and models with (0,1,1)12 seasonal parts when θ = 1.” Journal of Business and Economics Statistics, vol. 5, 383–388. Bhargava, A. (1986). “On the theory of testing for unit roots in observed time series.” Review of Economic Studies, vol. 53(3), 369–84. Bhargava, A. (1990). “An econometric analysis of the US postwar GNP.” Journal of Population Economics, vol. 3, 147–153. Box, G. E. P. y Jenkins, G. (1970). Time Series Analysis: Forecasting and Control. Holden-Day. San Francisco. Box, G. E. P. y Tiao, G. C. (1977). “A canonical analysis of multiple time series.” Biometrika, vol. 64, 355–365. DGPC (1983). “Indicadores cı́clicos: Elaboración y aplicación al análisis de la economı́a española.” Informe técnico, (Dirección General de Previsión y Coyuntura). Ministerio de Economı́a y Hacienda. Dickey, D. y Fuller, W. (1979). “Distribution of the estimators for autoregressive time series with a unit root.” Journal of the American Statistical Association, vol. 74, 427–31. Dickey, D., Hasza, D. y Fuller, W. (1984). “Testing for unit roots in seasonal time series.” Journal of American Statistical Association, vol. 79, 355–67. Dolado, J. J. (1990). “Cointegración: una panorámica.” Estadı́stica Española, vol. 132(124), 327–388. Durbin, J. y Watson, G. S. (1950). “Testing for serial correlation in least squares regression i.” Biometrika, vol. 37, 409–428. 157 158 BIBLIOGRAFÍA Engle, R. F. y Granger, C. W. J. (1987). “Cointegration and error correction: representation, estimation and testing.” Econometrica, vol. 55, 251–276. Engle, R. F., Granger, C. W. J. y Hallman, J. (1989). “Merging short and long-run forecasts: An application of seasonal cointegration to monthly electricity sales forecasting.” Journal of Econometrics., vol. 40, 45–62. Engle, R. F., Granger, C. W. J., Hylleberg, S. y Lee, H. S. (1993). “Seasonal Cointegration. The Japanese consumption function.” Journal of Econometrics, vol. 55, 275–298. Fernández Macho, F. J. (1986). Estimation and Testing of Multivariate Time Series Model. Tesis Doctoral, London School of Economics. Fernández Macho, F. J. (1991). “Indicadores sintéticos de aceleraciones y desaceleraciones en la actividad económica.” Revista Española de Economı́a, vol. 8(1), 125–156. Fernández Macho, F. J., Harvey, A. C. y Stock, J. H. (1987). “Forecasting and interpolation usin vector autorregressions with common trends.” Annales d’Economie et de Statistique, vol. 6/7, 279–287. Franses, P. (1990). “Testing for seasonal unit roots in monthly data.” Inf. Téc. 9032, Econometric Institute. Fuller, W. (1976). Introduction to Statistical Time Series. Jonh Wiley. Gonzalo, J. y Granger, C. (1995). “Estimation of common long-memory components in cointegrated systems.” Journal of Business and Economics Statistics, vol. 13, 17–35. Gonzalo, J. y Granger, C. W. (1991). “Estimation of common long-memory components in cointegrated systems.” Discussion paper 91-33, University of California. San Diego. Granger, C. W. J. (1991). “Some recent generalizations of cointegration and the analysis of long-run relationships.” En R. F. Engle y C. W. J. Granger, eds., “Long-Run Economic Relationships. Readings in Cointegration,” págs. 277–287. Oxford University Press, Oxford. Hannan, E. J. (1970). Multiple Time Series. John Wiley, New York. Harvey, A. (1981). Time Series Models. John Wiley. Harvey, A. (1985). “Trends and cycles in macroeconomic time series.” Journal of Business and Economic Statistics, vol. 3, 216–227. Harvey, A. y Peters, S. (1990). “Estimation procedures for structural time series models.” Journal of Forecasting, vol. 9, 89–108. Harvey, A. C. (1989). Forecasting,structural time series models and the Kalman filter. Cambridge University Press. BIBLIOGRAFÍA 159 Hasza, D. y Fuller, W. (1982). “Testing for nonstationary parameter specifications in seasonal time series models.” The Annals of Statistics, vol. 10, 1209–1216. Hylleberg, S., Engle, R. F., Granger, C. W. J. y Yoo, B. S. (1990). “Seasonal integration and cointegration.” Journal of Econometrics, vol. 44, 215–38. Johansen, S. (1988). “Statistical analysis of cointegration vectors.” Journal of Economic Dynamics and Control, vol. 12, 231–254. King, R. G., Plosser, C. I., Stock, J. H. y Watson, M. W. (1987). “Stochastic Trends and Economic Fluctuations.” NBER Working Papers 2229, National Bureau of Economic Research, Inc. URL http://ideas.repec.org/p/nbr/nberwo/2229.html. Lee, H. (1992). “Maximum likelihood inference on cointegration and seasonal cointegration.” Journal of Econometrics, vol. 54, 1–47. Lütkepohl, H. (1987). Forecasting aggregated vector ARMA processes. Springer-Verlag, Berlin. Maravall, A. (1992). “Stochastic linear trends: Models and estimators.” Working paper, European University Institute. URL http://hdl.handle.net/1814/428. Melis, F. (1982). “Indicadores cı́clicos y tasas de variación interanual.” estadı́stica Española, vol. 95, 7–28. Nerlove, M., Grether, D. y Carvalho, J. (1979). Analisis of Economic Time Series. Academic Press, New York. Osborn, D. R., Chui, A., Smith, J. P. y Birchenhall, C. (1988). “Seasonality and the order of integration for consumption.” Oxford Bulletin of Economics and Statistics, vol. 50(4), 361–377. Osterwald-Lenum, M. (1992). “A note with quantiles of the asymptotic distribution of the maximum likelihood cointegration rank test statistics.” Oxford Bulletin of Economics and Statistics, vol. 54(3), 461–471. Phillips, P. (1987). “Time series regression with unit root.” Econometrica, vol. 55(2), 277–301. Rao, C. R. y Mitra, S. K. (1971). Generalized Inverse of Matrices and its Applications. John Wiley and Sons, New York. Raveh, A. (1989). “Analyzing parallelism of trendy time series.” Mimeo, The Hebrew University of Jerusalem. Sargan, J. D. y Bhargava, A. (1983). “Testing residuals from least squares regression for being generated by the gaussian random walk.” Econometrica, vol. 51, 153–174. 160 BIBLIOGRAFÍA Stock, J. y Watson, M. (1988). “Testing for common trends.” Journal of the American Statistical Association, vol. 83, 1097–1107. Theil, H. y Wage, S. (1964). “Some observations on adaptive forecasting.” Managment Science, vol. 10, 198–206. Uriel, E. (1985). Análisis de Series Temporales: Modelos ARIMA. Editorial Paraninfo.