ESTADISTICA ESPAÑC)LA Vol. 34, Núm. 13U, 1992, págs. 347 a 362 Comentarios sobre « EI cre c imiento subyacente en variables económicas » por ANTONIO GARCIA FERRER Departamento de Análisis Económico Universidad Autónorna de Madrid RESUMEN EI presente artículo expone algunos comentarios sobre la idea del crecimiento subyacente en variables económicas, recientemente desarrollada por Fernández Macho. AI centrarse en los aspectos tanto teóricos, como empíricos del procedimiento de descomposición propuesto por el autor arriba mencionado, se hace hincapié aquí en el hecho de que los problemas de identificación y de estimación planteados por tales procedimientos no son en absoluto triviales. Por otra parte, si no se imponen determinadas restricciones de ortogonalidad entre los diferentes componentes, el procedimiento puede resultar en serios problemas de interpretacián desde el punto de vista económico. Se utilizan los datos de dos series cronológicas mensuales españolas para elucidar esta manzana de discordia. Palabras clave: Modelos de componentes, espacio de estados, ortogonalidad y tendencias estocásticas. Clasificación AMS: 62P20, 90A 16, 90A20. Z-^x 1. t ^r ^1f)ftiT^t .1 f^^l'^1Ñ^)l ^ ^NTRODUCCION EI trabajo del profesor Fern^ndez Macho (Revista Estadística Española, número 126} supone una apartación interesante basada en una idea con una larga tradición en el campo estadistico, como es la descornposición de una serie ternporal en sus distintos componentes no observables. Utitizando un procedimiento específico de extracción de tendencias basado en una determinada clase de modelos de componentes no observables, el presente trabajo estudia las propiedades espectrales de dicho procedimiento y obtiene unas tasas de crecimiento subyacente para un conjunto de series ecanómicas españolas. Dado este doble carácter teórico/empírico del trabajo, me gustaria, igualmente, dividir rnis comentarios entre ambas aspectos. En primer lugar, comentaré los aspectos relacionados con las características teóricas del modelo de extracción de companentes propuesto y su comparación con atras alternativas disponibtes; y, posteriormente, analizaré algunos aspectos empíricos concretas utílizando las series mensuales del IPC y del IPI españoles que, amablemente, el propia autor me ha facilitado. 2. ASPECTOS TEORICOS GENERALES DEL MEST EI modelo MEST propuesto por Fernández Macho pertenece a la clase de modelos ARIMA de componentes no observables (UC-ARIMA) que fueron desarroilados en Econometria por Engle (1978) y Nerlove et al. (1979) a finales de los años setenta. Posteriormente, y ya dentro de un contexto de espacio de los estados (EE), este tipo de modelos se ha popularizado en diversas áreas y se han venido utilizando exhaustivamente tanto en la extracción de señales como en la predicción económica [Harvey y Todd { 1983), Harvey (1984), Kitagawa (1984) y Ng y Young (1990), entre otros]. En concreto, el modelo MEST representado por las ecuaciones (4}, {7), (8) y (11 } es similar al denominado BSM estudiado por Harvey y Todd (1983) y constituye la base de un conjunto amplio de trabajos empíricos publicados en los últimos años. Una vez que se definen las estructuras de los distintos componentes, es posible ensamblarlas en una forma agregada de espacio de !os estados, donde el vec#or de estada está compuesto por todos los estados de los distintos submodelos y la matriz de observación es un vector obtenído extrayendo los distintos componentes estructurales del vector de estado. Contrariamente a lo manifestado por el autor (p^g. 2), mi propia experiencía sobre esta cuestión es que los problemas de identificación estructural (similar a los que aparecen en los rnodelos econométricos tradicionales) y la posteríor estimación ('UM^^.N^TAKIOti tiOHRF•; t^L c'RF:('IMlE:NTt)`^Utiti'r^(^k^Nff^ F N ^'^^ItlAlil l a 1 lON^ ^ !^11t ^^^^ ^.^^) de parámetros del modelo cornpleto no son triviales. En un trabajo reciente [García Ferrer y Del Hoya (1991)) se analizan las dificultades reales con las que se encuentra cualquier investigador económico a la hora de encontrar una única «interpretación directa» del MEST, cuando el hecho es que disponemos de varias estructuras, todas ellas compatibles entre sí y compatibles con los datos. No quisiera repetir aquí los argumentos presentadas en ese trabajo, ni reavivar la polémica sobre cuáles son las propiedades idóneas que debería cumplir cualquier métado de extracción de seilales. Sin ernbargo, sí me gustaría aclarar las diferencias básicas entre la representación MEST (o BSM) y otras alternativas disponibles como la defendida en García-Ferrer y De! Hoyo (1991) y GarcíaFerrer et al. (1992). La mayor discrepancia entre ambos enfoques radica en las distintas hipótesis iniciales sobre la naturaleza de los cornponentes no observables y los modelos elegidos para representarlos. Como es bien sabido, la representación EE no es única, sino que depende de la definición de las variables de estado elegidas por el analista. Lógicarnente, las estimaciones de los cornponentes dependen, fundamentalmente, de los supuestos sobre su naturaleza dinárnica que viene especificada a priori por la forma EE elegida. En este sentido, aunque los modelos de componentes de las dos alternativas son similares, nuestra propuesta pone un mayor énfasis en la necesidad de cuasi-ortogonalidad entre los componentes, mientras que el MEST considera con una estimación máximoverasimil que obtiene componentes altamente correlacionados. Es m^s, el propio Harvey (1991) busca una justificacián teórica para este tipo de comportamiento. La razón de imponer la condición de ortogonalidad en nuestro caso, se basa en la idea de que la tendencia no debería contener frecuencias significativas asociadas con los componentes estacionales que se encuentran bien diferenciados de la misma en el periodograma de los datos. Siguiendo las sugerencias de Young y la experiencia próctica del programa microCAPTAIN [véase Young y Ng (1989) y Ng y Young (1990)], la ortogonalidad se consigue modelizando la tendencia como un paseo aleatorio integrado (PAI), en donde sólo aparece un input de ruido blanco en la segunda ecuacián (pendiente, bt) del modelo, de forma que 6^=0; mientras que la presencia de un parámetro como el cociente varianza ruido (NVR=a?/a2), cuyo valor puede ser «controlado» por el analista, asegura un cambio «suave» en la estimación de la tendencia y, consecuentemente, el cumplimiento de la condición de ortogonalidad. Por el contrario, el MEST permite la presencia de 6^ y a^ en las ecuaciones de la tendencia y las estima objetivamente a través de la optimización de la función de verosimilitud definida a partir de la descomposicián del error de predicción. Es posible argumentar que la aproximación defendida por el MEST es «rnás segura», ya que permite a la estimación MV decidir «objetivamente» sobre los F:^TAUItiTI('A F.SPAÑI)LA méritos relativos de los modelos utilizando como criterio el error de predicción de un período hacia adelante; mientras que la formulacián de Young impone sus «prejuicios» en la formulación y estimación del modelo. Sin embargo, como casi síempre ocurre en la vieja polémica entre clasicismo y bayesianismo, el mundo real es un poco más cor^nplicado de lo que determinadas evidencias parciales parecen implicar. De hecho, nuestra experiencia con la estimación MV no restringida es que, en determinados casos, la superficie MV asociada con el modelo de componentes puede ser bastante plana y mal definida en las cercanias del óptimo. Como podremos ver en alguno de los ejemplos posteriores, la opt^rnización numérica no permite obtener estimaciones bien definidas de los «hiperparémetros» del MEST. En tales circunstancias, y utilizando exclusivamente la infarmación muestral, no existe una evidencia contundente sobre si los componentes estén o no correiacionados. Consecuentemente, la impasicián de la restricción de ortogonalidad {mediante la elección de un determinado valor del NVR) tiene bastante sentido si el investigador tiene motívos a priorí para preferir un componente tendencial más suave. Toda esta discusión previa nos Ileva a una primera conclusián tentativa: los argumentos y consideraciones sobre la naturaleza de las tendencias en economía serán siempre cuestiones abiertas al debate, en donde pueden prevalecer consideraciones subjetivas sobre lo que, a nuestro juicio personal, entendemos como tendencia. Precisamente, como consecuencia de esta característica, necesitarnos encontrar alguna medida de la eficacia de un modelo {subjetivamente elegido) en relación con otras alternativas disponibles. Claramente, dicha regla debería basarse en la actuación del rnodelo a la hora de satisfacer los ©bjetivos de/ análisis, para Ios que el mismo fue desarrollado. Sobre esta cuestión centraré rnis comentarios de fa siguiente sección, analizando dos de los ejemplos empiricos presentados en el trabajo sobre la base de los datos mensuales dei IPI y del IPC españoles. 3. ASPECTOS EMPIRICOS DE LOS EJEMPLOS DE CRECIMIENTO SUBYACENTE Dos de los ejemplos presentados por Fernández Ir/lacho en su trabajo, se refieren a las series mensuales del IPC y del !PI estimadas para el periodo 19?4.1 a 1990.1. Las estimaciones del MEST para cada una de las series en logaritmos aparecen recogidas en las expresiones (20) y(40) en donde no se incluye información ni sobre el programa de estimación utiiizado, ni sobre los errores esténdar de los «hiperparámetros», ni sobre el comportamiento de los residuos. ('(>M^NTARIOS ^UHRE E[. CRECIMIt~NTO SUF3YA('ENTE E;N 4"ARtAfil_Fti E:('ONt)MI('AS .^^ I ©ado que considero esta información muy relevante a la hora de juzgar los resultados empiricos obtenidos, he repetido las estimaciones utilizando el programa STAMP desarrollado por Harvey y Peters para el mismo período temporal que el analizada por Fernández Macho. EI programa STAMP permite tres alternativas de estimación: ei método del scoring, ia estimación en el dominio de la frecuencia y estirnación en el dominio del tiempa (1). En las tablas 1 y 2 aparecen las tres posibilidades de estimación para ambas series, así como las Tabla 1 ESTIMACIO^ NES DEL MEST PARA EL IPC (74.01-90,01) (*) a? a^ FM 0.263 Scaring 0.222 (0.0) D. Frecuencia 0.209 Estimacidn (o.o) D. Tiempo (**) (*) aW aÚ Q^2a^ 0.001 0.02 0 - 0.001 (0.000} 0 (0.000) 0 (1.0) 51.3 0 54.1 0.003 0 (o.ooo> (0.000) (1.0} - - --- -- -- Las estimaciones de a?, a^, a^ y a^? están multiplicadas por 10°. (**) La subrutina de filtrado no proporcionó en este caso estimación alguna como consecuencia de problemas numéricos. Tabla 2 ESTIMAC{ONES DEL MEST PARA EL IPC (74.01-90.01) (*) Estimación cs? a^ 0 0.011 3. 36 0 0.015 0.061 (o.o) (1.05) D. Frecuencia 0 (1.0) 0.011 (0.0) D. Tiempo 0 (1.0) 0.008 (0.0) FM Scoring (*) (1.0) (o.o> a^ aú Q{2a^ 4.17 - 4.49 58.0 0.069 (0.4) 4.65 (1.06) 55.9 0.046 (0.0) 6.15 (1.11) 52.5 Las estimaciones de a?, a^, aw y aú están multiplicadas por 104. (1) Por lo general, el método más utilizado suele ser el del scoring dada la lenti#ud del programa en e! cálculo de los parámetros en !a estimación en el dominio temporal. f-.ti fA[)l^i l('A FtiPAÑ()l A estimaciones de Fernández Macho (FM) en las primeras filas de ambas tablas para facilitar la comparacián de los resuftados. Asimismo, en la última columna de las tablas se incluye el estadistico de Ljung-Box para verificar la aleatoriedad de los residuos. A la vista de los resultados obtenidos, se pueden plantear las siguientes canclusianes: 1. Existen diferencias en las estimaciones obtenidas entre las distintas alternativas del STAMP y las expuestas por FM. La magnitud estadistica de esas diferencias es difici! de cuantificar, dada la poca precisión estadística a juzgar por los errores estándar de las distintas estimaciones. En particular, son muy Ilamativas las diferencías entre los vaiores estimados para 6w en el caso del IPI. 2. Estas diferencias en estimacián tienen una contrapartida ímportante en la ínterpretación de los resultados. Así, por ejernplo, para el caso del IPI las estimaciones FM del nivel y del gradiente de la tendencia son, respectivamente, mT=5.0721 y bT^0.0017, lo que se traduce en que en enero de 1990, el nivel de la tendencia del IPI se estima en 159.5, mientras que su tasa de crecimiento se situaba en el 0.17% mensual (2.06% anual aproxirnadamente). Si utilizamos, sin embargo, las estimaciones del STAMP (d.t.) tenemos que mT=5.0783 y^,.=0.0028, I^o que se traduce en un nivel de la tendencia de 160.5 y una tasa de crecimiento del 0.28% mensual (3.36% anual aproximadamente). 3. En ninguno de los modelos estimados podemos rechazar la hipótesis de no aleatoriedad en los residuos estimados a la luz de los altos valores del estadístico de Ljung y Box. Este criterio, por sí solo, permitiría rechazar todos y cada uno de los modelos estimados sobre la base del incumplimiento de una de las hipótesis fundamentales en cualquier análisis de series temporales. Como puede verse, los problemas de identificación y estimación que comentábamos al analizar la estructura teórica del MEST en el apartado anterior, pueden aparecer en la práctica planteándonos un problema de interpretación económica considerable. Vayamos ahora a las cuestiones relacionadas con el crecimiento subyacente y la interpretación espectral de los componentes. En las figuras 1 y 2, aparecen las tendencias estimadas para los datos del IPC y del IPI utilizando el STAMP y el microCAPTAIN (NVR=0.0001). En el caso del IPC ambas tendencias son muy similares (aunque se observa un comportamiento ligerarnente más suave para el caso del microCAPTAIN), mientras que para el caso del IPI las diferencias entre ambas estimaciones resultan más evidentes. Si nuestro objetivo fuese comprobar las características físicas de ambas tendencias (tanto en el dominio del tiempo como en el de la frecuencia) las figuras 3 y 4 nos confirman una representación física coherente con un comportamiento característico de concentración de bajas frecuencias, dada la 353 ('OME:NTARIUS SC)E3RE: Fl. ('RE('IMIE;NTO Sl1E3YA('FNTE^ E^N VARIAl3l_E^:ti f:('ONOMI( Ati Figura 1 TENDENCIAS ESTIMADAS PARA EL IPC UTILIZANDO MICROCAPTAIN Y STAMP 4.5 4.0 3.5 MCTREND STREND 3.0 20 40 60 80 100 120 140 160 180 Figura 2 TENDENCIAS ESTIMADAS PARA EL IPI UTILIZANDO MICROCAPTAIN Y STAMP 5.10 . MCTREND 20 40 60 80 100 120 140 STREND 160 180 ,I t;ti"TA[)Iti"TI( A t^tif'ANl1l.A Figura 3 PERIODOGRAMA Y FUNCIONES DE AUTOCORRELACION PARCIAL DE LA TENDENCIA ESTIMADA DEL IPC UTILIZANDO STAMP (STREND) Periodograma 1.085 1 l 1Li^^ ^^• _T lu^ i ^i i 1 1 0 Período 4 12 52 24 . ACF PACF 1 r^rrrl'rr^^I^r ^Illlll^^f^•_ i^Ir^Irr^^^ 1 • • i T ^--^ T ^T ^^ ^ ^ I ^ r I ^ \^ ^ ^ ^ V ` ♦ ` `^^^^ -\r^'^rrrl^rr.^^•^ -1 -^^^^iiiiiii^^^^^^i^^^ii^iiii^^i^^^^^iiiiiiii^^^ -1 2 ('(^M(^:N"i'ARI()ti ti()13kf 1^:1. ('Rt-('IM11-NI() til^liti"A('t^N"i'f t•:N ^'.^RIAE3l.t^ti l^c'()Nc)ti11c .^^ti ?,$4 Figura 4 PERIODOGRAMA Y FUNCIONES DE AUTOCORRELACION Y AUTOCORRELACION PARCIAL DE LA TENDENCIA ESTIMADA DEL IPC UTILIZANDO MICROCAPTAIN (MCTREND) ACF 1 ^^^^^..i-f^i•^^^^^^i^^^^^i^^rf.'r ti ' • • • • • • • • • • • a }, fr^ V 1 ` ^ ` , r^iiiiri^i^^i^^i , ^ ^^^^^^ ^i ^ ^^r^(^)(^((^iii^i -1 -iiii)^^^i^^^ii^i^ii^IIlItIilo^ Periodograma 1.084 , , ^^^,.., , Q I^^^^ii ^, I i ^ ^ 52 24 12 j 4 I Período 2 f^^i;^i^i^,ii^ ^^t^^r>^^ ^ ^;^ información contenida tanto en ias acf y pacf como en el periodograma de dichas tendencias estimadas. Sin ernbargo, cuando nuestro objetivo son las tasas de crecimiento bf (derivada de la tendencia en este caso) las diferencias entre ambas alternativas se hacen mucho más evidentes tal como puede verse en las figuras 5 y 6. En concreto, para el caso del IPI, el propio Fernández Macho (p.7) reconoce que «... su perfil (de b^) puede, en ocasiones, ser demasiado irregular como para evaluar el crecimiento subyacente de la variable...», y propone un suavizamiento de b^ a través de un nuevo filtro Bt definido en la expresión (22). , A estas alturas, y centrándonos exclusivamente en los datos del IPC, es necesario plantearse la siguiente pregunta: ^Cómo es posible que tendencias tan similares como las que aparecen recogidas en la figura 1, impliquen unos «crecimientos subyacentes» tan dispares? La respuesta es inrnediata en cuanto que uno entiende, adecuadamente, la información contenída en la derivada. La derívacíón tiende a arnp/ificar las altas frecuencias presentes en la tendencia y a hacerlas más aparentes. La tendencia ^obtenida a través del STAMP posee estas altas frecuencias, que se hacen más evidentes en la representación gráfica de la derivada (véase figura 7) cuyo periodograma presenta evidencia clara de su presencia; mientras que ia tendencia obtenida en el microCAPTAIN no las tiene, y por tanto, el gráfico de la derivada es mucho más suave y su periodograma no indica la presencia de altas frecuencias, tal como puede verse en la figura 8(2). Estos resultados constituyen, en mi opinión, un buen ejemplo de la importancia que tiene la estimación de la derivada en la estimación de la tendencia y por qué el modelo del PAI es más adecuado en la estimación de tendencias locales. (2) De hecho uno de los criterios de selección del NVR en el microCAPTAIN consiste en observar el gráfico y el periodograma de la derivada para verificar la presencia de altas frecuencias y asegurar la condición de ortogonalidad. ( l)ti1f:N[^^KII)ti tiOItf{f^ I^t_ l kl^( Iti11[^tiiOti1^1i1 1l 1 Nfk t y ti 11t111i1 1 ^[ l( ^ ^il ^ tittc ^^, .^^7 Figura 5 DERIVADAS DE LAS TENDENCIAS ESTIMADAS PARA EL IPC CON MICROCAPTAIN Y STAMP 0.035 -^ 0.030 ^ 0.025 0.020 0.015 ^ ^ 0.010 I' 0.005 0.000 -0.005 20 40 60 80 100 120 140 160 180 Figura 6 DERIVADAS DE LAS TENDENCIAS ESTIMADAS PARA EL IPI CON MICROCAPTAIN Y STAMP 0.0075 0.0050 0.0025 , o.oooa -0.0025 -0.0050 DMCT - 0.0075 20 40 60 80 100 120 DSTT 140 160 180 t^^rnt>r:^i i^ ,^r t^.^r,^rv^^t ,z Figura T.a DERIVADA DE LA TENDENCIA ESTINIADA POR EL IPC CON STAMP 3.200 '1 DSTT x14 ^ ---0.100 I N=193 Figura T.b FUNCIONES DE AUTOCORRELACION Y AUTOCORRELAClON PARCIAL PARA DSTT ^ r ^i-^^i^•' Ifl 1 PAC F - ._...^ri.^^.rr .r-•'' ^ ^ • • • ^ ^ r ^ • ^ • ^ r ^ ^ • • • • • , I r 0 I ^ ^ \ ^ • • • • ^ • ,^ • ^ r ^ ^. ^ ^• • • ^. r r ^ • • ^ • ! ^ • • ^ • I ^ ^ ^ ^ \ ^ ^\ ^ r \ ^ r \ ^^ r \ .. -^ ' r I •' r ^, ^ ^.r ^ r s ^ ^ ^ r.. r r ^ i. 1 1 ^{ ^ ^ ^{ I 1 I I I I i I ^ ^{ ^(( ^ 1 I 1 1 1 1 1 t` ^ ^ ^ ^ ^{( ^ I ^`^ ^!^ ^ ( ^ J ^ ^ ^ I I I I I I I I I ^{^,({ ^ ^ ^ I 1 I I 1 I I({( I ^ ^{ ^{ • ^ ^$y ('OMt^NTARIOS SOEiRt^ E:L ('Rt^.('IMIt'.NTO ^IJf3YA('E.NTE? F^N VARIA[;C.,NS F^t'l)NOMI('AS Figura 7.c PERIODOGRAMA DE DSTT Periodograma: Picos en 27.4 8.3 7.7 4.5 5.948 ^11 x10 6 I (w) DMCT . 4 0 . ! i ^_ . I 1 . I I I I I , I ^ ' Período 4 12 52 24 ^ 2 Figura 8.a DERIVADA DE LA TENDENCIA ESTIMADA POR EL IPC CON MicroCAPTAIN 2.000 , x 10-2 . 0.000 1 DMCT I ! i I I ^ I I ^ I I I I I I ^ N=193 ;h0 t^:tiTAOIS'TI(^A 1^,^;PAIVOLA Figura 8.b FUNCIONES DE AUTOCORRELACION Y AUTOCORRELACION PARCIAL PARA DMCT ACF Il J t • `\ ♦ ♦ ♦ ♦ •^^ r ,^ ♦ ♦ ^^^^^ ♦ ♦ ^^s`•,•, _` ^^^iiiiiii^^^^^^^^^i^^^^^i^i^^i^^^1^iff^r^rr^r^_1 -^^^^^^^^^^^^^ii^^^^iri^íiiii^^^^ii^íilii^iii^i^^i Figura 8.c PERIODOGRAMA DE DMCT Periodograrna 5.914 `1 I (w) EI: 0 52 24 12 4 Período 2 ('OMENTARIOS tiOE3RE^ E^l_ C'RE^t'EMIE•:NTO SUEiYA('FN"fE-: E:N ^'ARIANLE:S E:('ONOMi(^AS REFERENCIAS ENGLE, R. F. (1978): «Estimating Structural Models of Seasonality», en A. Zellner (ed.), Seasonal Analysis of Economic Time Series, Washington DC: Bureau of the Census, 281-308. GARCfA-FERRER, A., y DE^ HOYO, .J. (1991 }: «On Trend Extraction Models: Interpretation, Empirical Evidence and Forecasting Performance». A publicarse en el Journal of Forecasting. GARCÍA-FERRER, A.; DE^ HOYO, J., y MARTÍN-ARROYO, A. (1992): «On Univariate Forecasting Comparisons: The Case of the Spanish Automobile Sector». A publicarse en el Journal of Forecasting. HARVEY, A. C. (1984): «A Unified View of Statistical Forecasting Procedures», Journal of Forecasting, 3, 245-275. HARVEY, A. C. (1991): «On Trend Extraction Models: Comments on a paper by García-Ferrer and Del Hoyo». A publicarse en el Journal of Forecasting. HARVEY, A. C., y Too^, P. H. J. (1983): «Forecasting Economic Time Series with Structural and Box-Jenkins Models: A Case Study», Journal of Business and Economic Statistics, 1, 299-315. KITAGAWA, G., y GERSCN, W. (1984): «A Smoothness Prior State-Space Modelling of Time Series with Trend and Seasonality», Journal of the American Statistical Association, 79, 378-389. NERLOVE, M.; GRETHER, D. M., y CARVALHO, J. L . (1979): Analysis of Economie Time Series, New York: Academic Press. NG, C. N., y YouNG, P. C. (1990): «Recursive Estimation and Forecasting of NonStationary Time Series», Journal of Forecasting, 9, 173-204. YouNG, P. C., y NG, C. N. (1989): «Variance Intervention», Journal of Forecasting, 8, 399-416. ^h^ f^tiTAI)ItiTIE'A F^PAIM()LA COMMENTS ON THE IDEA OF KUNDERLYlNG GROWTH OF ECONOMIC, VARIABLES» SUMMARY This paper presents some cornments on the idea of «underlying growth of economic variables» developped in a recent article by Fernandez Macho. By focussing on both theoretical and empirical aspects of the decomposition procedure su ^gested by the previous author, this paper emphasizes how the identification and estimation problems of such procedures are clearly non trivial. Furthermore, if certain orthogonality restrictions among the several components are not imposed, the procedure can lead to serious interpretation problems from the economic point of view. Evidence from two monthly economic time series of Spanish data are used to clarify this bone of contention. Key words: Components models, states space, orthogonality and stachastic trends. AMS clasificai©n: 62P20, 90A 16, 90A20. ('OMENTARIO^ SOFiFtF? F?l. ('FtF?('IMFFNT(^ SI,IFiti'A('E:NTE E^.N VARIAF;LF-:^ E('ONOMI('Ati i(ii CONTESTACI ON F. JAVIER FERNANDEZ MACHO Departamento de Econometría y Estadística e Instituto de Economía Pública Euska! Herriko Unibertsitatea Agradezco al profesor García Ferrer sus interesantes comentarios a mi articulo «Ei crecimiento subyacente en variables económicas» (Revista Estadística Española, n.° 126), a los cuales responderé punto por punto a continuación, siguiendo la rnisma divisián teórico/empírica por él utilizada. A modo de resumen, señalaré que las críticas teóricas no se refieren tanto al modelo en sí, sino a cierta adjudicacián de valores a sus parámetros tal que induzca suavidad en el componente de tendencia, mientras que las empíricas se refieren más bien a las tasas de variación de ia tendencia y no al crecimiento subyacente definido en mi articulo. Por otro lado, García Ferrer parece utilizar en sus comparaciones un modelo ligeramente distinto del estudiado. Los modelos estructurales de series temporales (1) (MEST) suelen definirse, en sentido amplio, como modelos de componentes no observables donde los mecanismos que gobiernan tales componentes aparecen explícitamente modelados rnediante ecuaciones de comportamiento. Esta definicián arnplia admitiría (1) Los primeros prototipos de modelos estructurales aparecen ya en los años sesenta como justificaciones teóricas de técnicas ad hoc de predicción tales como el suavizamiento exponencial o el procedimiento de Holt-Winters; véanse Muth (J. Am. Stat. Assoc., 55, p^gs. 299-305, 1960) y Thell-Wage (Manag. Sci., 10, págs. 198-206, 1964). La rnetodología estructural comienza a desarrollarse con el trabajo de Harvey-Todd (op. cit.); siendo el trabajo de HarrisonStevens (J. Roy. Stat. Soc., B38, págs. 205-247, 1976) y de Engle (op. cit.), entre otros, sus más inmediatos precursores. Posteriormente han venido a desarrollarse extensiones en el dominio de la frecuencia para series multivariantes (Fernández: J. Tim. Ser. Anal., 11, págs. 89105, 1990; Fernández-Harvey: J. Bus. Ec. Stats., 8, págs. 71-78, 1990), en tiernpo continuo (Harvey-Stock: J. Economic Dynamics and Control, 1989), etc. EI libro de Harvey (Forecasting, Structura/ Time Series Models and the Kalman Filter, 1990) continúa siendo la referencia más completa. ^h^ f^,^"T^^AUIS^i`I("r^ E-^.SPAÑOLA a los modelos UCARIMA como estructurales siempre y cuando los procesos que generan los componentes tengan órdenes completamente especificados. En este sentido, la forma UCARIMA del MEST (11) contendría un ARIMA(0,2,1) como tendencia, un ARIMA(0,0,1)X(o,1,0)12 no invertible como estacionalidad y un ruido blanco corno irregular. En cuanto a los aspectos teóricos, vaya antes por delante el señalar que el objetivo de aquel artículo consistia en resaltar las propiedades espectrales de un procedimiento para la extracción de tendencias y crecimiento subyacentes en variables económicas basado en un MEST definido p©r las expresiones (11) (2). De esta forma se pretendia facilitar la comparación entre este método y los analizados en sendos artículos que le acompañaban. Las propiedades de la extracción basada en el MEST (11) quedaban resumidas en las expresiones (19) y(27), correspondientes a las funciones de ganancia de los filtros resultantes al utilizar el procedimiento en cuestión. Los comentarios de García Ferrer no se dirigen hacia estos aspectos espectrales, sino a señalar las discrepancias existentes entre la extracción basada en el MEST {11) y la resultante de aplicar las sugerencias de Young y sus coautores dirigidas a conseguir componentes tendenciales más suaves (3). Como sea que el modelo de Young es un MEST símilar al (11) pero con restricciones en los parámetros que influyen en el componente de tendencia, tenemos que las discrepancias obtenidas son resultado directo de aplicar arbitrariamente tales restricciones. Concretando, la tendencia del modelo de Young sería un caso particular de la del MEST (11) con a^=0 (4), y 62^ NVR•a^, donde la relación señal/ruido NVR es un valor prefijado (5). Algunas consecuencias son las siguientes: 1. Las propiedades espectrales del procedimiento preferido por García Ferrer pueden obtenerse fijando c^2=0, y a^ NVR•cs^ en las ganancias (19) y(27). De hecho, para series con pauta estacíonal poco volátil tales ganancias pueden aproximarse mediante las expresiones: (19*) [1+c(^,)z/NVR]^' (tendencia) (27á ) c(r^,)'^2[1 +c(^,)2/NVR]4' ( crecimiento anual) (27b ) c(^,)12[1 +c(^,)^/NVR]^' ( crecimiento básico) (2) Una vez corregida la errata a2 por 6u^ como varianza de w,. (3) A pesar de la introducción, no se compara con otras alternativas posibles como, por ejemplo, la descomposición canónica de modelos ARIMA, lo cual hubiera resultado bastante interesante. (4) Esta forma de inducir suavidad, ya propuesta antes por Kitagawa, se cornentaba en el artículo: vóase la expresión (31). (5) En !os cornentarios subsiguientes García Ferrer utiliza el valor VRM=0.0001. ('OMF',N^f'AFtIO^ ^^ OHFtE^: f^,t. ('Rf:('1{ti^lIF:N"TO Sl.1fiY.A('F-NTF^ t^^.N V,ARIr1Hl f^S t^(^ON( ^ MIt^Ati _^ f^^ lo que demuesira que la tendencia y crecimiento extraídos dependen exclusivamente del valor prefijado para NVR. (Véanse en ia figura 1* las ganancias correspondientes al valor de NVR=10^4 elegido por García Ferrer en sus comentarios a los ejemplos. Es evidente que las señales extraídas han de ser forzosamente suaves.) 2. Como los dos únicos parámetros que determinan la evolución del componente de tendencia son prefijados por el analista, la componente de tendencia y el crecimiento extraídos dependerán casi exclusivamente de sus gustos y bien poco de la muestra. De hecho, un analista poco escrupuloso podría verse tentado a prefijar NVR de forma que la predicción de la tasa de crecimiento aproxime el valor que desee, lo que parece un tanto perverso (6). 3. Los procedimientos habituales de estimación máximo-verosimil y extracción de componentes a partir del filtro de Kalman aplicados a un MEST (11) que incorpore dichas restricciones produciría similares resultados. Obviamente, la verosimilitud alcanzaría un valor menar que en el caso no restringido, sugiriendo un contraste de hipótesis mediante el cociente de verosimilitudes. En caso de rechazo, !a señal extraída mediante el procedimiento de Young tendría escasa justificación. 4. No es difícil presentar casos en los que una señal suave obtenida mediante el procedimiento de Young difícilmente puede interpretarse como la «tendencia». Supongamos, por ejemplo, una serie generada mediante un ARIMA(o,1,1) (7) con incrementos negativamente autocorrelados (8): como es bien sabido, el comportamiento de tal serie corresponde a un MEST (11) donde a^>0, a?=a^?=0 y a?,>o, es decir, un paseo aleatorio más ruido blanco. La tendencia o evolución a largo plazo de tal proceso será un paseo aleatorio, lo cual no suele ser suave por naturaleza. EI MEST (11) sin restringir satisface en principio un criterio de continuidad rnediante el cual la extrapolación de los componentes permanentes coincide con la función de predicción a largo plazo óptima. Supongamos, por ejemplo, la misma serie del punto anterior: la función de predicción es una línea horizontal (6) En algún momento parece como que García Ferrer invoca al dios Bayes: en mi opinión, si el investigador tiene motivos a priori para preferir un componente tendencial más suave, es decir, si realmente posee información a priori sobre la distribución de algún parámetro que influye en la tendencia de la serie, sería conveniente estudiar la manera de expresarla como una función de densidad de forma que pueda combinarse formalmente con la inforrnación rnuestral. Esto puede resultar una alternativa rnenos drástica, y por tanto quizá más aceptable, que prefijar los parámetros a unos valores dados. (7) En torno, si se desea, a una pendiente global y efectos estacionales fijos. (8) La predicción óptima de un proceso ARIMA (0,1,1) es un suavizamiento exponencial de las anteriores observaciones; la autocorrelación negativa de sus incrementos evita que las ponderaciones alternen de signo: véase Box-Jenkins: Time Series Analysis and Control, pág. 107. F tiTAt)ItiTI( A E;St'AN( ^ t_A Z hf^ 0 ^_ U V Z_ ^ ^ ^%^ W ^ F^ ^ ^ W ^ ^ ^ .^ LL ^ O ^ ^ J_ LL. Q_ U Z Q Z Q V m_ U C N ^ C N ... (D O N O O l'OMF^.N"fARIOti ^Ol3Rl? 1^:1_. ('Rl?('IMIF:N'fO SUIiYA("ENT^I-. F^N ^'ARIAíi[.l^ti f'('(.)NOMIt Ati _^t(^? que parte de la última estimación del nivel de la serie, coincidiendo así con la extrapolación del paseo aleatorio ex#raída como tendencia. Obviamente, cualquier señal suave alternativa incumplirá este criterio de continuidad (véase la figura 2*). Cabe preguntarse en tales casos sobre si el analista realmente utilizaría esta «señal suave» para predecir el comportamiento a largo plazo de la serie y, en caso contrario, cómo conciiiaría su suposición de que dicha «señal suave» recoge el comportamiento a largo plazo dentro de la muestra con el hecho de que, sin embargo, no es óptima para predecir tal comportamiento fuera de ella. Esta forma de actuar no parece apoyar la idea de basar la elección de modelos en su «actuación a la hora de satisfacer los objetivos del análisis» que el mismo Garcia Ferrer menciona más adelante. En general, el MEST ( 11) incorpora en la formulación de los mecanismos que generan sus componentes el comportamiento a largo plazo de la función de predicción de un proceso ARIMA(Q,1,1)X(0,1,1) estacional ( 9), por lo que cumplirá naturalmente el criterio de continuidad con series generadas por dicho proceso, el cual, dicho sea de paso, sabemos resulta apropiado para muchas series económicas. Contrariamente a lo manifestado por García Ferrer, y ratificando la ya expuesto en su momento, una vez formulado el MEST especificando explícitamente los rnecanismos generadores de los componentes [p. ej., corno el de la expresión (11)], la extracci©n de los componentes resulta trivial utilizando el filtro de Kalman. Coincido, por supuesto, en que la identificación estructural no es trivial, pero esto es otra cosa. García Ferrer afirma experimentar ciertas dificultades con la estimación máximo-verosímil no restringida debido a que «en determinados casos» la superficie puede ser bastante plana. No es difícil imaginar que tales casos suelen estar casi siempre asociados a muestras de tamaño insuficiente a a muestras cuyo camportamiento no corresponde al incorporado en el MEST (10}, etc. Cuando el problema es de tamaño, una posible salución es aumentar la información muestral incorporando variables explicativas en el modelo; si esto no es posible, no habrá rnás remedio que reducir la dimensión del problema convirtiendo en determinista algún companente, generalmente el estacional (11). De cualquier forma, es preciso apreciar que para un MEST (9) Compárense dichos mecanismos con la descomposición de la función de predicción del modelo ARIMA estacional en Peña (op. cit. 1989). (1 ^) Piensen, por ejemplo, en series ciclicas o localmente cuadráticas, etc. (11) Nótese que, al realizarse una única observación anual por estación, un componente estacional no excesivamente volátil parecerá fijo en muestras pequeñas. Suponer, entonces, que el componente estacional es fijo suele ser una buena aproximación. E^:tiTAUi^'TI('A E•.tiPAlVOl.A ^ > cv ^ ^ ^ o rC ^ N cy U C T^ c a^ ^ a_^ ^L A, W ^ t'OME^NTAKIOti tiOliltE: k^:l. t'Rá^:('IMIf^:NTt) tiUliYr^t't^:N^T^t-: f•N ^'AKIAI ^ I.Fti f^(^ONO[^11t'A:ti ^fi^) observacionalmente identificado [como el definido en {11)] la forma ARIMA equivalente también presentaría el mismo problema, el cual, de hecho, difící^mente es atribuible a una u otra representación. Por otro lado, las causas que 1levan a afirmar que «ia optimización numérica no permite obtener estimaciones bien definidas (del MEST)» corresponden más al programa o al ordenador utiiizado que al modelo y^ método teóricos en sí. García Ferrer analiza dos ejemplos numéricos rnediante los tres procedimientos que le perrnite e1 programa STAMP. De todas las combinaciones posibles sólo en una encuentra problemas numéricos, precisamente al maximizar la verosimilitud exacta en el dominio del tiempo. Este procedimiento se diseñó originalmente para ordenadores main frame y, al menos en mi opinión, su uso debería restringirse a ordenadores que utilizan palabras de 48 bits para evitar problemas numéricos debido a la acumulación de errores de redondeo. Esto tambi+én resulta relevante para el comentario que García Ferrer realiza más ade[ante sobre ia lentitud del programa STAMP en el dominio del tiernpo. Aunque no veo mucha relación con las propiedades espectrales estudiadas en el artículo comentado (pero quizá sea de interés para los autores del programa), supongo que la lentitud o rapidez de ejecución observada será consecuencia más bien de la máquina utilizada, no del programa. En cuanto a los aspectos empíricos del artículo, al contar las expresiones (19) y(27) con tres grados de libertad, la visualización de la forma que lo$ filtros implícitos en el MEST toman en la práctica quedaba dificultada. Por esta razón, y lejos de pretender analizar detalladamente el cornportamíento de un «conjunto» (?) de series econámicas, cosa más propia quizá de un análisis de coyuntura, los dos ejemplos con datos reales servían para ilustrar gráficamente (en particular las figuras 4 y 7) las posibles implicaciones de dichas propiedades espectrales. Para esto sólo se precisa dar valores a los parámetros de las fórmulas (19) y (27}, que, dicho sea de paso, fueron estimadas mediante la maximización de la función de verosimilitud en el dominio de la frecuencia mediante el método de scoring como en Fernández (199^0) (12). Téngase en cuenta, además, que la distribución de los Ilamados «hiperparámetros» no es conocida (ni siquiera asintóticamente) cuando el verdadero valor es cero, por lo que la información sobre sus errores típicos no es relevante para el contraste de tal hipótesis. García Ferrer Ilega a la conclusián de que existen diferencias entre ias estimaciones del MEST ( 11) expuestas en mi artícula y las obtenidas por él utilizando STAMP. Con respecto a IPI, nótese que, en realidad, García Ferrer no está ajustando el MEST ( 11), sino el modelo estructural que STAMP propone por defecto, el cual difiere del MEST ( 11) en el tratamiento dado a la estacionalidad: (12) Ver Journal of Time Series, n.° 11, pág. 91, eq. 2.2 para n=1. I^til AI)Iti^l^lt ^-t F^f'.1N1 ^ ) :1 en éste se basa en ficticias estacionales y en aquél en términos trigonométricos. No sorprende entonces que las diferencias más Ilamativas ocurran entre los valores estimadas para la varianza asociada al componente estacional (13). En cuanto al IPC, nótese además que el período de estimación es diferente al no incluir el dato de febrero de 1990. ©ado el párrafo anterior, los cornentarios sobre la discrepancia en la «interpretación de tos resultados», así como sobre los problemas de estimacián, carecen ahora de sentido (14). Siguiendo a partir de aquí con los modelos estimados por García Ferrer (aunque, como ya he señalado, no era mi íntención realízar un análísis de coyuntura), he de indicar mi desacuerdo con su opinión de que el estadístico de Box-Ljung calculado para el retardo 24 (Q24) sea suficiente para «permitir, por si sólo, rechazar todos y cada uno de los modelos estimados». De hecho, en mi opinión, Q2a está muy lejos de ser considerado tan «fundamental en cualquier análisis de series temporales» como García Ferrer pretende. En primer lugar, el test es asintótico y, como es bien sabido, no es raro observar algunas autocorrelaciones significativas en muestras finitas de series que realmente son aleatorias. En segundo lugar, !os residuos observados no son aproximadamente normales (según el test de normalidad calculado por el propio STAMP), lo que invalida el contraste en muestras pequeñas. En tercer lugar, no estamos aplicando el contraste a los residuos de un proceso estacionario, sino a los residuos (definidos como errores de predicción un paso adelante estandarizados} de un proceso no estacionario cuyo comportamiento viene especificado por un MEST. En este caso, el examen directo del correlograma parece indicar que los residuos son estacionarios, confirmando que los componentes no estacionarios recogen adecuadamente las características permanentes de la serie (15). AI comentar sobre !os crecimientos básicos, García Ferrer presenta gráficos (5 y 6) en los que se comparan las primeras diferencias (16) de la señal suave producida por et programa MicroCAPTAIN (MEST restringido) con las primeras diferencias de la tendencia {om^} por él obtenida mediante STAMP (MEST sin restringir) en lugar de hacerlo con el crecimiento básico subyacente {bt}, sugeri- (13) Par otro lado, ignoro en qué sentido se considera escasa la precisión estadística «a j.uzgar por los errores estándar» cuando estos son prácticamente cero. No obstante recuérdese el anterior comentario sobre la distríbución de los parámetros bajo la hipótesis nula. (14) No obstante, nuevamente he de recomendar cautela al utilizar las estimaciones obtenidas por STAMP en el dominio del tiempo en máquinas cuya palabra sea menor de 48 bits. (15) En este caso la no aleatoriedad de los residuos indicaría que el modelo no recoge adecuadamente el camportamiento a corto plazo, lo que sugeriría sustituir el término irregular de ruido blanco por un componente transitorio de tipo ARMA en general. (16) Me resisto a llamarlo derivada cuando estamos en tiempo discreto. ('( ^ ME.NIA1t1Oti ^;Ot3ttf•: f^L ('Rt^(-IMIt^NlO til^l^ti'^1('t^!JTf- t^I ^'^^kl.Afil t-.ti t-( ()NOMI(-Ati Z71 do por la segunda ecuación en el MEST (11), o con el crecimiento anual subyacente sugerido en la sección 4(17). Es preciso recordar que en la sección 4 del artículo se señalaba que las diferencias de la tendencia están en general contaminadas con las innovaciones {^^} del nivel y que, por tanto, sólo cuando 6^ 0 podremos estudiar el crecirniento subyacente a partir de la tendencia. Esto último ocurre de forma natural para el IPI (compárense arnbas figuras 6) y las tasas de variación de la tendencia aparecen lo suficientemente suaves como para ser interpretadas como crecimiento subyacente. En el caso del IPC, 62nes sustancialrnente mayor que cualquier otro parámetro, indicando así que las innovaciones que influyen en el nivel de la tendencia son irnportantes. De ahí que en este caso las tasas de variación de la tendencia (línea discontinua en la figura 5 de García Ferrer) no sean una buena aproximacíón del crecimiento subyacente extraído en mi artículo para el IPC (figura 9). Por otro lado, las figuras 5 y 6 de García Ferrer presentan, además, en trazo continuo el perfil obtenido con MicroCAPTAIN (MEST restringido). En particular, el correspondiente al IPI ilustra el potencial peligro que corre el investigador al prefijar arbitrariamente los parárnetros de tendencia: de forma bien notoria en este caso, el perfil obtenido pasa por alto importantes fluctuaciones del ciclo de crecirniento debido a que NVR (la relación señal/ruido) se ha prefijado a un valor excesivamente bajo (18). No obstante, y en cualquier caso, una indicación de la banda de paso junto con el período de potencia máxima suele ser bastante clarificador. En resumen, las criticas de García Ferrer sobre la tasa de variación de la tendencia no hacen sino ratificar lo ya expuesto en la sección 4, pero, en mi opinión, están lejos de demostrar que restringir el MEST (11) prefijando los parárnetros que determinan la tendencia sea en absoluto una buena idea por varias razones: 1. En ausencia de una densidad a priori bien definida, la señal extraída puede depender más de los deseos del analista que de su información. (17) EI artículo, de hecho, no analizaba la serie {b^} sino a través del crecirniento anual subyacente {(3^=Sr(L)b^} de forma que los resultados expuestos pudieran ser cornparados directamente con los obtenidos en los artículos a los que éste acompañaba. Además, en el análisis de la coyuntura existe cierta costumbre en utilizar crecimientos anuales por razones cuya discusión está aquí fuera de lugar (véase, no obstante, Espasa, op. cit.). Si lo que se desea analizar realmente es el comportamiento espectral de {b^} conviene notar que Sr(L) introduce un factor ^c(r^,)/c(^,) en la ganancia del filtro e induce un desfase de 5,5 meses con respecto a los crecimientos básicos. Así, en la sección 4, las distintas ganancias correspondientes a{b^} pueden recuperarse a partir de las publicadas para {(3^} dividiendo por ^r^,)/c(^,). (18) Eso por un lado, por el otro el analista ini siquiera le puede hechar la culpa a!a muestra! {^fAUI^TI( ^11^I'-1N1)1.^^ 2. EI mero hecho de que una señal sea suave no implica que recoja la evolución a largo plazo de la serie y, por tanto, no necesariamente puede ser interpretada como tendencia. 3. La señal obtenida en general no cumple la condición de continuidad. 4. Las tasas de variación obtenidas a partir de una seña! excesivamente suavizada dejan de ser informativas respecto al perfil de crecimiento del fenómeno baja estudio.