ESTADISTICA ESPAÑCJLA Vol. 35, Núm. 132, 1993, págs. 5 a 38 Guía para la estimación de modelos ARCH ALFONSO NOVALES (*) MERCEDES GRACIA-DIEZ (*) Departamento de Econornía Guantitativa Facultad de Ciencias Económicas Universidad Complutense RESUMENJ Este trabajo presenta una revisión de los modelos de heteroscedasticidad condiciona! autorregresiva, prestando especial atención a su estimación de máxima verosimilitud. Se consideran las siguientes formulaciones: e1 proceso univariante ARCH, el modelo ARCH de regresión, los modelos ARCH generalizados tGARCH) y la especificación ARCH en media (ARCH-M). Para cada uno de ellos, se deducen las expresiones analíticas del vector gradiente y de la matriz hessiana, lo que constituye su principal aportación, ya que dichas expresiones no aparecen, por lo general, de forma suficientemente explícita en la literatura. Además, se resumen las propiedades estadisticas de estos modelos, los contrastes de existencia de heteroscedasticidad condicional y la estrategia de identificación del orden del proceso. Palabras clave: heteroscedasticidad condicional, estimación por ^náxima verosimilitud, estrategia de identificación. Clasificación AMS: 62M 10, 62P20, 90A20. {*) Queremos agradecer los comentarios recibidos de Juan Ayuso, M.a Luisa de la Torre, Víctor Gonzalo, Teodosio Pérez-A^maral y dos evaluadores anónirnos. Todos fos errores son nuestros. E^^-^,r^,^,i^..,r^r^,f^ E ^.,E^^,-,r^^^^^; ^^ ^^ 1. INTRODUCCI4N La c^eciente disponibilidad de datos procedentes de ios mercados financieros, hace que un número cada vez mayor de investigadores dedique parte de sus esfuerzos al análisis empírico de las múltiples cuestiones teóricas de interés relativas a tales mercados. Dentro de esta área de trabajo, fa modeiización tipo ARCH (heteroscedasticidad condicional autorregresiva) ha sido ampliamente utilizada, sin duda debido a ios aceptables resultados empíricos que ha venido proporcionando. A pesar de la existencia de «software» destinado, más o menos específicamente, a la estimación de este tipo de modelos, puede ser preferible Ilevar a cabo la programación de la estimación de r^áxima verosimilitud (MV) de la estructura ARCH por parte del investigador. Ello se debe a que, en algunos casos, las rutinas de evaluación numérica de las derivadas de primer y segundo orden incorporadas en los paq^etes estadisticos estándar no son lo suficientemente precisas para garantizar la convergencia del proceso de estimación. En nuestra propia experiencia hemos comprobado que, en ocasiones, un proceso de estimación MV que resultaba no convergente utilizando expresiones analiticas sólo para las primeras derivadas de la función de verosimilitud, ha resultado rápidamente convergente al pragramar ia utiiización de expresiones para las primeras y segundas derivadas. También hemos comprobado que cuando no se utilizan expresiones analíticas para las segundas derivadas, los problemas de convergencia del algorftmo de estimación son más frecuentes en modelos con pocas variables explicativas. Por el contrario, modelos de regresión con estructura ARCH y con un cierto número de variables explicativas relevantes han alcanzado generalmente la convergencia en la estimación MV sin necesidad de recurrir a segundas derivadas analíticas. Por todas estas razones, el investigador puede preferir tener total control del código de programación que utiliza en la estimación del modelo. Una segunda motivación para este artículo consiste en la ut^lidad de recoger en un mismo trabajo 1as diversas especificaciones de modelos con heteroscedasticidad c©ndicional, las distribuciones de sus estimadores, contrastes y posible utilización de dichos r^todelas. EI propósito de este trabajo es, por tanto, proporcionar una introducción a los rnodelos ARCH desde el punto de vista de la esti^nación de los mismos, prestando especial atención a las expresiones analíticas del vector gradiente y la rnatriz hessiana necesarias para utilizar un aigoritmo iterativo en ia estimación MV. Es en este último aspecto donde reside su contribución original, por no aparecer dichas derivadas de forma suficientemente explícita en los artículos ^habitualmente referidos en esta literatura. En todos los casos, la formulación es (^UTA F'Af^2A l A E STfMA^;i(=^N [^f= Mf )Df ^ ,c A ^^2 C ^: N 7 lo suficientemente genérica para perrnitir que cualquier potencial usuario traslade directamente !as expresiones que aquí se proporcionan a su propia aplicación, de modo que pueda programar e! algoritmo de estimación MV sin mucho esfuerzo. La organización del trabajo es la siguiente: en fa Sección ^ se justifica la modelización de heteroscedasticidad condicional. En la Sección 3 se presenta el modelo univariante ARCH como generalización de un proceso de ruido blanco. En la Sección 4 se trata el modelo ARCH de regresión, su estimación MV y contrastes de estructura ARCH. La Sección 5 se dedica a la especificación, estimación y contrastes de la estructura ARCH generalizada (GARCH). En la Sección 6 se desarrolla el procedimiento de estimación del modelo ARCH en media (ARCH-M). Finalmente, en la Sección 7 se resumen las principales cuestiones metodológicas respecto a la utilización y estimación de estos modelos. 2. JUSTIFICACION DE LA MODEL1zACION DE HETEROSCEDASTICIDAD CONDICIONAL Cuando se considera el modelo univariante AR(1): yt = pyt_^ +^ con ( p ^< 1 y ^t^i.i.d.N(0, 6^), se tiene que la esperanza matemática del proceso estocástico yt es cero y que su varianza es 6? /(1 - p2). De modo más general, si el modelo fuese yt = a+ pyt_^ +£t, se tendría que E(yt) = a/(1 -- p) y var(yt) = cs2/(1 - p^), por lo que la inclusión de un término constante afecta a la esperanza, pero na a la varíanza del proceso. Los términos «esperanza» y«varianza» que acabamos de usar son incondicionales, o dicho de otro rnodo, corresponden a la distribución marginal de yt. Alternatívamente, podemos preguntarnos acerca de la distribución condiciona/ de y^ dado el conjunto de^ información S2t_^ de que se dispone en el instante t-1, que suponemos que incluye todo el pasado de la variable yt: S^t_^ _{ Yt_^, yt_2,... }. En tal caso: E(Yt I S^t-^ )= Et-^ Yt = a+ pYt-^ mientras que: var (Yt ^ SZt_^ ) = vart-^ (Yc) = Et-^ (Yt - Et-^Yt )2 = Et-^ ^t = donde estamos suponiendo que el modelo univariante está carrectamente especificado y, en particular, que yt_^ realmente resume toda la información contenida en S2t_^ acerca de yt. Es importante observar que, aunque var (yt j S2t_,) < var (yt), las varianzas condiciona! e incondicional son ambas constantes en el tiempo. F`^1A[?I`.;il( ;A. ^ 5^'APJ^ )1 F^ Esta distincíón puede generalizarse a todo modelo de regresión: yc = xt'^3 + ut, con variabies explícativas deterministas y uc ^ i.i.d.N(0, cs^ ). La distribución de yt condicional en s2t _ ^, donde S2t _ ^={ xt, xc ^,^^^, Yc ,, Yc 2, •••} es, en este caso, también Normal con Et__^ yt = xt' ^i y vart__ ^(yt) - csú, momentos que coinciden con los de la distribución marginal de yt. Sin embargo, si ut tiene autocorrelación de orden uno, por ejemplo ut = put_ ^+ ct con ^ p ^< 1 y^t ^ i.i.d. N(0, 6? }, entonces la distribucíón rnarginal de y^ es: Yt^N(xt'^3,csu) con6^- 2 1-p mientras que la distribución condicional es: Yt ^ ^ z S^t_^ ^ N [ PYt-^ +( xc - Pxt-^ ) R^ ^^^ j con menor varianza que la distribución marginal. Obsérvese que ambas varianzas son, nuevamente, constantes a través del tiempo. Tanto en el modelo AR(1) como en el de regresión, utilizar como fórmula de previsión la esperanza condicional E(yt ( S^t_^ ) resulta óptimo si se quiere minimizar el error cuadrático medío (ECM) de la previsión resultante. Sin embargo, no se utiliza la varianza condicional de yt para tratar de mejorar estas previsiones y ésta puede ser una información relevante. ^En qué sentido puede utilizarse la varianza de la distribucíón condicional para mejorar la previsión? Si dicha varianza es constante, como es el caso de los ejemplos anteriores, y el objetivo es obtener la previsión con menor ECM, esta información no es relevante. Sin embargo, puede haber modelos en los que la varianza condicional no sea constante, sino que dependa del conjunto de informacidn disponible en cada instante. En este caso, ignorar tal hecho conduciría a estimadores ineficientes y por ello, con intervalos de confianza para la previsión más amplios, así como con mayar variabilidad de la propia previsión puntual, como reflejaria la mayor amplitud del ranga de sus posibles valores para un nivel de confianza dado. ^ Los textos habituales de Econometria describen los procedimientos para mejorar la eficiencia de las estimaciones en situaciones de heteroscedasticidad estática, especialmente cuando ésta se hace depender explícitamente de variables de dentro o fuera del modelo. Sin embargo, no es tan habitual encontrar referencias al caso especial de heteroscedasticidad condicional que acabamos de apuntar. Este tipo de heteroscedasticidad puede ocurrir en datos de series temporaies y su detección y tratamiento ha sido el objeto de diversos trabajos de investigación en los últimos años, a partir del artículo pionero de Engle (1982). C;l)IA F'ARA L.A ESTIMACI(^N UE MC)DEl_(^S AHCN 9 Supongamos, por ejemplo, que los residuos grandes y pequeños de un modelo de regresión aparecen agrupados a intervalos; ello sugiere que la varianza del término de error cambia suavemente en el tiempo, y que podría predecirse a partir de los residuos previos. De este modo, se especificaría una dependencia del tipo: ^= f(ct ^, st 2, . ..) donde at denota la varianza de ^ cambiante en el tiempo, y f es una función continua del vector de residuos pasados elevados al cuadrado (1). Existen, además, teorías que requieren la rnodelización y estimación numérica de variables que representan la volatilidad de yt (generalmente de su componente no predecible), que puede asocíarse al concepto estadistico de varianza condicional. Así, en Finanzas, las carteras de activos de inversión se escogen a partir de la media y varianza esperadas de las tasas de rendimiento, de forma que los cambios en la composición de la cartera deben explicarse por estos factores. En este contexto, si se especifica un modelo econométrico tradicional para el rendimiento medio esperado, su varianza queda restringida a una constante y no es, por tanto, consistente con el supuesto teórico de partida. En consecuencia, necesitamos desarrollar modelos econométricos en que se permita que la varianza condicional del proceso cambie en el tiempo. Una posible alternativa son los modelos ARCH, que describímos en las secciones siguientes. 3. EL MODELO UNIVARIANTE ARCH Comenzamos por el caso más sencillo, considerando la siguiente generalización de un proceso observable de ruido blanco, que denotamos por Et, cuyos momentos condicionaies son: Et-^ cr = 0 Et-^ ^t2 = ht donde ht es una función contenida en el conjunto de información disponible en el instante t-1 : ^t-1 ^ 4 Et-1 ^ £c-2, • • • }. En consecuencia: E^=E Et_^ ^=0 var(^) =E^^=E Et_^ ^2=E ht (1) Los residuos se incluyen como argumentos de f elevados al cuadrado para hacerios comparables con la varianza a^ E^ `^^T^1.C^ál^-^1I^^,^^ F^,^;F'AN^^d ^^a 1O Si suponemos, por ejemplo, que: ht = óo + b^^t ^, con bo > 0, ^> > 0, se tiene el modelo ARCH de orden 1, puesto que la varianza condicional depende de un retardo de Et. En términos de la distribución condicional de Et, suponiendo además Normalidad, el rnodelo ARCH(1) puede escribirse como: ^t ^ ^^t-^ ^N(^^hi ) [1) ht =óo+b^ ct ^ , bo> 0, ^^ ?0 [2] Más generalmente, si se supane que: hi =So+S^ ^t ^+...+óp^t p óo>O,S;>0 , ^•, p [3] las ecuaciones [1] y[3] constituyen el modela ARCH(p). Nótese que ht ha de ser positiva, puesto que es la varíanza condicional de Et, por lo que los parámetros b; i= 1,...,p deben ser no negativos. Una estimación de ó;<o, aun pudiendo ser compatible con hi ? 0 a l0 largo de todo ei intervala muestral utilizado, debe generar sospechas de mala especificación de la heteroscedasticidad condicional, bien en relación al número de retardos de ct incluidos, o bien a que !a representación de dicha heteroscedasticidad requiera un modelo más general que el de la ecuación [3]. Por otra parte, tomando esperanzas en [2], se tiene que Eht = óo + b^ Eht ^, por lo que es obvio que el proceso ARCH(1) debe satisfacer además la condición I S^ I< 1 para obtener la estacionariedad en varianza del modelo y evitar que hi sea explosivo. Esta candición, en general se expresa: Teorema EI proceso ARCH lineal de orden p definido por las ecuaciones [1 ] y[3] es estacionario en covarianza si y sólo si las raíces de la ecuación característica de ht caen fuera del círculo unidad [ver Engle (1982) para su demostración]. Dicha estacionariedad es una condición necesaria para aceptar como especificación correcta el modelo ARCH que se ha estimado. C^^IJIA F'AF2A LA E^^`^^fIMACIC)N C7E "^1<)C7F^.^^)`^ Af^C:F^^ 3.1. Distribución del modelo ARCH(1) Bajo el supuesto de que el proceso €t en [1] y[2] sigue una distribución Norrnal, sus momentos de orden ímpar serán nulos por simetría. En cuanto a los momentos de orden par, la varianza incondicional es: E^t = E hi = óo + S^ E^t ^ con lo que, bajo el supuesto de estacionariedad, se tiene: 2 -_---So -_ E Et2 -- ^^. 1 - ^i ^ De esta forma, utilizanda la expresión de 6? en [4J, el proceso ARCH(1) en [2] también puede escribirse como: 2 2_ 2 ht - 6^_ - b^ (^t-^ -- por lo que la varianza condicional del proceso, ht , excede a su varianza incondicional, 6^, en aquellos períodos en que el cuadrado de la observación previa excede a su varianza. Es decir, sorpresas altas (positivas o negativas) hacen que la varianza condicional de Et en el período siguiente sea asimismo elevada. Por otra parte, obsérvese que la predicción de la varianza condicional del proceso s períodos hacia adelante viene dada, a partir de [2], por: Ethi+ s=sp(1+b^+ó;+...+^,-^^+ó;^^ con lo que, si el proceso es estacionario, la predicción de la varianza condicional converge a la varianza incondicional cuando el horizonte de previsión s-^^. En cuanto al momento de orden 4 respecto al origen, en Engie (1982) se demuestra que tiene la siguiente expresión: E ^4 = 3 (var£t ) 2 1 -^^2 1 - 3 á^ Como puede observarse, este momento es igual a 3 veces la varianza de ^t al cuadrado (como el de una variable Normal dependiente e idénticamente distribuida) por un factor adicional que excede a la unidad. Ello quiere decir que las colas de la distribución marginal de ^t tienen más densidad que las de la distribución Normal. En particular, los momentos de cuarto orden podrian no existir, lo que ocurrirá si b> >^(1 /3 ). De este modo, puede probarse que al aumentar el valor de b^, se van teniendo resultados de inexistencia de momentos de orden par. Todos estos resultados se generalizan a procesos ARCH de orden superior. 12 ESTAC)I ;TI(::A E SPANC)L A 3.2. EI modelo AR(1) con estructura ARCH Para una mejor comprensión del tema, examinemos las propiedades de un proceso univariante AR(1) con estructura ARCH(1). En particular, prestaremos especial interés a las semejanzas y diferencias que presentan sus momentos con respecto a un proceso AR(1) habitual. Sea el proceso: Yt = PYt-^ + Et, ^ p ^< 1 [5] donde Et es una perturbación aleatoria, tal que: Et-^ £t = 4 y Et_^ £i = h? y ht se define como en [2]: ht =^+ b^ ^2 ^ con b° > 0, b^ ? 0 Respecto a la perturbación ^t, se tiene que E^t = 0 y si ^ b^ ^< 1: var (ct ) - a^ - ^°---1 - b^ Adem^s, E( ct ^_1 )= 0 por hipótesis del modelo, y lo mismo ocurre para desfases mayores, por la que €t no presenta autocorrelación. Sin embargo, las perturbaciones ^t no son independientes en el tiempo, pues sus momentos de segundo orden están correlacionados. Respecto al proceso yt, los momentos de su distribución marginal vienen dados por: E yt=0 var ( Yt ) - 6^ - 1 S° 1-p2 1--p21-b^ mientras que los momentos de su distribución condicional en S^t_ ^_{ yt_. ^, yt_2, ... } son: Et-^ Yt = PYt-^ vart-^ ( Yt )= Et-^ ^ Yt - Et-^ Yt ) 2= Et_^ £i = ht =ó°+b^ ^2^ =b°+S^ [Yt-^ -PYt-2l2 ^^ C^:^UTA f^'AF^A LA E^^TIMAC:IUN D^ w1t)l)F;_^ ^`^ Ak^^;^^ En cualquier caso, es importante observar que tanto la esperanza como la varianza condicionales de yt dependen de la información disponible en cada instante y no son, por tanto, constantes. Estos resultados se generalizan fácilmente a un modelo AR(1) con estructura ARCH(p), definido por las ecuaciones [5] y[3]. En este caso, la varianza incondicional de yt es también constante: so var(Yt)=__ 1 -Q2 1 -b1 - ... mientras que la varianza condicional del proceso en S2t _ 1 depende de la información disponible en cada instante, siendo su expresión: vart-1 (Yt)=ht =bo+ólEt 1+...+bp^t p ! ^0 + S1 ( Yt-1 T PYt-2 )2 + • • • + bp ( Yt-p-1 - P Yt-p )2 3.3. Estimación de máxima verosimilitud del modelo ARCH(p^ univariante Sea el proceso descrito en las ecuaciones [1 ] y[3]. Dado que cada observación ^t del proceso tiene una distribución condicional Normal independiente de las dernás, el logaritmo de la función de verosimilitud condicional es ia suma del logaritmo de la verosimilitud de cada una de ias T observaciones muestrales, por lo que puede escribirse como: T T ^=^ 1,=-^ ^-, t-, 2 1- in ( ht ^ + __^t 2 2ht [6] donde se han eliminado las constantes y It denota el logaritmo neperiano de la contribución del período t a la función de verosimilitud, cuyas derivadas primera y segunda respecto a b son: ai , - _^ _ an,2 E^2 as 2 n, as n, - 1 aht ^ht ^t + ct 1 a2 It -_ - ^ 1 ___._ _ ^ ___1 _ ^b' hi ^b' ht ^b 2h? ab^b' 2h4 [7] ht E s^rfa[^i^^rit^,^ E sF^^>^n^^:^^i A 1^^^ En estas expresiones b es un vector cie p+1 parámetros desconocidos y el resto son escalares, por lo que el gradiente anterior es un vector (p+1)x1 y la matriz hessiana es simétrica de orden (p+1)x(p+1). La estructura ARCH introduce dependencia entre las distribuciones de probabilidad de ^t correspondientes a períodos sucesivos de tiempo, por lo que tiene sentido definir la matriz de información como la esperanza condicíonal del hessiano de la función de verosimilitud, cambiada de signo. Entonces, utilizando el hecho de que ht es medible respecto a S^2t_^ (es decir, depende sólo de variables en S2t _ ^) así como que: Et._ ^^^ ^ hi , se obtiene: Et_ ^(^^ I ht )= 1, por lo que la matriz de información resulta: Is^=--^ ^ a^ It_^ Et_ 1 4 ahi ahi^ - ^ as<^s 2ht ^^s as ^ [8] En el caso habitual con que ht se supone una función líneai como en [3]: ht =so+s^ Et ^ +... +sp^t P --^ ht =zt's donde 2 ) Zt^ = ( 1, ^_2 ^ , . . . , st_p s'=( sp, s^ , ... , sp ) entonces, ah^ /as = zt y a partir de la expresión [7] se tiene que: alt _ aL _._ _ _^ -..._^ as ^ as 1_ ._ Z t ^ zht £t _^__ 1 ht [9] mientras que la expresión en [8] puede escribirse: , _1 ^t zt-_ h4-zt I ss 2 t [10] Las expresiones [9] y[10] resultan útiles al programar la estimación numérica del vector gradiente y la matriz hessiana del modelo univariante ARCH(p). Estos, a su vez, se utilizan en un algoritmo iterativo del tipo de ^^scoring» para obtener el estimador MV de los parámetros del modelo. Este algoritmo es: ^ ^ Si+ 1 ^ Si + ^^ -1 ^ si a^t ^ _.___ ^ t as s; 1^ (aUIF1 F^AFtf^ lA E^TIMAC^C^.JN DE- MCiOE^ l C^^^ Af^^^;r^ n n donde b;, ^ y b; denotan las estimaciones numéricas del vector b en dos iteraciones sucesivas. De este modo, a partir de las expresiones [9] y[10], el algoritrno iterativo de estimación quedaría: [11] 5^+^=b;+(Z^ Z)+'Z^ W donde: ^, zt =( 1,^2^ , ... ,E^2p)/ht .^, ^ ^ Z =(z^,z2, . .., zT ) es una matriz ( p+ 1) x T wt - ( t/ht)-1 , W =(w^ ,w2, . .,wT) esunvectorl xT por lo que la variación a introducir en la estimación del vector b en cada etapa del proceso iterativo, viene dada por los coeficientes MCO en una regresión de fa variable wt sobre e1 vector (p+1)-dimensional zt' para t=p+1,...T, donde Et es conocido en el período muestral y ei valor numérico de ht en cada iteración se obtiene con los parámetros estimados en la iteración previa. La matriz de covarianzas del estimador MV del vector b se estima consistentemente a partir de la inversa de la matriz de información en [10]. Dicha matriz de covarianzas no es, en nuestra notación, sino 2( Z' Z)-' . La utilización del factor 2, en lugar de la habitual estimacíón de la varianza condicional dei proceso, es asintóticamente válida, ya que: Et 2 2 N( 0, 1), por Io que: Et ^^c'; Y var ^t = 2 ht h? En el proceso de estimación, se utiliza generalmente como criterio de convergencia el estadístico G: G ^^ ^2 L ^^ aL ^ as' as^s' ^s [12] que se distribuye ^;. Puede probarse que este estadístico coincide con el R2 de ia última regresión efectuada en ei algoritmo descrito. Si dicho estadístico toma un valor superior al de las tablas, se interpreta que el cambio en la estimación es grande, y se continúa iterando. En caso contrario, se detiene el proceso de estimación, conservando el último valor obtenido. Í ^> f^^TAI)1;^;11r,A f^^F^ArJr)l F+, Obsérvese que la consideración de una estructura ARCH(p) supone estimar los p+1 parámetros de dicha estructura. Para limitar la dimensionalidad del espacio paramétrico, aunque manteniendo p retardos en la estructura ARCH, en ocasiones se utiliza la parametrización de ht siguiente [Engle (1983)]: h^ = bo + b1 ^, ^^ ^i ^ , [ 13] donde los c.^ i^ 1,...,p son números fijos que ponderan la importancia que las observaciones recientes tienen en la determinacíón de ia varianza. Generalmente, los parámetros c^; se escogen de modo que ^ P c^ = 1 Con esta parametrización se tiene que ^ht / ab' =( 1, St ), donde St =^p c^; ^t _; y el algoritmo en [11 j funcíona como el de un ARCH(1), con St jugando el papel de Ft 1. Sin embargo, hay que notar que la condicíón de estacionariedad debe comprobarse a partir de las raíces del polinomio: ^- 51^1 B^•••- b1^p Bp - g Y no en la raíz de 1- b^ B= 0. 4. EL MODELO ARCH DE REGRESION EI modelo ARCH de regresión es la extensión natural del modelo ARCH univariante, en el sentído de que ahora es el término de error de un modelo de regresión el que adopta una estructura ARCH. Así, denotando el conjunto de información disponible en t-1 por SZt_1 ={ xt, xt_^, •••, Yc-1, Yt-z •••}, el modelo ARCH de regresión es: Yt I s^t-, ^ N( xt' R^ ht ) 2- ht - h (^t_1, . . , ^t_P , ^ Et = Yt - xt [ 14] ) , donde xt es un vector (kx1). Este modelo podría también generalízarse con la ínclusión del vector de variables explicativas xt en la ecuación de la varianza condicional: ht ~ h (Et-1, . . . , F.^_p, xt, xt_1, . . . , xt_p, ^) aunque no consideramos este caso en nuestro desarrollo. Si en [14] no aparecen retardos de la variable endógena como variables explicativas del modelo de regresián, entonces el estimador MCO aplicado a este modelo satisface el Teorema de Gauss-Markov, ya que la esperanza de yt 1% C^111A PARA LA E5TIMACION UE MODfL<)5 ARC:^N condicional en xt es xt` [3 para todo t y la matriz de varianzas y covarianzas del vector y es a? IT, por lo que es un estimador insesgado y consistente. Sin embargo, el estimador MCO no alcanza la cota de Cramer-Rao. En este sentido, el estimador MV, que es no lineal, es asintóticamente más eficiente. Si el vector xt incluye retardos de yt, los estimadores MCO seguirán siendo consistentes, aunque sus errores estándar, estimados por el procedimiento habitual, no lo serán, ya que las perturbaciones al cuadrado están correlacionadas con el cuadrado de las variables retardadas del modelo [extensión del resultado de White (1980)]. En este caso, el estimador MV es también asintóticamente más eficiente y proporciona estimacianes consistentes de los errores estándar. 4.1. Estimación de máxima verosimilitud del modelo ARCH de regresión EI logaritmo de la función de verosimilitud condicional del modelo [14J viene dado por la expresión en [6] donde, en este caso, Et no es observable y se determina por ^= yt - xt' R Para poder utilizar un algoritmo del tipo Newton-Raphson en el cálculo del estimador MV precisamos de la expresión analítica del vector gradiente y la matriz hessiana. Obtendremos por separado las derivadas con respecto a los subvectores [i y b utilizando, en primer lugar, la parametrización más general que figura en [3]: ht =So+cS^Et ^+...+ópEt p So>O,b;>_0 i=1, ,p Las derivadas de cada término del logaritmo de la funci ón de verosim i litud con respecto al vector (3 de coefi cientes de las variables expli cativas son : ^It _- 1 1_2^hi ct _^ __ +1 2cC2 h4 _^ahi __ + xt _^2__ 2 ^t aR t R t R 2 = Xc ^t +__^_ ._ a ht_ ^t 2h2 aR 2 Et__ _ 1 ht donde aparece explícitamente la dependencia de ht respecto del vector (3. Teniendo en cuenta que: a ^2 aR -- -2 xt-^ Et-^ [ 15] E^ ^^ i af)i^:; r ir^^.^, f^ ^,i7A^W^^)^ A 1 se tiene que: ^^h? - - -2 ^L ,s, xt_, ^t-; f^^ lo que implica: P -1 ^ ^^ xt-^ ^-^ ^ , ue a 9 ru P ando términos en x E, Y la derivada P or lo q^ `^^ ^-^ _ ^ ^)^^t R R puede escribirse: 1 ^^t_ _ - ^ xt ^`t ^R 2 2 £t^ ^ -- ht,^ ^ ) ^ hi [ 16] =^xtEt^ t donde c^ denota el corchete en la expresión anterior. Derivando de nuevo, se tiene: xt xt' 2xt.__Et ^ht _. _ 1 et c^ht c^ht ____ - h4 h? aR' 2h^ h^ ^R ^R^ + _. ^^? L - ^ ^R^R^ - ^ a ^R' 2 h? an; 1 aa ^ Tomando esperanzas condicionales en S2t. ^ y utilizando las propiedades: Et__^ Et = 0 y Et_^ ct = ht con lo que Et_^ (^a / ht )= 1, se tiene que la parte de la matriz de información correspondiente al vector [3 es: =_E_ ^^2L_E^1^ t t^ ^^3^^ , ^ xt xt' hz _ 1 _ ^^h, ^^ht 2h4 ^[i ^R, Teniendo en cuenta que: E t^ _ ^^ht __ _ _.1 _^ht 2h4 ^^ ^Q^ __ 2. ht ^ 2 2 S^ Et-^ xc-^ xc-^ ^ [17] cjIJIA F'A^tr^ l_A E 5TlMA(_:lí:)N C)E:: M(^C:)E l!: ^^ AF^(,Hi 1^ ya que la esperanza condicional de 1os productos cruzados r,t ;^t ^ cuando i^j es cero, la submatriz I^3^^ de la matriz de información puede escribirse: xt xt' 2^ 2 2 , _ 2_+ 4 S^ ^t-^ xt-^ xt-^ ht ht , y agrupando términos: P I ^R = ^ Xt Xt' -^- t h^ I 2 ^2 ^ ^2 t ^ _ ^ xt xt^ r? 4^ [1 g] r donde rt denota la expresión dentro dei corchete. Por otra parte, las derivadas con respecto al vector b se obtienen del mismo modo que en el modelo ARCH(p) univariante. Es decir, la expresión del vector gradiente aL/^b viene dada en [9] y para estimar la matriz de información I^ puede utilizarse la expresión en [10]. Lema Si un modelo ARCH de regresión con bo>0, b^,..,óp> 0 es simétrico (2), se tiene: I^^ - Ec-^ ^ ^ ^ht aht ' = 0 ^ b ^^i' ^ lo que implica que la estimación de ó y^i por separado es asintóticamente eficiente [para su demostración, ver Engle (1982)]. Sobre la base de este lema y de los desarrollos anteriores, puede proponerse la siguiente estrategia de estimación MV: 1) Estimar ^i por MCO en el modelo de regresión yt = xt' R+ ct y obtener las residuos ^ 2) Utilizar ^t para estimar el vector b por un algoritmo iterativo (MV). ^ Alcanzada la convergencia en la etapa anterior, utilizar b para estimar el 3) vector ^3 por un algoritmo iterativo (MV). 4) Volver a iterar en b y R si se desea. (2) Un proceso ARCH se dice simétrico si la función ht y su vector gradiente (respecto al vector b) son funciones reales pares en todas sus componentes ^.t .^,..., ^t _p, mientras que las derivadas parciales de h^ respecto de ^r ^,..., ^;_^ son funciones impares en b^ ,..., bp. E `^TAC)ISTI(`^A FSPAN(.71A En cada etapa del proceso se sugiere también utilizar el algoritmo de «scoring». La descornposición de este algoritmo en las dos etapas 2 y 3 anteriores, que utilizan el algoritmo para los subvectores [3 y b por separado, es eficiente gracias al lema anterior. EI algoritmo iterati^^o del vector S en la etapa 2 del proceso de estimación, se deduce a partir de las expresiones [9] y[10] y viene dado en [11 J. Es, por tanto, el mismo aigoritmo que se utiliza en la estimación de un proceso univariante ARCH(p) donde, ahora, Et no es observable y se estima a partir de los residuos MCO del modelo de regresión. De la misma forma, la matriz de covarianzas de los estimadores MV se estima consistentemente por 2( Z' Z)^' . Las interaciones sobre el vector ^i en la etapa 3 del proceso, pueden hacerse a partir de las expresiones [1 fi] y[18] mediante el algoritmo: ^ ^ _ R;t^=^;+(X'X)^'X'e [ 19] donde se han efectuado las siguientes transformaciones en las variables: -• = xt, rt xt X' _{ x^' , x2', .. ., xT ) es una matriz k x T et = Et c^/ rt e' _( e^ , e2 ,..., eT ) es un vector 1 x T por lo que el término de la derecha en [19] puede de nuevo interpretarse como el vector de coeficientes estimado en una regresión de et sobre el vector xt' para t=p+1,...,T. Obsérvese que para construir estas variables transformadas, se utilizan los residuos MCO del modelo de regresión y la estimación del vector S obtenida en la etapa 2. También, la matriz de covarianzas del estimador MV del vector [i se estirna consistentemente mediante la matriz ( X' X)-^ . En cada una de las etapas, puede utilizarse como criterio de convergencia el estadístico G que figura en [12]. Con la parametrización más restringida, que se ha considerado en la ecuación [13]: ht = S^ + b^ St St = ^ ^i ^t2 i , , , ^i ( Yt-i - xt-i ^ ) 2 (^^111A F'ARA L^ ESÍIMI^C^_:IO^J (^E ^Jlt")[)E^l.^)`^ AR(^.F 21 se tiene que: ^^ht _ ___ _ _ c^b' 1 St ^h^ , __ _ ._ _ _ -2 b ^ ^ ^ xc-^ ^ t-^ y ^^[i , por lo que las derivadas necesarias para calcular los estimadores MV son casos particulares de las correspondientes a la parametrización más general. En concreto, el vector de derivadas primeras de It con respecto a^i, que para la parametrización más general figura en [15], es en este caso: xt ct ht S,r E^ _ ^ hi L ht ^ U^i xt-i ^t-i , por lo que, agrupando términos en x y E, el vector gradiente `^^- _^ `^it ^ ^^ ^R puede escribirse: ^._2. _^ _ ^ xc Ec __^ - - S^ ^ ^; - __._1 _ ( Et-+ ^ ht+ ^ > 2 t , 4 aR ht [20] ht+ ^ que es claramente un vector kx1, mientras que fa matriz de información que aparece en [18] es, bajo la nueva parametrización: = ^ xt xt' t -^ + 2 ó ^ ^2 ^ c,^? , ht c ^ [21 ] Por otra parte, respecto al vector S, las expresiones [9] y[10] se reducen respectivamente a: ^L _ ' 2hi t 2h E^ - 1 h^ [22] C231 expresiones que no dependen de la composición del vector de variables explicativas xt en el modelo de regresión. ^^^ ^-a ^^^ ^^ r^^^^ ^^ 1 ^^ ,^^ ^ ^^>F^^^ r^^ , ^ ^^ A partir de [22J y[23], el algoritmo de estimación para b puede, por tanto, escribirse: ^ ^ ^;+^=b^+ 1 St S, S; 1 2hi 1 I ^z 2hi ^- hi 1 S^ [24] por lo que la variaci ón en la estimación del vector S puede obtenerse como el resultado de una regres ión MCO de : C s ^? - 1 sobre el par de variables : ñ` ^ 1 , S, ^ ^bsérvese que con la parametrización sugerida, se ha reducido de p+1 a 2 el número de parámetros de la estructura ARCH, por lo que el proceso de estimación es similar al de un modelo de regresión con estructura ARCH(1), donde St juega el papel ^2 ^ . La idea del procedirniento de estimación es la misma que acabamos de exponer para la especificación más general. Consiste en comenzar con el vector ^3 estimado por MCO, generar los residuos correspondientes y utilizarlos como se indica en [24] para iterar sobre el estimador de ó. La matriz de covarianzas de los coeficientes estimados se obtiene del mismo modo que en la especificacíón general del modelo, es decir: , n VO cov L ^^ J ^2 1 St En cuanto al algoritmo de estimación MV del vector ^3, comparando las expresiones [20] y[21 ] con [16] y[18], es inmediato comprobar que el algoritmo es ei mismo que figura en la ecuación [19], donde deben tenerse en cuenta las pequeñas diferencias existentes entre las respectivas expresiones para la construcción de las variables transformadas c^ y rt . De nuevo, para la construcción de estas variables se utilizan los residuos MCO del modelo de regresión y los coeficientes estimados de ó en la etapa anterior. La matriz de varianzas y covarianzas de los estimadores MV de [3 se estima consistentemente a partir de la inversa de la matriz de información en [21 ]. Finalmente, obsérvese que la estimación MV de un modelo AR(1) con estructura ARCH(p), como el que se ha introducido en la Sección 3.2, es un caso (;I,)IA F'AFZA ^.A E:STiM^tiC;I(^N [)E^^ MC^C^ELr:^S AkC;H 23 particular de la estimación del modelo ARCH de regresión, tanto si la parametrización de ht es la general dada en [3] o la más restrictiva en [ 13]. Esto se debe a que las expresiones que se han desarrollado en esta sección son independientes de las variables contenidas en el vectos^ xt. Obviamente, el proceso de estimación descrito también es aplicable a modelos AR de orden superior con estructura ARCH. 4.R Contrastes de estructura ARCH La estimación de modelos ARCH es apropiada cuando estamos ante la presencia de varianzas condicionales que dependen del tiempo. Si en un modelo de regresión las perturbaciones no son condicionalmente heteroscedásticas, los estimadores MCO son óptimos. Por lo tanto, dado que la estimación con estructura ARCH requiere un procedimiento de estimación iterativo, es deseable contrastar si este tipo de modelo es el apropiado antes de hacer el esfuerzo de estimarlo. Para Ilevar a cabo los contrastes de estructura de heteroscedasticidad tipo ARCH es indicado utilizar el contraste de los multiplicadores de Lagrange (LM). En general, dado un modelo de regresión yt = xt' ^i + ct, ^^ N(o, a^ y^ ( 6}) en el que se desean contrastar m restricciones lineales: Ho^ 9(7) = 0 H^^J(7)^0 donde ^=([3', 9', 6? ) y g es una función vectorial de dimensión m, el contraste LM consiste en determinar si el gradiente del logaritmo de la función de verosimilitud del modelo, calculado para el modelo más general y evaluado bajo Ho, es próximo a cero. Se demuestra [Engle ( 1984)] que el estadístico a utilizar es: bLM - ^ a^ ^ 0 ] ^ ^ (Yo)^ ^ C ^^, o ^ ~ ^m Para el caso particular de1 contraste de existencia de estructura ARCH, la hipótesis nula es: Ho: h? ^ hó es decir, ausencia de heteroscedasticidad, frente a: H^: ht -h(zt', b) ^ ^,^r^^,C^^i^,rir;^ E^^^^^Nrr^,^^ A partir de la expresión [9], es fácil obtener que bajo Ho el vector de derivadas primeras respecto a ó es: ^)L _ 1 ^ Zt 0 2ho ^ ^^s E2 t _1 hó _ ^ Z' V1/o 2hó donde Wo es el vector W evaluado bajo Ho. Mientras que a partir de la expresión [10], la matriz de información bajo Ho es: Ibb 0 1 2 ^Z Z Z^ Z ^o J Por lo que el correspondiente estadístico para Ilevar a cabo el contraste puede estimarse consistentemente como: , , ^ , 2 ^LM ^ - __ WO Z ^ Z z )i Z WO ~ ^p ^ Dado que el plim ( Wo' Wo / T)= 2, un estadístico asintóticamente equivalente vendría dado por: ^^M = TWó Z( Z' Z)^^ Z' Wo/Wó Wo = TR2 ^ donde R2 es el coeficiente de determinación de la regresión de Wo sobre Z. Es inmediato comprobar que R2 es también el coeficiente de determinación de la regresión de Et sobre una constante y p retardos suyos, todos ellos obtenidos bajo la hipótesis nula. EI producto TR2 se distribuye de acuerdo con una variable ^p (el número de grados de libertad no incluye la constante). Para Ilevar a cabo esta regresión se utilizan los residuos MCO del modelo, por lo que el contraste de existencia de estructura ARCH puede realizarse sin necesidad de estimar bajo la hipótesis alternativa. Es importante resaltar que este contraste es válido con independencia de la forma funcional de ht, siempre que ht dependa de ó tan sólo a través del producto zt' b. Como puede apreciarse, el contraste es condicional en un orden p del modelo ARCH especificado en !a hipótesis alternativa H^, por lo que debe realizarse para varios valores de dicho parámetro. También, las funciones de autocorrelación simple y parcial de los residuos al cuadrado puede utilizarse en la identificación del orden p del posible modelo ARCH. En este sentido, obsérvese que los modelos ARCH pueden asimilarse a una estructura AR en varianza. Para contrastar un modelo ARCH de un determinado orden frente a una estructura ARCH de orden inferior, por ejemplo, para contrastar la hipótesis nula Ho: b2=0 en el modelo: ht = bo + ó^ Et ^+ ó2 ct 2, se compara el producto TRó con C;UTA F7Af^ l..A ESTIMAC;I(^N DE MC.)[)ELC:^S ^.R(,hi _ _ __ _ ^^j una variable ^c^, donde Ró proviene de la regresión de un vector (Tx1) de unos sobre el vector gradiente de la función de verosimilitud. En efecto, si denotamos por go la matriz de observaciones del vector gradiente calculada para el modelo más general, pero evaluada bajo la hipótesis nu{a, el contraste de los muitiplicadores de Lagrange utiliza el estad istico: , ^^M = 1 90 ( 9ó 90 )--1 9ó 1= TRó donde Ró es el coeficiente de deterrninación no centrado de una regresión de un vector de unos (Tx1) sobre go. Como es obvio, {os contrastes anteriores pueden tarnbién utitizarse para detectar la existencia de estructura ARCH en un proceso univariante, como el que se ha introducido en la Sección 3. 5. EL MODELO ARCH GENERALIZADO: GARCH 5.1. EI modelo GARCH (1.1) EI modelo GARCH especifica que, en cada período, la varianza condicional de ^, h? depende de los úftimos residuos, pero también de sus propios valores previos. Es decir: ht = SD + á1 Et 1+ 6^ h^ 1, COn ^p > Q, S1, e 1^ Q [25] por lo que las ecuaciones [1 ] y[25] representan el modelo GARCH(1,1). Obsérvese que ^ 61 ^< 1 es una condición necesaria para la estabilidad del modelo. Bajo esta condición, el modelo GARCH (1,1) equivale a un modelo ARCH de orden infinito: h2t - 1_e s^ 1^_e.^^-, + ^1 2 1 1 Esto indica que un proceso GARCH(1,1 } puede aproximarse por un ARCH(p) si p es lo suficientemente grande. Sin embargo, al igua! que en los modelos ARMA, el proceso GARCH se justifica sobre la base del principio de parsimonia. En el modelo GARCH(1,1) se tiene, a partir de [25]: Et ht S=^o + S^ Et ^2 S_^ + e^ Et ht S_1 = bo +( b1 + 8^ ) Et ht S-1 donde puede verse que, para que el proceso de varianza condicional sea estacionario, es preciso que ^ b1 + 6^ ^< 1. En tal caso, la varianza incondicional de ^t viene dada por: F: c;r^,(>^^;Ti{^^ E `;F'APv(^,l ^ ^^ 6? = E ^ t = ^o 1-1^1+H^) y al aumentar el horizonte de previsión s, puede probarse que el valor esperado de la varianza condicional Et ht S converge hacia 6?. En general, los momentos de orden 2n del modelo GARCH (1,1) existen si [ver Bollerslev ( 1986)]: ^ n J a; S^, 9;-^ < 1 1 [26] donde: ^ ao = 1; aj - Il ( 2j - 1), 1? 1 i =^ 1 Por ejemplo, en el caso del proceso ARCH(1), 61=0 y la condición [26] se reduce a a^ b^ < 1. Por otra parte, particularizando [26], el momento de cuarto orden en el modelo GARCH(1,1), existe si: 3 ó^ + 2 b^ e1 + 9^ < 1, en cuyo caso: . E (cC2 ) = óo ( 1 - b1 - e1 >-1 y E(^4)=3óó(1+b1+61) [(1-S1-e1) (1-6^-25161-35^)]-1 por lo que es fácil ver que el coeficiente de curtosis es: K=[Ec4--3(E^t )2] (Ect )-2=65^( 1-81-2ó161-3b^ )-1 que es positivo bajo nuestras hipótesis, por lo que el proceso GARCH(1,1) es leptocúrtico, al igual que ocurre con los modelos ARCH. En las aplicaciones prácticas de este modelo, se tiene con frecuencia que b1 + 61 es aproximadamente igual a la unidad, con lo que el proceso ht no se separa mucho de uno no estacionario. Tal proceso se dice que es integrado en varianza, ya que la primera diferencia de éste sería un proceso estacionario. En tal modelo, la previsián de la varianza condicional Et ht S para s> 0, no converge hacia a? al crecer el horizonte de previsión, sino que depende explícitamente de S2t. 2l t^l_ ^ IA E^AFZF+ L.A E=ST^MA(.:iOrJ C)E Mt 7f)E l^:).•^> Aflc: ri EI proceso GARCH ( 1,1) integrado se representa por [Engle y Bollerslev (1986)] : ht = zci 1 +(1 - ^) hi i [27] donde 0«<1. Este proceso satisface la condición de que la predicción de la varianza condicional s períodos hacia adefante es: Et ht S= ht ^ = iEt +(1 - t) ht , s> 0 Esto es, la varianza condicional s períodos hacia delante es la misma que la varianza condicional un período hacia adelante para todo s>o, por lo que guarda cierta semejanza con un proceso de camino aleatorio. Por consiguiente, en este proceso, las innovaciones en la varianza condicional tienen un efecto permanente. Si en [27] se incorpora una tendencia µ: ht = µ+ Z^t ^+(1 - T) ht ^ se tiene: Et ht S= sµ + ht ^_(s + 1) µ+ t^t +(1 -- i) hi , s> 0 similar a un paseo aleatorio con deriva. Nótese que, aunque la importancia relativa de ht 1 en la previsión de la varianza condicional decrece con s, su efecto es permanente. 5.2. EI modelo GARCH(p,q) EI modelo GARCH(p,q) para un proceso Et, queda definido por la expresión en [1 ] junto con: q P ht = bo + ^ b; Et ; + ^ 6; ht ; = óo + b ( B ) ^t + 8 ( B ) ht [28^ donde: p?o, q>o, ^>o, S;>_0 i=1,...q; 6;>0 i=1,...,p, reduciéndose a un modelo ARCH(q) cuando p=o, y a un proceso de ruido blanco cuando p=q=o. Análogamente al modelo GARCH(1,1), si todas las raíces del polinomio 1-8(B) están fuera del círculo unidad, se tiene: hi = bo[1 --9(1)]T^-+- b(B)[1-e(B)]-^£2= bo 1-^ e^ ;^^ +^, -^a^ ci ^ E `^>TA^11^iT1(,A E `^^'AN()l A ^ ^3 donde H(1) denota el valar numérico que resulta de sustituir B por 1 en el polinomio H(B). Es decir, el proceso en [28] puede escribirse como un ARCH(^), donde los coeficientes a, provienen del desarrollo de la expresión b(B)[1 -H(B)]_^. Teorema EI proceso GARCH{p,q) definido en [1 ] y[28] es estacionario de segundo orden, con E^=O, var(Et) = S^, [ 1- b(1) - 8(1) ]-^ y cov(^t, ^S) = 0 para todo t^s, si y sólo si b(1)+H(1)< 1[para su demostración ver Bollerslev ( 1986)]. 5.3. Identificación del modelo GARCH(p,q) Para un modelo GARCH(p,q), si definimos el proceso: vt = ct - ht , que claramente tiene estructura de ruido blanco, se tiene a partir de [28]: F^2= vt+ b^+ ó^^2^+...+ SqE^^+ 6^ ht ^+...+ Hpht p= m p = s^ + ^ ( bi + ei ) £t i - ^ ei ut-i + Vt ^-i e-^ [29] donde m= máx{p,q}. Por tanto, Ex sigue un proceso ARMA (m,p) con un término de error sin autocorrelación. Ello ha conducido a la sugerencia [ver Bollerslev (198^) y(1988)] de utilizar las funciones de autocorrelación simple y parcial muestrales de ^2 para identificar los órdenes del proceso GARCH. Si denotamos las covarianzas de Et por ^yn = cov (Et , Et n), se deduce a partir de [29] que: m ^n - ^ ^i ^n-i + ,-, n ? p+ 1 [30J donde yr = b; + H; i= 1,..., q, 9; = 0 para i>p y 5;=0 para i>q. De [30] es inmediato deducir que las autocorrelaciones de ct vienen dadas por: m P n= 7n 1^p ^-^ Wi P n-i ^ ^ -, n? p+1 [31] De esta forma, las p primeras autocorrelaciones de Et dependen directamente de los parámetros b^,..., bp y 6^,..., H^, mientras que las autocorrelaciones de orden superior se calculan recursivamente a partir de [31 ]. ^^;^.a^^ F^A^2^ ^a EST^^^,a^^^^^^^ [^E t^^r^^UE ^_C^^ a^r^;^^ 29 Por otra par#e, dado que las ecuaciones en [31 ] son análogas a las de YuleWalker, la autocorrelación parcial de orden k para ^t que denotamos por ^kk, se deriva a partir de la resolución del siguiente sistema de k ecuaciones con k parámetros ^k^,...,^kk^ k pn = ^ ^ki Pn-i ^ ,., n=1,...,k Estos resultados son similares a los correspondientes a un proceso ARMA(m,p) [Box y Jenkins (1976)). Si el proceso es un GARCH(p,q) estacionario, las autocorrelaciones simples y parciales no se hacen cero, pero decaen rápidamente. También, un procedimiento similar con yr; = S;, podría utilizarse para identificar el orden de un proceso ARCH(q), donde ^kk = 0 para k>q, al igual que ocurre en un proceso AR(q). Obsérvese que para Ilevar a cabo estos contrastes, los valores de p„ y^kk a utilizar en las ecuaciones previas deben sustituirse por sus valores estimados, utilizando su varianza asintótica que, bajo ta hipótesis nula de no existencia de estructura GARCH, es igual a 1/T. Por supuesto, una vez que se ha estimado un modelo GARCH, el contraste de las funciones de autocorrelación de los residuos se debe hacer con los residuos estandarizados. 5.4. EI modelo GARCH de regresión: es#irnación de máxima verosimilitud EI modelo de regresión GARCH(p,q) se obtiene si las ct' s en [28] son las perturbaciones de la regresión: yt - xt' [i +^t. Si denotamos por: (^' _ ( ^+ 51^...., ^q, 8^,..., ^p ^ r'=cR',^^ se tiene que el logaritmo de la función de verosimilitud del modelo viene dado en [6) con et = Yc - Xí R Y que sus derivadas primeras y segundas con respecto a^ son: aL _ ^ _..... 1 ^h^ e ? -__1 -z a^ hi -^2h a2 L _ _ ^^^^' t ^ht _ __ __1.._ . ____ _ ^ht _ __._ Et __ __ + 2ht ^^ ^$' ht [32] £2 J t -1 hi ^^, ^hr 1 2ht d^ `-^ i ^+C^JI ;T I!:^ f^ `:^F^,A^^f^^^l ^• donde: ^)hi = z + e ^^ht ^ t Z^ (^ Qi ^ ^ [34] C^(^ siendo el segundo término de [34] la diferencia con respecto al modelo ARCH de regresión. Por otra parte, la esperanza condicional del segundo término en [33] es cero, por lo que la submatriz de la matriz de información correspondiente al vector ^ puede estimarse consistentemente a partir del primer término en [33], sustituyendo ^2 / ht por su valor esperado de 1. Por otra parte, las expresianes para el gradiente y la matriz de información correspondientes al vector ^ son las mismas que las desarrolladas por el modelo ARCH de regresión, que figuran en las ecuaciones [15] y[17] respectivamente. En ambas expresiones hay que tener en cuenta que si la estructura de h^ es GARCH(p,q): c^ht ^^ - _2Q X + p ^^h? ^ ^ ^, t-^ ^c--^ ^ e^ _ _ __ ^-^ ^_^ [35] ^^ donde, de nuevo, el segundo sumando en [35] es la única diferencia con el modelo ARCH de regresión. También, al igual que en el modelo ARCH de regresión, el bloque fuera de la diagonal en la matriz de informacián resulta ser cero, por lo que ^ puede estimarse por separado de [i sin perder eficiencia asintática. La presencia de términos recursivos en [34] y[35] hace que no podamos representar el algoritmo de <cscoring» como una regresión. Por ello, es aconsejable utilizar el algoritmo de Berndt, Hall, Hall y Hausman (1974), que para un vector genérico 6 puede escribirse: ^ ^ e^^+ = e^^ + ^,^ aL ____ c^L r1 ^L _ ___ ^^é ^e^ é; ae [36] donde ^.; denota el parámetro de salto habitual en los procedimientos de optimización numérica. En este algoritmo, la dirección de salto puede obtenerse a partir de una regresión de un vector de unos sobre la matriz muestral ^L/^r. Además, dado que ht depende de sus valores pasados ht_; para i=1,...,p, en cada iteracián las derivadas en [34] y[35] deben evaluarse recursivamente a partir de p condiciones iniciales. Finalmente, por las razones ya vistas, el algoritmo puede aplicarse por separado a^ y a. ^ ^^A t^,"^f<,.^ ^ r^ F^<,.,T,^.^^•r .^ ;^^ ^;^ tif( ,[,4 ,. ^ •F.^ •• ,i 1 Si no se parte del supuesto de normalidad condicional de ^,, entonces la distribución asintótica del estimador que resulta de este algoritmo es Normal, pero con matriz de covarianzas: i( r)-' B( r} i( r^._, donde: ^(r}-^ _ - E [^2LI^T'^^^ ^' B(r) = E [(^L/^^r) (^Ll ^^r")] estimándose ambas por sus respectivos momentos muestrales. 5.5. Contrastes de estructura GARCH Si descomponemos ia estructura de la varianza condicional en [28]: ht = z, c^^, + ZZt^^2 donde: 2 ..., 2 z^t^ = { 1, Et_..^, ct _q ) 2 2 z2t • = ( ht_.., , . . . , ht_p ) ^1^ ` 1^0^ ^1,..., ^q^ ^ ^2 - (8^, 82,..., ^^} y se quiere contrastar la hipótesis nula: Ho:^2=0 (un proceso ARCH frente a un GARCH), el estadístico de los multiplicadores de Lagrange correspondiente es, de nuevo: 1 ^^M `,., + ^ +i ^^ ^ * WO ZO ^ ZO ZO ^^ ZO w0 W 0 ^_[ ^/h^ ) - 1, ..., (^^T/hT ) -- 1 siendo: Zó ^ = h^ ( ^^h^/ ^)^ ) ,...,hT ( ^^hT/^)^ ) 0 ^ donde la expresión para ^ht /^^7^ aparece en [34] de forma que Z*o es una matriz Txs (siendo s el número de variables en ht ) evaluada bajo Ho, es decir con ^2 = 0 y con los valores estimados del vector ^^ . EI estadístico ^^M en [37] se distribuye ^? donde r es el número de parámetros en c^2. La mayor diferencia con el caso ARCH(q) es que ^^ht /^^^ no tiene una expresión sencilla si la ecuación de h; incluye algún retardo de ht . Como es habitual, este estadístico coincide asintóticamente con el producto TR2, donde R2 es el coeficiente de la regresión MCO en la primera iteración del procedimiento de Berndt, Hall, Hall y Hausman (1974) a partir de la estimación obtenida bajo Ho. En este tipo de contraste se tiene un resultado similar al de los contrastes de modelos ARMA(p,q): si la hipótesis nula es ARCH(q), la matriz (Zó^ Zó) es singular para cualquier alternativa GARCH (r^, q+r2) con r^>0, r2>0. Ello ocurre, en particular, para el contraste de ruido blanco frente a GARCH(p,q). Otra propiedad es que, frente a Ho: ARCH(q), los estadísticos para las alternativas ARCH(q+r} y GARCH(r,q) coinciden. fi. EL MODELO ARCH EN MEDIA: ARCH-M EI modelo ARCH-M [Engle, Lilien y Robins ( 1987)] incorpora el supuesto adicional de que la varianza condicional del término de error influye en cada período sobre el nivel de la variable que se pretende explicar, por lo que representa un nivel superior de generalidad con respecto a los modelos que hasta ahora hemos considerado. Tal supuesto es muy apropiado en modelos financieros que traten de caracterizar la magnitud de las primas de riesgo de los tipos de interés yt, definidas como la diferencia entre el tipo forward Ft y la expectativa actual del tipo futuro Et rt+^. La idea es que siendo h; una medida de la incertidumbre existente en el período t acerca de yt, un mayor valor de ht supone, en el caso de !os mercados financieros, un mayor riesgo, que podría aparecer reflejado en una mayor prima al riesgo. Ello generaría una mayor diferencia entre Et r^_^ y el tipo forward Ft que aparece a partir de la condición de ausencia de arbitraje ( 3), por lo que la magnitud de la diferencia Yt = Ft -Et rt+^ dependerá, en general, de ht . Consideramos, por tanto, el modelo ARCH-M: Yc = a + ^3 g ( ht ) + ^t [38] S2t_^ ^. N ( 0, h? ) ^> ht ^ ^D + S1 ^ Wi ^t i , (3) Según la cual Fc, en términos continuos, es la diferencia entre los tipos a largo y corto plazo hoy vigentes en el mercado. Véase por ejemplo Ayuso et al. (1990). "3:^3 r^^t,^it^^ F^ARA L^, E:^IiMa^,it^^r^ C^E^^ ^^^1^^^>f^)^^t^)^, t^,^^ donde g es una función continua y, por simplicidad, se reduce a una constante el conjunto de las restantes variables explicativas. También se mantiene la parametrización reducida de ht considerada en [13]. 6.1. Estimación de máxima verosimilitud del modelo ARCH-M EI logaritmo de la función de verosimilitud del modelo [38j viene dado por la expresión en [6] donde, en este caso, Et es una perturbación no observable, dada por: cc= Yc--a-R9 ( hi ) [39] y ht puede escribirse como: P [40] ht = bo + S^ ^^^ Yt-^ - a-- a 9( hi ^) 2 , Si denotamos por 9 el vector de coeficientes a estimar: 9' _(a, ^3, bo, ó^), es fácíl ver que: ^t _2 . 2 1 ^ _ .21 __._-^ht + ---_ 1 ^ _ _ .-_. -^L -- _ _ 2^ ht ^6 ^8 2 t( ht ) ^^hi ^ct ^t _..--._ _ ^ _ _2 ._._____ d6 ht ^ c^6 y, dado que, a partir de [39]: ^cc _ ^8 el vector de derivadas primeras es igual a: 1 c^L _ ^^ ^ 1 2 t 1 ht2 1 _ ^^ ht2 ^^ht + f)H ^ ^ ^'t ^^g ( ht ) + _` __ 2 ht ^)H ^ t ^'t ht2 g ( h^ ) 0 0 ^^ ^^ f ` ^ ^"+ í y teniendo en cuenta que: rlg ( h^ ) ^1h; ^)g ( ht 1 ^IH ^)8 ^ ^lht se tiene: + ^)L ; ^ h2, ^)H . ^Ft ^^g ^ h? [41 ] ^^h? donde ha que incorporar la derivada: _ 2 b^ ^^^; ^t_; - 2 b1 Z u^i g( ht i^ f'c-^ 1 St En el apéndice, particularizamos la expresión [41] para algunas formas funcionales de g. Para la estimación MV del modelo [38], Engle et al. (1987) recomiendan utilizar la sugerencia de Berndt, Hall, Hall y Hausman (1974), tal y como figura en [36]. La matriz de covarianzas de los correspondientes estimadores es: var(8)= ^ ^L ^L ^ ^ .._... ___ _._ ^ ^e ^^e^ que, a diferencia del modelo ARCH simple, no es diagonal a bloques entre los vectores de coeficientes de las ecuaciones de yt y ht , por lo que en el modelo ARCH-M la estimación de estos vectores por separado no es eficiente. Debido a esto, la estimación del modelo ARCH-M no puede descomponerse en las etapas propuestas para la estimación del rnodelo ARCH de regresión. En el modelo ARCH-M, los parámetros de la ecuación de regresión y los de la estructura ARCH de las perturbaciones deben estimarse conjuntamente, existiendo una complejidad adicional para evaluar el vector gradiente ^^L/^^H en cada iteración. Ello se debe a que, como puede apreciarse en la expresión [40], hi depende de sus valores pasados ht ; para i^1,...,p. Por lo tanto, en cada iteración, ht debe calcularse recursivamente a partir de p condiciones iniciales en las que ^' , ,^ ^ ^, ^ ' p. ,^1 r^ +` ^ "." ^^ ^^ f ^ f . i".^ se supone que [3=0. Una vez calculado h^ es inmediato evaluar ^, a partir de [39]. Teniendo esto en cuenta, el algoritmo en [36^ se itera hasta alcanzar convergencia. ?. COAAENTARIOS FINALES En este trabajo se ha presentado una revisión de las posibles formas de modelizar la presenc^a de heteroscedasticidad condicional mediante formulaciones autarregresivas (ARCH) y autorregresivas generalizadas (GARCH). Las principales cuestiones metodológicas que se han tratado en 1as páginas anteriores son (i) Ignorar ia presencia de heteroscedasticidad condicional conduce, en el mejor de los casos, a una pérdida de eficiencia en ia estimación de 1os parárnetros del modelo. Si en el modelo aparecen retardos de la variable endógena como variables explicativas, ocurre además que las estimaciones de los errores estándar de los parámetros estimados no son consistentes. (ii) Para detectar la existencia de estructura GARCH, el contraste de los multiplicadores de Lagrange es un instrumento útil y de fácil aplicación. También, el examen de las funciones de autocorrelación y de autocorrelación parcial de las observaciones de la serie al cuadrado ( en un modelo univariante) o de los residuos MCO al cuadrado ( en un modelo de regresión) es de gran ayuda para identificar el orden de la estructura GARCH. (iii) La estimación consistente y asintóticamente eficiznte de este tipo de modelos debe lievarse a cabo por rnáxima verosimilitud, lo que conduce a un problema de optimización no lineal. En un modelo de regresión con estructura ARCH o GARCH, la estimación por separado de los parárnetros de la regresión y de los del modelo de la varianza condicional de las perturbaciones es eficiente, ya que la matriz de información es diagonal a bloques. Sin embargo, este resultado no es aplicable a modelos ARCH-M, donde la varianza condicional también influye en la variable que se pretende explicar y en cansecuencia, la matriz de información no es diagonal a bloques. En este trabajo, hemos intentado contribuir a facilitar la programacián del algoritmo de «scoring» paa la estimación MV de los parámetros de distintos modelos con estructura de heteroscedasticidad condicional. Pensamos que dicha estimación puede Ilevarse a cabo, por parte del usuaria, de forma relativamente sencilla con un lenguaje de prograrnacián estándar. r^L . [. ^...: r J^^1 L.1 ^) T^, ^{ ^ APENDICE En este apéndice se particulariza la expresión [41 ] para algunos casos, según la forma funcional de g: --^ (i) g(ht )-ht ^9 ( hi c^ht P 2 b 1^ UÍ ^ t-I 1 1 P ^^L i ^ 1 ^39 ^ ht 1 2 _ 2 S 1^ U} ^t_i h? i 1 ht £t 0 1 0 St ) 1 ^g ( h^ __ )_ ---^ 9 ( hi ) = hc 2^1 ht ^^hi ^ - 2 ^ 1 ^ ^i £t-i , P 2 E^ ^8 ^ ht ,-h^2J _Et-2ht - 2 b 1 ^ ^i ^c-i ht-i 1 1 ht 0 0 St (iii) g(ht)=1nht --^ ^ - 2 ^ 1 ^ ^i Et-i i P ^L = ^ _1_ ^8 ^ ht - 2^ 1^, ^i ^'t-i I n ht i +p ht2 1 St 1 In ht 0 0 £t ^ ^ ^ ^ i^^ i^^ F^^^J'^ ^ !(?ri a l Fi f;^:^3 ^ l^ff^1^^ ' ^ L^ ... 1 [„ r^e^, , i^;r . ^ ;- ^',^::^ ^ . ^; ^ ^ l^ REFERENCIAS BIBLIOGRAFICAS AYUSO, J., NovALES, A. y M. L. DE LA ToRRE ( 1990). « ^Incorporan los tipos del interbancario una evaluación del riesgo?». FEDEA, Docurnento de Trabajo 90-08. BERNDT, E., HALL, B., HALL, R. y HAUSMAN, J. (1974). «Estimation and inference in non linear structural models». Annals of Economic and Social Measurement, 4, 653-665. Box, G. E. P. y JENrc^NS, G. M. (1976). «Time series analysis forecasting and control», Holden-day, Inc. BOLLERSLEV, T. (1988). «On the correlation structure for the generalized autoregressive conditional heteroscedastic process». Journal of Time Series Ana/ysis, 9, 121-131. BOLLERSLEV, T. (1986). «Generalized autoregressive conditional heteroscedasticity» . Journal of Econometrics, 31 f, 307-327. ENGLE, R. (1984). «Wald, likelihood ratio and lagrange multiplier tests in Econometrics», en Handbook of Econometrics, Griliches Z. y M.D. Intriligator Eds., 2, 776-826. ^NGLE, R. (1983). «Estimates of the variance of U.S. inflation based upon the ARCH model». Journal of Money, Credit and Banking, 15, 3, 286-301. ENGLE, R. (1982). «Autoregressive Conditional Heteroscedasticity with estimates of the variance of United Kingdom inflation». Econometrica, 50, 4, 987-1007. ENGLE, R. y BOLLERSLEV, T. (1986). «Modelling the persistence of conditional variances». Econometrics Review, 5, 1, 1-50. ENGLE, R., LILIEN, D. y RoBBiNS, R. (1987). «Estirnating time varying risk premia in the term structure: The ARCH-M rnodel». Econometrica, 55, 2, 391-407. WHITE, H. (1980). «A heteroscedasticity consistent covariance matrix estimation and a direct test for heteroscedasticity». Econometrica, 48, 817-838. SUMMARX A GUIDE TO ARCH MODELS ESTIMATION This paper presents a review of the autoregressive conditional heteroscedasticity models, focusing on their maximum likelihood estimation. The following formulations are considered: the univariate ARCH process, the ARCH regression model, the generalized ARCH models "i^? ^ ! .," ^., . 'i 4 . ,,^ ,^^^^, (GARCH) and the ARCH in mean specification (ARCH-M). For each formulation, the analytical expressions for the gradient and the hessian are derived. This is the main contribution of the paper since these expressions are not sufficiently explicit in the literature. In addition, the statistical properties of these models, the testing procedures for conditional heteroscedasticity and the model identification strategy are summarized. Key words: conditional heteroscedasticity, maximum likeiihood estimation, identification strategy. AMS Classification: 62M 10, 62P20, 90A20. ESTADISTICA ESPAÑOLA Vol. 35, Núm. 132, 1993, págs. 39 a 86 COMENTARIOS ANTONIO GARClA FERRER Y ARANZAZU DE JUAN FERNANDEz Departamento de Análisis Económico Universidad Autónoma de Madrid RESUMEN EI presente comentario expone los principales problernas que pueden aparecer a la hora de identificar, estimar y verificar efectos no lineales en variables económicas, fundamentafinente proporcionadas por el mercado financiero. Para ello, se utiliza como ejemplo los problemas encontrados en la modelización de tales efectos para tres series de tipos de cambio del mercado de divisas español. Surgen así tres tipos de problemas, dos estrechamente relacionados con la correcta especificación del modelo, siendo la omisión de variables relevantes y la modelización de valores atípicos las principales fuentes de probiemas en este tipo de modelos. Finalmente, se plantea la interpretación económica de estos modelos como uno de los objetívos fundamentales a la hora de estimar modelos no tineales. I. INTRODUCCION EI trabajo de los profesores A. Novales y M. Gracia-Díez supone una importante aportación de cara a la estimación de las modelos ARCH y sus derivados (GARCH y ARCH-M) por dos razones fundamentales. Por un lado, la frecuente utilización de estos modelos aplicados a los datos proporcionados por los rnercados financieros ha provocado que la mayor parte de los programas estadísticos incorporen rutinas de evaluación numérica para la estimación de estos modelos. Sin embargo, tales rutinas se han centrado fundamentalmente en los modelos de heteroscedasticidad condicional autorregresiva más sencillos (ARCH) c^n una menor cobertura para la estirnación de modelos más complejos (GARCH y ARCH-M). Por ello, el trabajo de los profesores Novales y Gracia-Díez supone un gran avance en la estimación de este tipo de modelos debido a que desarrollan con extrema claridad los pasos necesarios para la estimación consistente y asintóticamente eficiente de máxima verosimilitud de los modelos de heteroscedasticidad condicional autorregresiva. La segunda razón que revela la importancia de este trabajo es que los autores realizan una cuidadosa recopilación de los procesos de identificación, estimación y verificación de los modelos de heteroscedasticidad condicional autorregresiva, recopilación inexistente hasta el momento. Los trabajos relativos a este tipo de modelos se centraban en un análisis teórico, sin excesivo detalle, de un determinado modelo (ARCH, GARCH o ARCH-M) y una aplicación empírica de éstos a datos recogidos principalmente de los mercados financieros. Por ello, pensamos que este trabajo supone una aportación importante al haber incluido los autores tanto una excelente revisión teórica de los modelos como la derivación de las expresiones analíticas del vector gradiente y de la matriz hessiana, que posibilitan la prograrnación y la estimación de forma eficiente de estos modelos. Dado que el trabajo recoge prácticamente todo lo relativo a los modelos teóricos, nos gustaría concentrar nuestros comentarios en los problemas que se pueden plantear en las aplicaciones empíricas realizadas con éstos, centrándonos principalmente en la correcta especificación de los modelos, antes de pasar al análisis de la estructura de la heteroscedasticidad condicional autorregresiva de los residuos. II. PROBLEMAS EN LAS APLICACIONES EMPIRICAS DE LOS MODELOS DE HETEROSCEDASTICIDAD CONDICIONAL AUTORREGRESIVA La enorme aceptación que han tenido los modelos de heteroscedasticidad condicional autorregresiva durante los últimos años ha Ilevado a que numerosos autores se hayan lanzado a la aplicación de estas técnicas a todo tipo de series, principalmente diarias y semanales, relacionadas con los mercados financieros. Ha sido tal el número de artículos publicados en torno a estos ternas que se podría decir que se ha convertido en una «moda» estimar modelos no lineales, fundamentalmente del tipo ARCH. Sin embargo, hay razones para pensar que se ha producido un cierto abuso de estas técnicas y que no se han seguido los consejcs dados por Engle (1982) cuando alertado sobre la posibilidad de que, en ciertas ocasiones, la aparición de residuos que presentan heteroscedasticidad (^^.r_)ME^-r^^JT^F^^<^^^ 41 condicional autorregresiva pudiera deberse a un error de especificación del modelo. De hecho, Engle aconseja que, en tal caso, el procedimiento correcto sería corregir este problema y, posteriormente, verificar si la estructura ARCH de los residuos persiste. Este hecho se pone de manifiesto en Lamoureux y Lastrappes (1990) quienes encuentran evidencia de estructura GARCH en los residuos de un modelo para la rentabilidad de 20 acciones del CBOE (1). Sin embargo, al incluir el volumen de negocio ^omo variable explicativa, los residuos de la estimación de este modelo no presentaban evidencia de heteroscedasticidad condicional autorregresiva, debiéndose pues la estructura GARCH a la omisión de una variable relevante. Nuestra experiencia con estos modelos también nos Ileva a buscar una correcta especificación del modelo antes de recurrir a la estimación de modelos no lineales. De hecho, en el análisis de tres tipos de cambio diarios de la peseta frente a tres de las más importantes divisas negociadas en el mercado español (Dólar norteamericano, Marco alemán y Franco francés), surgen dos causas de errores de especificación que, sin su corrección, nos habrían Ilevado a la estimación de modelos no lineaies, a nuestro parecer, de muy dudosa interpretación económica, tal y como ocurre en Peña (1989). La primera fuente de errores de especificacíón en este ejemplo que estamos comentando es la no modelización de los valores atipicos que presentan las series. En el período muestral objeto del estudio (1 de noviembre de 1987 a 30 de noviembre de 1988) se identificaron gran número de valores atí picos, todos con causas conocidas [de Juan (1993)] que, distorsionaban de forma importante las funciones de autocorrelación simple y parcial, herramientas utilizadas para la identificación de los modelos de heteroscedasticidad condicional autorregresiva, tal y como señalan los profesores Novales y Gracia-Díez. Esta distorsión se aprecia claramente en la tabla 1 donde se recogen los valores de las funciones de autocorrelación simple y parcial para los tres tipos de cambio sin y con el análisis de intervención. De hecho, numerosos autores [entre otros, Chang (1982), Tsay (1986)] pusieron de manifiesto esta distorsión que también se aprecia en las principales medidas estadísticas que han servido de base a numerosos autores para decidir acerca de la presencia de modelos no lineales. En la tabla 2, se presentan las principales medidas estadísticas de los tipos de cambio sin y con el análisis de intervención a partir de las cuales cabe destacar la importante reducción de la leptocurtosis al realizar el análisis de intervención, característica que presentan las variables con efectos no lineales, así como una mayor simetría en la distribución de los tipos de cambio intervenidos con respecto a las variables originales. Estas dos características (leptocurtosis y asirnetría) presentes en numerosas series de carácter financiero han rnativado la modeliza(1) CBOE: Chicago Board Option Exchange. ción de efectos no iineales, principalmente ARCH y GARCH, sin que los analistas atendiesen a las posibles causas que provocaban la aparición de estos efectos. De hecho, los modelos univariantes estimados conjuntamente con las variables de intervención [ver de Juan ( 1993)] presentaron unos residuos que no permitían identificar de forma cíara un modelo no lineal excepto para el tipo de cambio pesetas/dólar, como posteriormente cornentaremos. La segunda fuente de errores de especificación encontrada en et análisis de los tipos de cambio diarios fue la omisión de variables relevantes. En este sentido y al tratarse de series de observaciones diarias únicamente se pudieron establecer relaciones con el diferencial de tipos de interés a diferentes plazos de vencimiento (uno de los determinantes fundamentales de los tipos de cambio) y entre las tipos de cambio verificándose el carácter dominante de algunas divisas frente a otras. Los modelos bivariantes, presentados en la tabla 3, estimados conjuntamente con las variables de intervención, generaron unos residuos que fueron sometidos a un conjunto exhaustivo de contrastes estadísticos aparecidos a lo largo de las últimos años [un breve resumen de estos contrastes puede encontrarse en de Juan (1990)]. Los tests utilizados no buscaban verificar únicamente la presencia de efectos ARCH o GARCH de manera que se permitía cualquier tipo de estructura no lineal. Los resultados de estos contrastes aplicados a los residuos de todos los modelos estimados se presentan en la tabla 4, donde destacan las siguientes conclusiones: 1) Unicamente et modelo univariante [ARMA ( 1,1) con intervenciones] del tipo de cambio peseta/dólar presenta evidencia de estructura ARCH como máximo de orden 3. 2) En los casos de los tipos peseta/marco y peseta/franco, tanto en los modelos univariantes como en los bivariantes, se rechaza la estructura ARCH en los residuos, apareciendo únicamente en el caso del franco efectos bilineales cuyos órdenes no permiten una interpretación económica adecuada. 3) En el modelo bivariante entre el tipo de carnbio peseta/franco y el tipo de cambio peseta/marco [modelo (B-3)], los contrastes rechazan mayoritariamente la presencia de estructuras no lineales, con la excepción de un modelo bilineal no diagonal con retardos 8 y 12, planteándose de nuevo el problema de la interpretación económica de este modelo. De esta forma, desembocamos en e1 último problema que creemos merece la pena destacar y que debe estar presente en todas las aplicaciones empíricas de estos modelos: su interpretación económica. No podemos alvidar que somos economistas y que estos modelos, si bien mejoran la eficiencia de nuestros ;!r,F^;^ estimadores, presentan en numerosas ocasiones una interpretación económica muy dudosa, de manera que en estas situaciones, el procedimiento correcto, a nuestro juicio, debe seguir los siguientes pasos: 1) Realizar la estimación del modelo, ya sea de reg^resión o univariante, sin error de especificación. 2) Identificar los posibles valores atípi^os a través de los residuos, buscar sus causas y analizar el esquema de análisis de intervención [Box y Tiao (1975)] correspondiente en cada caso. 3) Estimar conjuntamente el modelo con las intervenciones necesarias. 4) Identificar los posibles efectos no lineales que puedan aparecer en los residuos. 5) Si los efectos no lineales tienen un significado ecanómico válido, estimar conjuntamente todo el modelo. De esta forma, se tendrá que el modefo no lineal estimado reflejará con bastante probabilidad efectos no lineales reales y no provacados por omisiones de variables. Finalmente, únicamente nos queda felicitar de nuevo a los autores por la importante aportación que realizan al campo de la identificación, estimación y verificación de los modelos de heteroscedasticidad autorregresiva condicional, Ilenando un vacío importante en este tipo de desarrollos. REFERENCIAS Box, G. E. P. y T^AO, G. C. (1975). «Intervention Analysis with applications to Economic and Environmental Problems». Journal of the American Statistical Association 70, 349, 70-79. CHANG, I. (1982). «Outliers in Time Series». Ph Dissertation. Universidad de Wisconsin, Madison. ENGLE, R. F. (1982). «Autoregressive Conditional Heteroscedasticity With Estimates of the Variance of the United Kingdom Inflation», Econometrica, vol. 50, n.° 4, julio, 987-1007. DE JUAN, A. (1990). «Eficiencia del Mercado Español de Divisas: Análisis Mensual y Diario de los Tipos de Cambio», Tesis Doctoral. Diciembre 1990. DE ^UAN, A. (1993). «Univariate and Bivariate Analysis for Spanish Exchange Rates», Documento de trabajo, DT-93 5. 4.1 ^ _ t,^;ii^,, .. LAMOUREUX, C. G. y L.ASTRAPPES, W. D. (199U}. «Heteroscedasticity in Stock Return Data: Volume versus GARCH Effects». The Journal of Finance, vol. XLV, n.° 1, ma rzo, 221-229. PEÑA, J. I. (1989). «Análisis Estadístico de los Tipos de Cambio Diarios de la Peseta», Cuadernos de opinión 3, Centro Internacional Car^os V. TsAY, R. S. (1986}. «Time Series Model Specification in the Presence of outliers», Journal of the Arnerican Statistical Assaciation, vol. 81, n.° 393, 1321-141. . j ^^-, t ^^ J ",+ ^^ r , ^ :'. F, c N ^ ^ ^ •cú a^ c ^ CD f^- O d' ^f7 p 1^- ^?' f^ N 07 00 ^-- ct N Q) C3^ cr7 r... f^- M 00 f`^- ^cCO f^- tI^ ^- N p h- M^ r- oO ^-- 00 N^t fTi CT) ^ r- CC7 c^7 O d' O Cf^ ap ^- p^ ^f7 ^p ^t h- pp M O^ I'^- c'^ N N t,c^ ^^.^- t.f) C70 r p N ct ^ Op ^-- O pp Q^ N^ CO ^f t` ^17 N O^ r- N h- r.. N^- N Q^ p -^ O r-MC3^ O M N ^t ^C ^N1^ -N O ('^OOQ) r- h- r- ^O ^ p r-O©00©OOO p O ^-- Or- O ^000^^-^. ^. ^. ^. ^. ^. OO ^. • ,. ^ U Q ^ LLLL. ( ^ ^0 ^ N c Ú^ C LL ^ ^ U C .p N' ^ U Q a- o^?ooooo^?o^-^?ooooo^?^?r-ooooo ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. ^. . ^. ^. ^ a^ C ^ {^ ' a^ ^-^U O r r- f^- f^- f^ M^t ti N^t O^- W^ 00 ^ O o0 CD 1^- N 1^- qp O") C^ I^- ^.f ) 1^- CO r ti ti. N 1^- O N pp ^c- p^ O e^ DO e- O lf ^ ^^^ N^ a0 M CD CO M O 00 N 1.f ) M O ln 00 r^ ^- O(p O 1` ^ COMONr-^NO•^^CONCV ^NCOoOMMMp00Map Z3 CD N QO ^!") O CO h- ^t Q^ r-- M^t' f^- Q) f^- ^ Cfl a0 M Cn c,p ^t f^ C^ cD ^ C7^ cD ^7 c•. Q^ N r... c^ M a0 CO r- ^f ^- ^t ^:7 cD ^t op ^-- O^ (^I C^ oO N C4 r- CD tl7 I `+ l,n r- aD l17 ©^ O pp CD O(^,^ ^t ^ N C7 t.C) ^ l.C) QO r O Cy ^ l . f ^ ^ ^-- tf ) O C7 p e-- Cp O r-- Cp f`^- (y ^ Q^ O O r M C3^ r M M l.( ) M l17 ^ -- UO r- ^ Q' ^ p O N C.,7) (V lf 7 r -' (p OOOODe-OOpr. ^, ^, ^, . . . . OOOpOpOOpO . . . . . ^, ^. . . ^, ^, . ^_ r-O^--O ^. . ^. Q O ^ ^ ^ 27 ° ^o., OMOOONC?^Ot^f^^pOoOr-(V ^tf^ h^-^^CDD ^t^ON Q^Nh-^NCD^^OQ)O)^ d`aQr-^f}GOMQ00 NNMC^ ^^ ^ ;^ ^ c Z ^ ^^O^y^h-el!')M^7`QOe-CVOOOapNMN(yr-^--r 00 M a0 t .C) ^ N `r ^ N p r" ^ c ^ N O r- ^^-' ^ -- ^ Q U C^ O O e-Nl^r-^ft17^ONr ^ti r-^tNe--OMMN COO^aO ^-- N^, r- tn ^t ^ f` ^- O^O f^- ^ t.C) M N O^ p t.f) ap N tn Cp Q OQ©OOOQpOr 00000000r--O ^. ^. ^^, . . . . . . pOOp . ^, ^. ^, . . . ^, ^, ^. ^, ^, ^. ^ ^ .p ^ U Q Ñ ^ ^^ a -cv a^ c Z ^ ^ N p -U N ^ LL. C„ ) Q ^ ^: p Q ^ a ^ ^ _ - ^ .^ a^ c ^ ^° ^ ^- C] ^ p ^ N^y CO b- N p CD ^y ^ C7^ C^0 r-- ('n t;f') <-- ^- O^-- ^t O) d' I^- M t.C) ^-- M I^•- ap N p O O P- O M p^- .- O'^ p^ M r-- CO O M^ N O ^,f- O^ ^ CO t- OC) M N^ 1^- ^ t.C) ap O M(y O I^ N C.^ N M f` ^ c^ r- c^ O•ct ^t p CD Q^ t . f) p N N^- .- op ^ I^- M O.-- O CO O(y00^00^pe--pCDOrCOOlf70NN0(h^MMMeO p O p O p O p O O O p O p O p p O O r- O O O O ^^ ^^ ^^ ^^ ^^ ^^ ^^ ^^ MN^CTNN^COt'7^ COI^.CO(`70NM^d'r (rlNC"^^ (V ^ M t17 p) r CO r-- ^- 1` Cn I„() .- p 00 CO p CO ^ O ti M^p O) M r r Cn O CD t^7 M tn ^ O ll') O^ O c'^ pp CO M^- d- O^ M 1^^ CD CO i. f^ QO ^ 00 O 0^ ^t (' V M O tn C^1 O ^O ^t ^ C3^ N (11 rCO p^ d ' Cn O r N O') O 1^- ^y M ct c^ e- ^ c^ p ^- t,n M ^ O p OO . . ppr--00©^-O . . . . . OOO OO . . p O. r-O. p O p O. ^ ^ ^ ^ '^ Z7 ^ ^ -p ^ opooo©ooooopooooooo•--oooo . . ^. ^. ^. ^. ^. ^• ,• ^ ^ c^U t^ E.^q N N N^p I^- t.() 00 ^- N O N t,f^ ^ p^ ti Q^ a0 00 O lf^ CU O^ r^ M CD ct ^-- O h.. CO N CD ap aC7 ^ CD C^ M^ N^ C'^ OO O^ ll^ ^^ N M O(^ O^^ 00 lf ^(^ i^- ^p 00 .r- M^- ^-- ^ O I^- t.C) ^-NI`--r-CO M N ^ CO t,D O ^y ©C3')^ r-N (y © M COoOC7 O N 00 ^ 00 ^ M^y O^ i^- c'^ ap O ti o0 M O d' ^ N^t ^^-- N ^ .^ C ^ ^ ^ ^ ^ ^ Ú'^ ^ p ^ ^ Ú ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ ^ c^ ^^t f^- O^ M O^ c^0 Ct7 f^- O^^t N O N CO r- O^ c^ O f` ^- N^ON^No00oOCD^d-rO00ctM ^`'-Oti^M^N MN^^NCD^C77Cnr r--MOO^ONCOOI'`N 1f^000 t^ - ^^^ ^OMd'M^d' ^fi 0 ^ 0 ^0 ^ O+:t r-p(V Cp ^-- ^t tl^ Q'^ Cn N C^ O O 1^- .- c^7 ^ O N^t r` h^- ^^fi N ^!7 O p O O p p p O O O r- O O O O O O O ^ O ^ O C? O O ^' ^' ^' ^' ^' ^' ^' ^' ^' ^' ^" ^' ^' ^' ^ U Q ^ U Q a- uU ^[ Ú ^ ^ :Ó Q a i= _^ ^ .^ a- • t- Q^ d' O N r`- CD O ti r d' M I^ N CD M^ CD ^- t-- 00 O I^ N OO^^NM^N^^CDOr-C^r-QOONOttCOMMcf ^-CU M p^ f^- ^- Cn pp f^- t1^ 00 00 CO N N O r M r- N N ^t M t-- ct O^rC701`^CO(^ODOOOCi70r-f` lnoO^Nh-CDOOO ^ O l,n^--^^t p d'O r {V ^-O r f`M O O MIf^N ^ ^1 ' 3N O^OOOOp00^-OOOp0000000^00 ^• ^• ^• ^• ^• • • ^^ ^• ^• ^• ^• ^• ^• tf 7 .-- ^ Op r pp ^^-- M•^-- CO ^ 1^- Q) ^- l17 00 r O oO^C3^oOf^-n10^d'O^^t.-chMríNCO^^^^^0 CO ^O f` I'^ l^ ^ N^(y ^ f^. ^ ^- r Ñ í`O r OM C^ C^ tT CN M IN M ^ ^ ^ a0 0^ 00 M o0 h ^ ^ O ^t 1`^ O CD O^.C) ^ r-- CD O C^1 O M r- O CD M O ti d' N N r- ln r O^ O ^ O ^©^ O 0 ^ O ^© ^. O ^. O ^. ^. ^. ^. ^ O ^. ^ . O© ^. O ^. ^. ^ . ^© ^. ^ ^. OpNOMOInOMr1^C^NMNN^`-d''r-r-opNO^M ^- l.C^ ^- Cp ^© Cp ^ O f^ r 00 ^ C7^ O) Ch O d` r- M r-- ^ CU M Q) ^t7 ^ c- CV I^- r.. N ti r- ^- Cn t^ pp O P^- O^ O) 1^. 00 C^ O^('7 pN^`-^t^t^c^^to0No0Cn^^,COd ' OOr--Q7CC^^ N lf') ^ I^- M d' N M ^1 O r- r 00 ^ p ^f7 CO CfJ CD (,^ r- r ('7 O (V o,, o. ooo ^, ^. ^. o p^. oor-ooo . . . . . ^,^. oooo ^ - o00000 ^. ^. ^. ^. c ^ ^ c ^ ^ -^ ^ l.1_ U Q Y OrO^^--M^oO^tMCDo(^tOp^CGN^NO0o^r000 e--^MM^-Nr•.©MNN^f7^-MCD^f7NdrCpP•.1^.^ctN^17 p^CDO^-^M^y^00f`^DOMNMOC3^^}-p'>tpf^-ON Cfl ^^- c`'7 f^ M r- 00 tT t)O CO O CO O 00 M CO M CJ^ I^,^ 00 O C7^ CO ln^t00N^tM^c'^o000o00r-C'^^^t'CO^0O^00 O 0 O O O ^ O O O r C^ O O p O O O O p p p O O O ^. ^. ^. ^. • ^. ^. ^. ^. ^. r-NC'^d'I.nCDti OOQ)OrNMd'tl7COf`OOOO+r CyM^ ^-- t- ^- r s- r r- r- ^-- r- N N N N N Í I ; O ^7 ^ ^ r ^ O ^ M > tv .-. ^ O Ó M O O O. Ñ ^-- ^ ^ M c3^ O o ^ O O tn ^ O O í^ ^` N O c ^ w ^ © ^ O O ^ © .- O ^ 00 N © O Ó o a ^ O O Ó O N N I ^!7 O CO N ^ ^ Ó o ^ O M O N Cn O ^7 ^ ^ ^ ^ ^ ^ ^ ° O tn ^ ^ C ^ ^ 0 (n ^ ^ Ó. O O. O ^ ~ ° ^ O). O M O. O M. O ^. O ^ ^-r- r- o ° o 0 0 M CD `^ O ^^ M N ^ ^ ^. ^ O O O O O Cn ^ O ^ I^ ' ^ O M cD ln O O o0 O^ I`^ ^t O ^ Ó . ^ O O O O O c^ ^t ^ O O M O t`7 O O N a J ^ Q ^ ° ^ p ^ •r- ^n 00 ^-O O ^t M r-o ^n r7 © ^CO Qj 0 ^ Q? N ^; tl') N ó ^ ^^ ^ ^ N CO ^ N N ^.f) _ ct tt^ ^ ^ ^ O C7 N O t^ C3) N ^ ^I Ñ ^ Ó O ^ ^ ^ O N N ^ Q Ó O Ó O Ó O ^ ^ .C `S C (p • ^ ^ ^ ^ 'X O C^ C ^p ^ ^ ^ C? Q O -p c N ^ _N ^ ^ ^ N ° p . ^ ^ ^ O c^ ^,17 ^ ^-- M ^ ^ o I C ^p :D ^ ^ o0 ^j N I ^ c^ ^p U -p ^ ^ =p ^ N ^ N Z3 Z7 ^ ^ •^ C ^ ^ ^ • ^ ^ Ú N C (p .^ tLS ,^ ^ ^ ^ ^ 'j .(p ^ % ^ •O C '^ ^ ^ • 4=. (^p ^ ^ C ^ ^ • ^ ^_ ^ ^ > ^ ^ O ^ O ^ O U U U ^ ^ ^ ^^^ ^ r , r : ^^ ^ ^ll rn © O R- ^^ _v C ^t-- CD ^-- N ^ ^ ^ LL,J II II .-^ .-^ N^t r-- N ,.^- •,... 11 !I ^-•. .--. N Q' ^-' N ..^• ....- f^ II ^-•.. ..-^ N ct r-' N ^ ...^ ^ d ^ ^ ^ ^ ^ C7 r- ^ ^ ^,; ^ ^ ^ ^ m (^ N N ^- N ^ •-- cv O^ N c'7 r-- ^-- '^ ^ P- O O L ^ CO C3^ O C^ 4D O O ^ N o0 M N M OO N ^ F- c^ ap ^ ^ ^ cY7 00 Q) ^ pj O -rs ,I o ^ Ó ^ 0^0 ^ ^ O MN ca '-'' ó ^ cn Q ;^, ^ .0 O I ^ ^p Q p^j a^0 c^ O CO N aU p O Z 07 ^p o N ^ ^ ^ ^ ^ ^^ ^^ Ó ^ ^^ O -^oO ^ ^ O ^ O N ^ cn ^ ^+ p :.^ o Ú ^ -p ^ + ó^ ^..., ^.. cn--. M^ O ^ ÑM ^ ^ ^--' QO -^ ^ N^ 00 o0 ^^ ,^ tV N 0 V- N ^O ppj ^ O O MO ^^ . O I I ^00 ^ a0 ,..., `_ ^ ^© O p 00 Q) ^Ñ ^ ^ O ~ ^ © QÑ CO ^ 0 `--`.. O O ^ ^ ^ ^? ^ ^? M ^ °O .--. 00 O _ t^- ^ ^ ^ ty ^ ^f`^ CO O i p Ll„^ ^• O ^^ c.^o ^ c`n ? M p ^ ^ + o0 ^ O^ -.^ r.oo ^-, Cl }, ^-- ^ r 0 O'^ N O o0 Ó ó `'^ o,--. c^0 MM 0_p^ N ^ p ^ 00 00 O r- 0 ^t 0 . d' ^.... CO O ^ M O O -f- I ap o0 00 ^ j Q,.-^ Z ó. Ñ Ñ CfJ ^? 4) p O^ O ^,..^ ^ O N C3) -^ N I Ó^ °.^ ^ + ap ^-j pp O p^ cn c/^ O ^ 07 M oO .N ^ O (V ^ O ^ N 0 CO p ó .^.-. . O I op „_., f`^ p^ p ^ ^ ^ ,,,^ .^ ^-M © O O c^M 00 O p^ • I ap ^ r- o °° ^ n. ^n ^ 00 a} © (nN I ^ ^ ^^ (Ó ^c^ „-. ._ ' I ^ DO ,.^ ^, .^.._ p [] Ñ pp ^ O QN ^-- O CD ^ 0..,^ O I a0 ^ ,^ ^" O N ^ j r. p ^- ^-' p © O + ^ ^ .^ + QO ^ ^U N Q O OO . r- .-. ^ c° Ó ° 0 `..- +_ ^ O' p I I^00 ^ I ó ^. o 00 c .-.. + ^ ^-^d_' ^ ^ t0 U ^ Zy ^^ CpDO O Z N Ñ p ~o O^.Cj ,(n O Q M p ^~-' ^ I ^ ..,=, ^ I .^ ..^ o cO ,p + © P^ ^ ^, ^ ^ ^ ^ -^- Q ^ a Q ^ ^ O _ ^l M Q Ñ Q N ^1 ..--. N ^ NO ^O ^p O p7 M ,p^,N o00 cv C N ^ Ó Q Ó c'^ ^ O ~ O © ©^ O O N ^O p. ^© ^^ ^ ^- ^^ c'7 O ^ ^ ZO ^ O O N^ ^ ^.... O O ©^-j •L + O ^ Q -+- ^O M O O N O O ti.. ^,.,^ M m C -}- ^ -+- ^t ^ O O -^- I + I .,..- I (D ^ II Ó <l ^ ^ .--^ ^-` II ^ <1 ^ O ^-.. (U ^ ^ ^ ^ m ^ O ^ ^ ^ ^ ^.-.. N m `-^ ^ ^ ^,O p ^..- 'C O j ^ II O ^1 © ^ ^ N ^ ^ O U C ^ ,-.^ N ^ ll.. ^ ^ TA B LA 4 Resultados de los tests de no linealidad T^po de cambio Pta/$ Tipo de camb^o Pta/DM Tipo de cambío Pta/FF ( U-1) (U-2) (B-1) (U-3) (U-4) (B-2) (B-3) GrangerNewbold NL NL NL NL NL NL NL Maravall NL L L L NL L NL McLeod-Li L L L L L L L L L (lineal excepto L (lineal excepto L (lineal excepto L Modelo Test Keenan Bilinear * diagonal L NBL (excepto L NBL NBL y super diagonal NBL NBL i=5,j_g; i=6,1=10). ARCH ARCH para p< 4 NBL (excepto NBL NBL NBL * sub para M^ 2'3) 7,9,10) NBL NBL para i= 3) para i =. 9) (excepto para i=8,j=9; para M- 2) para M = 4,5,6, NO ARCH NO ARCH NBL (excepto (excepto para para i=1,j=2; i=9,j =12) i-=1,j=2; i==3,j=-4; I =fi,j=7; i=8,j=9) NO ARCH NO ARCH NBL (excepto para i=1,j=2; NBL (excepto para i=6,j=7; i=8,j=9) i-8 j_12 - ) NO ARCH NO ARCH NL: Efectos no líneales fueron detectados L: residuos son lineales NBL: residuos no son bilineales Modelo {U-1): Modelo univariante estimado para el tipo de cambio Pta/$ Modelo (U-2): Modelo univariante estimado para el tipo de cambio Pta/DM Modelo (U-3): Modelo univariante estimado para el tipo de cambio Pta/FF Modelo (U•4): Modelo univariante estirnado para el tipo de cambio Pta/FF Modelo (B-1): Modelo bivariante entre el tipo de cambio Pta/DM y el diferencial de tipos de interés Modelo (B-2): Modelo bivariante entre el tipo de cambio Pta/FF y el diferencial de tipos de interés Modelo (B-3): Modelo bivariante entre el tipo de cambio Pta/FF y el tipo de cambio Pta/DM (^ OM1^^f h^^^T^A^I^'^^:.y J. DEL H^YO A. S. MARTIN ARROYO^ Departamento de Análisis Económico, Facultad CC.EE.EE., U.A.M. RESUMEN Es bien sabido que el Talón de Aquiles de la Econornía Cuantitativa lo constituye la especificación inicial del modelo, que se supone reúne las características esenciales del sistema que se estudia. A medída que se estirnan modelos que involucran datos con gran contenido dinámico, la especificación de la parte sistemática se revela muy precaria. Nuestros comentarios se centrarán en un doble aspecto. De una parte, en rnétodos alternativos de estimación y, de otra, en la verificación mediante estadísticos derivados de estimadores máximoverosímiles. Se propone el filtro de Kalman para obtener la función de verosimilitud que posteriormente puede maximizarse por los procedimientos habituales. Queremos en primer lugar agradeGer la invitación que la Revista Estadística Española nos ha hecho para comentar el trabajo de los profesores Novales y Gracia-Díez, en el que examinan la presencia de heteroscedasticidad condicional autorregresiva (proceso univariante ARCH, modelo ARCH de regresión y especificación ARCH-M^ y autorregresiva generalizada (modelo GARCH), resumen las propiedades estadísticas, contrastes y estrategia de identificación, y elaboran, con especial atención, la estimación por máxima verosimilitud (MV). Consideramos que dicho trabajo, de gran claridad expositiva, cumple perfectamente con el deseo de los autores, tal y como se recoge en ef propio título, dado que será una guía útil para los investigadores interesados en el problema de estimación y verificación de este tipo de modelos. Nuestros comentarios se centrarán, después de algunas observaciones de carácter general, en un doble aspecto. De una parte, en métodos alternativos de estimación y, de otra, en la verificación mediante estadísticos derivados de estimadares máximo-verosímiles. Es bien sabido que el Talón de Aquiles de !a Economía Cuantitativa lo constituye la especificación inicial del modelo, que se supane reúne las características esenciales del sistema que se estudia. En particular, se consideran modelos especialmente favorables aquellos que resumen la información contenida en las variables a explicar mediante dos partes aditivas. La primera parte contiene la información sistemática asociada a un conjunto de variables explicativas, mientras que la segunda, denominada perturbación, resume la parte no sistemática. En la situación más favorable se impone ortogonalidad entre los dos componentes; además, se procura que la perturbación sea ruido blanco con la finalidad de que contenga la menor infarmación posible relativa a las variables que queremos explicar y, naturalmente, porque ello simplifica en gran medida la obtención de resultados estadísticos óptimos. En un principio, ésta fue la práctica seguida y pareció dar buenos resultados en los primeros modelos estimados con datos caracterizadas por su moderada información dinámica. Sin embargo, a medida que se fueron estimando modelos que involucraban datos con gran contenido dinámico, la especificación de la parte sistemática del modelo se fue revetando como muy precaria. En estas condicianes, parte de la información de la componente sistemática pasa de forma tautológica a la perturbación y, por tanto, la probabilidad de que ésta continúe siendo ruido blanco disminuye drásticamente. La situación anterior se plantea con especial crudeza cuando se pasa a estimar modelos can datos cuyo intervalo de rnuestreo es igual o inferior al mensual; por ejemplo, con datos diarios u horarios y con modelos referidos a series financieras. La forma que adopta la distribución del rendimiento de un valor se ha considerado siempre un factor determinante del riesgo de una inversión. Si las distribuciones de sumas de variables tales como cambios en los precios o rendimientos compuestos continuamente se aproximan a una distribución límite, entonces ésta debe pertenecer a una clase estable de distribuciones de la cual la normal es un caso especial. Además, aquellas distribuciones estables que sean simétricas y no normales tendrán características leptocúrticas. En la literatura financiera, el mercado es quien valora la distribución conjunta de los precios en cada instante futuro del tiempo con la información disponible en la actualidad. En este sentido, se dice, si el rendimiento de un activo sigue un camina aleatorio (es decír, la mejor predicción del rendimiento futuro es el rendimiento presente), entonces el tipo forward vigente es simplemente el rendimiento esperado ahora sobre el período de mantenimiento del activo (es decir, el precio se comporta como una martingala con respecto al cs-álgebra generado por la partición en t del espacio de los estados). La correcta especificación de un modelo requiere, previamente, el conocimiento de las leyes que gobiernan el comportamiento econórnico del sistema que se va a modelizar. Además, en general, incluso si nos centramos en procesos estacionarios de segundo orden, existe una multiplicidad de modelos que son estadísticamente compatibles entre sí. En concreto, para cada modelo ARCH(p) existe un modelo de parámetros cambiantes que implica exactamente la misma pauta de comportamiento de las covarianzas condicionales para la variable de interés. ^,^^E r^ ^ ;^ ^ .^^ Adernás, determinados modelos con parámetros cambiantes son equivalentes a otros lineales con estructuras heteroscedásticas en las perturbaciones y que, también, pueden interpretarse como modetos bilineales. Asimismo, si los comparamos con modelos univariantes, resulta que la función de autocorrelación identificaría un modelo ARMA(p,q) con parámetros constantes. Un ejemplo de la primera proposición puede verse en Wolff ( 1987) donde a partir del modelo ^^t = xt' Rt con ^ i^3 + ut y ut ^ NID(o, Q), se demuestra que, dadas las siguientes condiciones: (i) x' = (1 , ^.t_^, ...., ^t_p), (íi} ^3 = 0, (iii) Q= diag(q?^ i= 0,..., p), entonces q? _^;. i= 0,..., p, los coeficientes de la varianza condicional. iEl análisis puede ser extendido al caso en el que las perturbaciones estén correfacionadas. Este método puede ser, por tanto, utilizado para estimar perturbaciones ARCH en caso de que ias hubiere. De forma más precisa, el modelo de coeficientes aleatorios irnplícito en el modelo ARCH puede ser estimado mediante el uso de su representación de espacio de los estados. Así, por ejemplo, la representación de filtro de Kalman del modelo de coeficientes variables implícito en la especificación ARCH(1) de las perturbaciones aleatorias sería de {a siguiente forma: , ^t = (1 ^ cc-i ) ( ^o, ^^ )t (^0^ t-'1)^ = Ut, en donde ut ^ NID(o, diag(qo, q^)). Un ejemplo de la segunda proposición puede verse en J. del Hoyo (1991). Supongamos un modelo AR(1) en el que el parámetro (^ depende del tiempo de acuerdo con un esquema de corrección que depende del error de predicción del períoda anterior. Yt = ^3t Yt_i + r.t ^t=R+^^t-^ que equivale a Yt= ^Yt_^+^.Yt-^^c._^ +^t y puede, también, interpretarse como un modelo no lineal en el que, la estructura bilineal, proviene no de un intento más o menos ad-hoc de generación de una perturbación heteroscedástica sino directamente de un modelo lineal con perturbación homoscedástica en el que está definido un mecanismo de adaptación del parámetro autorregresivo de acuerdo con un esquema muy sencillo de corrección de error de primer orden. Bajo ciertas condiciones, estos mecanismos pueden generalizarse a otros más complejos con un mayor número de términos de la corrección de los coeficientes del modelo. i^'^^C^)^ Puede demostrarse igualmente que el modelo final de esta forma obtenido se identifica mediante la f.a.c. de y, como un ARMA(1,1) heteroscedástico. Por otro lado, como ia estructura heteroscedástica proveniente del modelo con parámetros cambiantes puede ser débil y como también, dependiendo del valor numérico de los parámetros de los operadores autorregresivos y de media móvil del modeio habitual ARMA(p,q), éste puede tener una apariencia heteroscedástica se tiene que desde un punto de vista práctico, estos modelos, podrán ser considerados como observacionalmente equivalentes. En aqueilas situaciones en las que la Teoría Económica no facilita información suficiente sobre la forma de la componente sisternática, tenemos, en principio, dos vías alternativas para resolver los problemas de modelización que nos plantea el hecho de que la perturbación no sea ruido blanco. La primera consiste en invertir mayores recursos en mejorar la especificación dinámica de la parte sistemática. Esta es una tarea difícil y en la que no puede garantizarse el éxito. Sin embargo, dentro de esta vía de aproximación, existe la posibilidad de identificar y tener en cuenta la presencia de valores atípicos que, en gran medida, son responsables de que el comportamiento estadístico de la perturbación no sea ruido blanco. Las observaciones atípicas, pueden alterar la relación dinámica entre las variables haciendo que el sistema reaccione de forma diferente según sea la intensidad o nivel de la variable explicativa, puesto que la respuesta de la variable dependiente puede ser lineal y contemporánea frente a variaciones ligeras de la variable explicativa, mientras que la respuesta puede ser no lineal y con retardos frente a grandes variaciones de las explicativas. Además, es sabido que la propia presencia de importantes valores atípicos puede distorsianar la estructura dinárnica de las variables explicativas junto con la del término de perturbación. En aplicaciones económicas, es muy frecuente asociar la presencia de lo que se denominan «intervenciones» a los valores residuales atípicos, y, como se puede demostrar [véase, por ejemplo, Box y Tiao (1975), Chang (1982), Ghang y Tiao (1983), o Chang, Tiao y Cheng (1988)], cuando estos atípicos se toman en consideración desaparecen los problemas. La segunda alternativa es la que investiga la presencia de los residuos atípicos modelizando convenientemente la camponente de perturbación del modelo. Dentro de esta aproximación se sitúan los modelos ARCH y sus modificaciones posteriores. Estimación EI procedimiento de estimación analizado por los autores se centra en la función de verosimilitud y presentan sus resultados en forma clara y concisa. Las hipótesis de partida fueron las siguientes: el término de error se distribuye ^^ 1"f, F P' ^ 1 C.t i^! f;^ condicionalmente normal independiente, con covarianza incondicional nula, varianza incondicional constante, esperanza condicional nula, y varianza condicional continua que pertenece al conjunto de información disponible en un determinado momento del tiempo, pudiéndose así predecir a partir de !os residuos previos al cuadrado. Además, se supone que el modelo está correctamente especificado, en particular al definir el conjunto de información que incluye variables explicativas deterministas y el pasado tanto de la variable endógena como el de su varianza condicional. Nuestros comentarios a la estimación parten de proponer, como una alternativa el filtro de Kalman para obtener la función de verosimilitud, que posteriormente puede maximizarse por los procedimientos habituales. Los modelos estudiados de regresión con esquemas de perturbaciones heteroscedásticas, pueden reformularse como modelos en espacio de los estados. En particular, el modelo de regresión que los autores utilizan, puede escribirse directamente suponiendo que sigue la representación siguiente: Ecuación de transición de estados: {^i = (i Ecuación de observación Yt=xt^+^`c EI logaritmo de la función de verosimilitud de todas las observaciones del modelo es función de las varianzas condicionales ht y de los residuos recursivos del modeo, vt = Y- Yt^t--^^ A partir de unos valores iniciales, e1 filtro de Kalman aplicada a las ecuaciones de transición y de observación permite obtener de forma recursiva las expresiones de los residuos y de las varianzas candicionadas. En el caso que nos ocupa, con perturbaciones que presentan las estructuras heteroscedásticas propuestas, se conoce el modelo de la varianza condicionada, que depende de un conjunto de coeficientes, ^ y H, junto con los cuadrados de las perturbaciones retardadas hasta p períodos, así como los retardos de las varianzas condicionadas hasta q períodos. Por tanto, el problerna restante consiste en obtener los valores iniciales y fijar el comienzo de la recursión. Una posible vía de solución consiste en efectuar una prirnera estimación en bloque mediante MCO, utilizar como valores iniciales ^30 =^3MCO Y Po =(X'X)-' junto con los p primeros residuos MCO, ^^^ ...^P Y hó^ h2^ ^^^ h^ --- y-^MCO Y comenzar la recursión en t= p+ 1. Esta solución sólo nos proporciona la función de verosimilitud condicionada, que se maximizará respecto a todos los parámetros del modelo. Sin embargo, bajo las hipótesis de estacionariedad, coincidirá asintóticamente con la función de verosimilitud exacta. Así, pues, puede ser de gran utilidad comparar los resultados de estimación propuestos por los autores y los que se conseguirían con este procedimiento alternativo para evaluar la función de verosimilitud. Además, creemos que dicho procedimiento recursivo tiene como ventaja adicionai que, en cualquier instante t, se pueden comparar la varianza condicional con la estimación recursiva de la varianza 6^ o bien 6t ^ t_^. Cabría también la posibilidad de considerar alternativamente otros estimadores no lineales, para este caso de observaciones dependientes, que fuesen consistentes y asintóticamente normales en condiciones menos restrictivas (por ejemplo, heteroscedasticidad a correlación serial de forma desconocida). En este sentido, el estimador mínimo cuadrático no lineal (MCNL) existe bajo condiciones generales. Las condiciones de ortogonalidad que se suelen imponer para asegurar que el valor esperado de la función a minimizar posea un mínimo se cumplen automáticamente si el término de error se interpreta, como los autores hacen, no como perturbación aleatoria o error aditivo de medida, sino como diferencia entre la secuencia de observaciones y una esperanza condicional a un 6-álgebra apropiado (aunque, para el caso en que algunas variables explicativas sean variables dependientes retardadas y el término de error esté serialrnente correlacionado se debería utilizar el estimador de variable instrumental no lineal). Dos tipos de estimadores podrían considerarse: el estimador del Método Generalizado de los Momentos (MGM) de Hansen (1982) y el estimador MCNL de White (1980}. EI primero presupone estacionariedad estricta, mientras que el segundo no supone estacionariedad, aunque sí impone restricciones más fuertes sobre la memoria del proceso que la de ergodicidad y condiciones ligeramente más fuertes sobre los momentos. Hansen ha estudiado la consistencia de los estimadores MGM en el caso de separación paramétrica y en el caso de continuidad y compacidad. En el primero, se considera la estimación de un elemento po E P en un espacio paramétrico P c lRk de dimensión menor que k que da cabida a posibles restricciones no lineales sobre el espacio paramétrico. Limitando sustancialmente la interacción entre las variables observables y los parámetros, el enfoque empleado para la estimación se basa en la utilización de condiciones de ortogonalidad, como ya hicieran Sargan con estimadores de variables instrumentales y Chaing y Ferguson con estimadores de mínima distancia. En el sengundo, restringiendo el espacio métrico a que sea compacto, se consideran formas más generales de no linealidad, utilizando igualmente condiciones de ortogonalidad para la cons- +"j"^"É ^^ i AF?lí ^ trucción del estimador no lineal de variable instrumental. Este tipo de esti^madores ha sido también estudiado por Amemiya y Jorgenson y Laffont, entre otras. Por su parte, el estimador MCR1L de White, 6^, resuelve el problema n min Qn (8} = ^^^ ^(Yt -- f't ( Xt, 8))^, que existe bajo el supuesto de que la secuencia r1 t=1 H^ n de observaciones reales {Y^} pueda ser representada mediante Y^ = f^^t (Xt, 80) + ct, t= 1, .., n, donde f^t: ^i`' x O-^ ^', v <^ son funciones conocidas medibles en [R" para cada 6 en O, y continuas en G(un subconjunto compacto de [RP) uniformemente en t casi seguramente. 6o es un vector p x 1 desconocido. Yt y Xt son observables, pero ^ no lo es. Las condiciones util^zadas en el desarrollo de este estimador permiten que los regresores y los errores exhiban dependencia temporal y heterogeneidad simultáneamente. En un futuro trabajo de investigacíón sería aconsejable, por tanto, estudiar y verificar los resultados obtenidos por otros rnodelos y procedimientos de estimación con los que aquí se proponen, y evaluarlos desde un punto de vista predictivo. Verificación La contrastación de la estructura ARCH se realiza mediante el contraste de Multiplicadores de Lagrange ( ML), que puede interpretarse como la distancia (norma} a cero de la proyección del término de error al cuadrado relativo a la varianza bajo la hipótesis nula (ausencia de heteroscedasticidad) sobre el espacio generado por el pasado del térrnino de error al cuadrado y un vector de constantes. Como se sabe, es asintóticamente equivalente al estadístico del tipo TR2, donde R2 es el coeficiente de determinación en la proyección anteriormente mencionada. Por otra parte ( véase Bollerslev, 1986), no es posible desarrollar un test general que verifique ei efecto GARCH ya que el estadístico ML (así como el de Razón de Verosimilitud y el de Wald) para un GARCH(p,q) es el mismo que para un ARCH(p+q), La identificación del orden mediante la f.a.c. y la f.a.p. de las observaciones de la serie al cuadrado ( en el modelo univariante) o de los resíduos MCO al cuadrado ( en el modelo de regresión) tiene el í nconveniente que los errores estándar así como los estadísticos Box-Ljung y Box-Pierce se ven afectados ante la presencia de efectos ARCH, por lo que es aconsejable la utilización previa de una corrección y una normalización apropiadas (como, por ejemplo, en Diebold, 1988). Además, la f.c.c. entre los cuadrados de los valores observados y estimados, así como la estimación de los coeficientes de asimetría y curtosis pueden dar lugar a la identificación errónea de efectos no lineales si los atípicos de la serie original no han sido intervenidos con anterioridad. ^1^1 ;^(') ` ^ i` :+ f Finaimente, un último comentario referente a la propia estimación por Máxima Verosimiiitud. Como es sabido [véase, por ejempio, Hi11 (1986)], el contraste de un determinado parárnetro de interés, H, está siempre condicionado a la hipótesis de partida que genera el modelo. Si, por el contrario, consideramos conjuntamente el parámetro y la hipótesis, la evidencia sobre ^ dependerá, en este caso, de la elección de dicha hipótesis en relación a otras hipótesis, pudiéndose dar la paradoja de que la evidencia sobre 8 sea contradictoria en experimentos diferentes, incluso cuando éstos conducen a 1a misma densidad marginai a posteriori para 8. Un ejemplo puede servir para clarificar esta situación. Supongamos que H^ y H2 son dos hipótesis cualesquiera mutuamente exclusivas y exhaustivas que representan modelos alternativos. Consideremos dos experimentos E^ y E2 tales que si se Ileva a cabo E; entonces observamos el valor de la variable aleatoria X;, i= 1,2. Sean p;(x; H), i= 1,2, dos densidades diferentes para las observaciones, que dependen sólo del parámetro 8. Cuando ^ se conoce entonces la probabilidad o distribución muestral de las observaciones está completamente especificada. Si se observa x^ en E^, entonces la verosimilitud de H es: L(E^; E^, x^) = P{X^ = xi, E^ ^ 8} =P{X^=xi f E^,6}xP{E^^6} ^ P{X^ = x^, Hi ^ E^, ^} + P{X^ = x^, H2 ^ E^, 8} = P{X1 = x^ ^ H^, E^, 8} x P{H^ ^ E^, 6} + P{X^ = x^ ^ H^, E^, 8} x P{H2 ^ E^, 9} donde la constante de proporcionalidad es P{E^ (^}. Similarmente si se observa x^ en E2, L(e; E2, x2) a P{X2 = x^ ^ E2, H}, donde la constante de proporcionalidad es P{E^ ( 8}. Como las funciones de verosimilitud se rlefinen salvo una constante, se suele entender que la inferencia marginal sobre H deber ser la misma en ambos experimentos si éstos son no informativos ( misma densidad a priori) y las versomilitudes son proporcionales entre sí. Además, si éste fuese el caso, las densidades marginales a posteriori de 9 serían las mismas y cualquier decisión sobre ei valor de 6 sería igualmente válida tanto si se observa x^ en E^ como si es x2 en E2. Sin embargo, como hemos dicho anteriormente, ello no tiene por qué ser necesariamente cierto si incluimos proposiciones conjuntas sobre el parámetro y el modelo ( u otros parámetros implicados por H;). ^ ;^,n,^F^ r^T^k^^^^>^^ ^,I Considérense los siguientes supuestos que consiguen que ambas verosimilitudes sean proporcionales entre sí. S.1 Si se realiza E^, entances la densidad de X, es p^(x,;8} si H, es verdadera y p2{x^;H) si H2 es verdadera. Si se realiza E2, entonces la densidad de X2 es p2(x2;8) si H^ es verdadera y p^(xz;8) si H2 es verdadera. S.2 P{H1 ^ E;,9} = p,0 < p< 1, una constante conocida que no depende ni del valor de 6 ni del experimento que se realice. Es decir, p es la probabilidad no condicional de H^ y(1-p) será, por tanto, la probabilidad no condicional de H2. S.3 La elección del experimento no es informativa; es decir, P{E; i a} no depende 6. S.4 Existe un valor x^ de X^ para el cual p^(x^;8) = 0 b' 8 y p2(x^;^) > 0^! 6. Existe un valor x2 de X2 para el cual p^(x2;9) = 0`d 9 y p2(x2;9) > 0`d 8. Es decir, x^ es imposible en E^ bajo H ^ y x2 es imposible en E2 bajo H2. Introduciendo los supuestos anteriares en las funciones de verosimilitud, se obtiene L(B^E^, x^) °^ P^ {x^i 8) P+ P2 (x^^ e) (1- P) = P2 (x^^ 8) {1-- P) L(e, E2, x2) °^ PZ tx2, e) P+ P^ (x2^ e) t 1-- P) = P2 íx2^ ^) P que son proporcionales entre sí. Consecuentemente (E^,x^) implica que H2 es verdadera, ya que x1 tiene probabilidad 0 si al realizarse E^ es verdadera H^ y, del mismo modo (E2,x2) implica que H^ es verdadera, ya que x2 tiene probabilidad 0 si al realizarse E^ es verdadera H2. Es decir, dependiendo del experimento que se Ileve a cabo y por estar asociado 6 a H;, decidiremos de forma diferente sobre 8 incluso cuando las distribuciones marginales a posteriari de e sean las mismas en ambos experimentos. En definitiva, se trata de un campo relativamente nuevo desde un punto de vista estadístico que necesita de la continuidad de aportaciones como las que tan brillantemente han sabido reflejar los profesores Novales y Gracia-Díez a los que no nos queda sino felicitar de nuevo. REFERENCIAS BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroscedasticity». Journal of Econometrics, vol. 31, 307-327. Box, G. E. P. y T^AO, G. C. (1975). «Intervention Analysis with Applications to Economic and Environmental Problems», JASA, vol. 70 (349), 70-79. CHANG, I. (1982). «Outliers in Time Series». Ph. D. Thesis, University of Wisconsin, Madison. CHANG, I. y T^AO, G.C. (1983). «Estimation of Time Series Parameters in the Presence of 4utliers», Techical Report, n.° 8, University of Chicago, 1-28. CHANG, I., T^AO, G.C. y CHENG, C. (1988). «Estimatian of Time Series Parameters in the Presence of Outliers», Technometrics, vol. 30 (2), 193-204. DIEBOLD, F. (1988). «Empirical Modeling of Exchange Rate Dynamics», SpringerVerlag, Berlín. HANSEN, L. P. (1982). «Large Sample Properties of Generalized Method of Moments Estimators», Econometrica, vol. 50, 1029-1054. HILL, B. M. (1986). «On the Validity of the Likelihood Principle», W. P. University of Michigan, 1-6. HoYo, J. del (1991). «Generación de modelos bilineales a partir de esquemas con parámetros carnbiantes», U. A. M. Doc. interno, Dpto. Análisis Económico, 1-15 WNITE, H. (1980). «A Heteroscedasticity-Consistent Covariance Matrix Estimator and a Direct Test Heteroscedasticity», Econometrica, vol. 48, 721-746. WOLFF, C. C. P. (1987). «Time-Varying Parameters and the Out-of-Sample Forecasting Perfomance of Structural Exchange Models», Journal of Business and Economic Statistics, vol. 5 (1). ^;",^f ^^^^ i.^^?^r , `^^i J. IGNAClO PEÑA Departamento de Economía Universidad Carlos III de Madrid En los últimos años, se ha producido una gran cantidad de investigación sobre el problema de la modelización del riesgo de los activos finane<cieros. Hay ya varias revisiones de esta literatura, entre las que destacaríamos las de Pagan y Schwert (1990), Nijman y Palrn (1991), Engle {1991), Granger (1991) y Bollerslev, Chou y Kroner (1992). EI interesante artículo de Novales y Gracia-Díez {1993} viene a sumarse a esta importante área de estudio, contribuyendo a la misma con un detallado análisis de 1as expresiones analíticas de las derivadas de la función de verosimilitud ernpleada en la estimación de esta clase de modelos. Mi comentario se va a centrar en una perspectiva general sobre la utilidad e importancia de esta clase de modelos. Conviene recordar cuál era el enfoque tradicional para la modelización de la volatilidad de ias rentabilidades de un activo financiero. La conocida observación de Mandelbrot (1963) de que cambios (de precios) grandes en mercados financieros solían ser seguidos de cambios grandes (de cualquier signo) y lo mismo con cambios pequeños, señalaba la existencia de esa tendencia a la agrupación de la volatilidad de los mercados y por tanto su variabilidad en el tiempo (heteroscedasticidad). Los participantes en los mercados, reconociendo que la volatilidad pod ía variar en el tiempo, han usado durante mucho tiempo medidas del tipo 6t = ^ ^ ^? ; p i =- 1 (1] para reflejar ese riesgo dependiente del tiempo, que denominaremos como at , y donde ct podían ser los errores de predicción de algún modelo ajustado a los datos o bien directamente ios rendimientos del activo. Los agentes elegían p en función de sus impresiones sobre la velocidad de cambio de la volatifidad pero, en general, daban el mismo peso a la información más reciente y a la más antigua. Una extensión de este enfoque se expone en French et al. (1987) que sugieren estimar la volatilidad mensual si se dispone de datos diarios de la siguiente forma Nt Nt-1 6mt-^^^t i+^^t^t+1 (2] donde Nt es el número efectivo de días de mercado al mes, 6^-,t es la varianza del mes m y los Ft son las rentabilidades diarias del mes m. Nótese la presencia a^ i. .^' Í ^^7 • k ' ^ ',1 ^ '^+ ^!,^' ^ del término de productos cruzados que trala de corregir ia posible presencia de contratación asíncrona o efecto Fisher, cuyas consecuencias sobre las series financieras se exponen por ejemplo en Peña (1992a). Los modelos anteriores y otros similares que podrían derivarse, presentan el inconveniente de su carácter «ad hoc», al no tener en cuenta las características estadísticas específicas de cada serie. Para tratar de solucionar esta situación Engle (1982) propone los modelos ARCH (AutoRegressive Conditional Heteroskedasticy) que generalizan los modelos [1 ] y[2], permitiendo que el orden de retardo p, el peso relativo de cada observación y una volatilidad de base se incorporen ai modelo y se elijan usando los datos en vez de fijarse a priori. Ello da lugar al modelo ARCH(P) de la forma P [3] ^t -^x0+^•ai^t i donde los parámetros ao, a; y p se estiman usando procedimientos maximoverosímiles. Si incluimos también una forrnulación general para la media condicional, una representación general para una serie de rendimientos puede ser Yt ^ It-1 ^ D(µt, 6?) [4^ donde It_^ es el conjunto de información relevante y D es una función de densidad condicional adecuada ( Normal, Student T, Mixturas, etc.). Las generalizaciones del esquema ARCH inicial no se han hecho esperar y entre ellas destacaríamos los modelos GARCH(p,q) de Bollerslev ( 1986), de la forma: P q at ` a0 + ^ ai ^t - i +` ^ ^j 6t j i^1 j-1 [5) Tanta los modelos ARCH como los GARCH imponen una serie de restricciones en los parámetros para garantizar que la varianza sea siempre positiva, que son del tipo oco, a;, Rj > 0. Para garantizar la estabilidad del modelo, una condición adicional es q P ^ ^i + ^ aj ^ 1 i-^ ^ [6] i-=1 Sin embargo, en la práctica no es infrecuente que los parámetros estimados se encuentre en zonas próximas a la no estacionariedad, dando lugar a los modelos GARCH integrados (IGARCH), véase Engle y Bollerslev (1986), lo cual implica que las innovaciones de este proceso tienen influencia permanente, de modo E, 1 similar a lo que ocurre con los modelos ARIMA, EI desarrollo de contrastes de raíces unitarias para la varianza está aún en sus comienzos, aunque ya hay resultados, Lumsdaine (1990), que sugieren que transformaciones simples de los procedirnientos clásicos de contraste (Dickey-Fu11er, etc.) pueden ser de utiiidad. Una limitación de los modelos ARCH y GARCH es que presentan restricciones en los parámetros y además la varianza depende sólo de la magnitud de las ^^^ pero no de su signo. Trabajos anteriores, Black (1976), Christie (1982), sugieren que los rendimientos de las acciones están negativamente correlacionados con los carnbios en su volatilidad. Es decir, la volatilidad tiende a subir si los rendimíentos son menores de lo esperado y a bajar si los rendimientos son mayores de lo esperado, probablemente debido a la presencia de efectos de apalancamiento que ocasionen que el riesgo previsto varíe diferentemente según el signo de la innovación. Para tratar de superar estos inconvenientes, Nelson (1991) propone el modelo GARCH Exponencíal o EGARCH, donde la varianza es una función asimétrica de las innovaciones; 4 P In a? = ap +^[ij In csc j+^ ock (8 y^t-k+ ( I 4ft-k I- 2n0.5)) j =1 [7] k =. 1 donde 4^t = Et ^t [8] Esta formulación tiene la ventaja de garantizar siempre que la varianza es positiva, no impone restricciones en los parámetros y permite efectos asimétricos y no líneales de las innovaciones sobre la varianza de la serie (líneales sobre el logaritmo}. Un desarrollo adicional que puede incorporarse a cualquiera de los modelos anteriores es el ARCH-M de Engle, Lilien y Robins (1987). La idea está basada en el modelo de Merton (1980) que postula una relación entre los rendimientos esperados de una cartera y su varianza condicional, de la forma: µc I It-^ = G tói ^^) [9] donde b puede interpretarse como el coeficiente de aversión relativa al riesgo de un agente representativo y por tanto el rendimiento en exceso de un activo 0 cartera, siguiendo la formulacióri [9] puede interpretarse como una prima de riesgo variable en el tiempo. Es decir, si un activo se hace más arriesgado, los inversores exigirán un mayor rendimiento. EI modelo general para la media y!a varianza condicional bajo este supuesto, podría formularse como: ^F^ ^^t^)+F2(c^^, ^ó)+t`t [10j donde F^ puede ser cualquiera de las formulaciones líneales o no líneales propuestas recientemente en la literatura como las discutidas en Tong (1990) o Granger y Terasvista t 1992) [véase Peña (1992b) para una revisión crítica de las mismas] y Fz suele ser una función lineal o logarítmica, con la varianza condicionai especificada de modo adecuado. En los últimos años se han propuesto nuevas extensiones y modificaciones del m^odelo GARCH básico, entre las que cabría citar el ARCH Semiparamétrico (SPARCH^ de Engle y González (1991), el ARCH No Líneal (NARCH) de Engle y Ng (1991), el ARCH estructural (STARCH) de Harvey, Ruiz y Sentana (1992) y varios o#ros, cuyas potenciaiidades están todavía por explorar. De cualquier forrna, parece claro que todos estos trabajos apuntan a ia necesidad y el interés de modelizar adecuadamente la evolución temporal de la volatilidad de las variables financieras, superando los planteamientos simplistas como los de la ecuación (1) ya mencionados. REFERENCIAS BLACK, F. (1976). «Studies in Stock Price Volatility Changes». Proccedings of the 1976 Business Meetíng of the 8usiness and Economic Statistics Sectíon, American Statistical Association, 177-181. BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroskedasticity» . Journal of Econometrics, 31, 307-327 . BOLLERSLEV, T., CHOU, R. Y., KRONER, K. F. (1992). «ARCH Modeling in Finance». Journal of Econometrics, 52, 5-59. CHRISTIE, A. { 1982). «The Stochastic Behavior of Common Stock Variances» . Journal of Financial Economics, 10, 407-432. ENGLE, R. (1982). «Autoregressive Conditional Heteroskedasticity with estimates of the Variance of U.K. Inflation». Econometrica, 50, 987-1008. ENGLE, R. (1991). «Statistical Models for Financial Volatility». Working Paper. Department of Economics. University of California San Diego. ENGLE, R., BOLLERSLEV, T. (1986). «Modelling the Persistence of Conditional Variances». Econometric Reviews, 5, 1-50, 81-87. ^^_ ^ ..^ ^^ E ha f ^, ^t f ( ^^^ ^'; ENG^E, R., Li^iEN, D. M. y R©BBiNS, R. P. (1987). «Estimating Time Varying Risk Premia in the Term structure: The ARCH-M model». Econometrica, 55, 391407. ENG^E, R., NG., V. (1991). «Measuring and testing the Impact of News on Volatility». Working Paper. Department of Economics. UCSD. ENG^E, R. y Gon,zQ^EZ-R^vERA, G. (1991). «Semiparametric ARCH Models» . Journal of Business and Economic Statistics, 9, 345-360. FRENCH, K. R., SCHWERT, G. W. y STAMBAUGH, R. !F. (1987). «EXpeCted StOCk retUrnS and Volatility». Journal of Financial Economics, 19, 3-29. GRANGER, C. W. J. y TERASV^sTA, T. (1992). «Modelling Dynamic Nonlinear Relationships». Oxford University Press. GRANGER, C. W. J. (1991). «Forecasting Stock Market Prices: Lessons for Forecasters». Working Paper. Department of Economics. University of California San Diego. HARVEY, A., Ruiz, E. y SENTANA, E. (1992). «Unobserved Component Time Series Models with ARCH Disturbances». Journal of Econometrics, 52, 62-74. LUMSDAINE, R. L. (1990). «Asymptotic Praperties of the Maximum Likelihood Estimator in GARCH (1,1) and IGARCH (1,1) models». Working Paper. Department of Economics. Harvard University. MANDELBROT, B. (1963). «The Variation of Certain Speculative Prices». Journal of Business, 36, 394-419. MERTON, R. C. (1980). «On Estimating the Expected Return on the Market». Journal of Financial Economics, 8, 323-361. NELSON, D. (1991). «Conditional Heteroskedasticity in Asset Returns: a New Approach» . Econometrica, 59, 347-370. NIJMAN, T. C. y PALM, F. (1991). «Recent Developments in Modeling Volatility in Financial Data». Working Paper. Center for Economic Research. Tilburg University. PAGAN, A. y SCHWERT, G. W. (1990). «Alternative Models for Conditional Stock Volatility». Journal of Econometrics, 45, 267-290. PEÑA, J. I. (1992a). «Contratación asíncrona, Riesgo Sistemática y Contrastes de Eficiencia». Cuadernas Económicos de ICE, 50, 81-89. PEÑA, J. I. (1992b). «Nuevos Modelos Estadísticos para el Análisis de Mercados Financieros». DT 92-11. Universidad Carlos III de Madrid. ToNG, H. (1990}. «Non-linear Time series». Oxford University Press. f.,.)`i C :^.'^, ^ `-i^..1^,.^ ! Í;, , /^^ t .;^i^^i^l^^^ TEODOSIU PEREZ AMARAL Departamento de Economía Cuantitativa Facultad de Económicas Univers^dad Complutense de Madrid 1. INTRODUCCION E1 artículo de los profesores Novales y Gracia presenta de forma unificada y sistematizada un conjunto de resultados que serán de gran utilidad a los investigadores que utilicen estos métodos de estimación. EI detallado y cuidadoso desarrollo de las expresiones de los diferentes elementos de la estimación es lo que ha rnotivado el desarrollo de los nuevos contrastes que se presentan a continuación. En el epígrafe 2 agrupo un conjunto de comentarios puntuales que pretenden ayudar a clarificar la intuición de este tipo de métodos de estimación, y en el 3 presentó una aplicación de los contrastes de ia matriz de información dinámica al caso de modelos estimados por ARCH; se presentan nuevos contrastes de autocorrelación de orden arbitrario. 2. COMENTARIC^S GENERALES Habría que mencionar que la normalidad condicional no es una característica esenciaf de los modelos ARCH, y que se utilizan también otras distribuciones, como la t, que permiten un mayor peso en las colas. Véase al respecto Spanos (1991). En la sección 2 se apunta la distinción entre heteroscedasticidad estática y el «caso especial de heteroscedasticidad» que se presenta en este trabajo. A la heteroscedasticidad tipo ARCH se le Ilama heteroscedasticidad dinámica por algunos autores. En la sección 4.2 se presentan contrastes de estructura ARCH. Antes de proceder a contrastar formalmente la posible existencia de estructura ARCH, es necesario recordar que es posible que conjuntos de observaciones atípicas o no linealidades omitidas de la formulación pueden Ilevarnos a concluir, erróneamente, que tenemos una estructura de tipo ARCH. Para evitar ese peligro, resulta imprescindible graficar los residuos del modelo de regresión e intentar detectar si hay o no atípicos. Aparte de ello, sólo si hay un motivo teórico que lo justifique se pasaría a la estimación de un modelo ARCH o GARCH. AI final de la sección 4.2, la hipótesis nula Ho: b2 = 0, también podría contrastarse con el contraste de Wald, que requeriría la estimación bajo la hipótesis í^) P^^ ^ ^J Í A F^ I()`7 alternativa, y entonces el estadístico t del coeficiente b2 sería el contraste de Wald apropiado. Cabría mencionar asimismo, que los modelos tipo ARCH y GARCH son la generalización al caso de las varianzas condicionales de los modelos ARIMA. Esto se aprecia de forma clara en la fórmula 25. En el apartado (iii) de la sección 7, cabe señalar que la estimación por separado de los parámetros de la regresión y de los del modelo de la varianza condicional de las perturbaciones es eficiente sólo asintóticamente y que en muestras finitas se mejora la eficiencia estimando conjuntamente, por ejemplo iterativamente. 3. DIAGNOSTICOS DE LA MATRIZ DE INFORMACION DINAMICA PARA iVIODELOS ARCH Los diagnósticos de la matriz de información dinámica son contrastes generales propuestos por White (1987) y desarrollados para el caso de regresión lineal por Pérez Amaral (1993), y son especialrnente útiles como diagnósticos de modelos estimados por máxima verosirnilitud. EI fundamento de los mismos es que sólo bajo especificación correcta las formas del hessiano y el producto exterior de la matriz de información son equivalentes (igualdad de la matriz de información). La incorrelación del gradiente con sus propios retardos resulta ser una condición esencialmente necesaria para la igualdad de la matriz de información, y son la base de los contrastes de la matriz de información dinárnica (MID); White (1987). En el caso de regresión lineal, diagnósticos basados en la correlación del gradiente dan lugar a contrastes de autocorrelación residual de todos los órdenes, autocorrelación con parárnetros variables, ARCH-M, ARCH-M no simétrico, ARCH y ARCH no simétrico; Pérez Amaral (1993). En el caso de modelos estimados por ARCH, la disponibilidad del gradiente, así como la relativa escasez de contrastes de especificación hacen particularmente atractivo el uso de este enfoque. Contrastes MID para el modelo ARCH de regresión Utilizaremos el modelo ( 14) del artículo que comentamos, cuya función de verosimilitud viene dada por {6) y la parte del gradiente correspondiente a^i viene dada por ( 15), siendo ^^I^/^^3 el gradiente. Bajo especificación correcta, E(^^It/^^i ^It_^/^^^3') = 0, j= 1, ... [I] '^ i t s ,. bh ^ ^; E ^., Para comprobar si se cumplen las condiciones anteriores, podemos utilizar los análogos muestrales de las mismas, eligiendo los elementos no redundantes de (I). Los diagnósticos se computarían como una regresión MCO en la que la variable dependiente es la unidad y los regresores son los elementos de [I] que se hayan elegido y el gradíente, evaluados en un estimador asintóticamente eficiente (por ejemplo el de máxima verosimilitud). 1 sobre vec' (^^It/^a ^It_^/^^i'), ^It/^^R [II] EI estadístico de contraste sería el número de observaciones por el coeficiente de determinación sin ajustar por el uso de una constante (TR2), que se comportaría bajo la hipótesis nula de especificación correcta como una x2 con un número de grados de líbertad igual al número de indicadores que se estén contrastando en la regresión [II]. Nótese que en la regresión anterior se ha utilizado la diagonalidad por bioques de la matriz de información. En general, resulta conveniente seleccionar un subconjunto de indicadores para obtener contrastes direccionales, con mayor potencia que la de contrastes generales. Un caso particular del contraste [II] sería el contraste de autocorrelación residual, que presentamos a continuación. En el caso de que uno de los regresores fuera una constante (p.e.: x^t = 1, t= 1,...), el gradiente con respecto a ese regresor sería un caso particular de [15]. ^It/^^3^ = Et/hi ^hil^^3 [Et /ht --1 ] y los retrasos correspondientes serían: 71t ^/óR^ = ^t ^/h# ^ c^ht j/a[i [^t ^/ht j - 1 ] con lo que un contraste de correlación de orden arbitrario se podría computar con la regresión MC4 de n n n 1 sobre altiaR, a!t ;^aR,, aIt/aR [^] y el estadístico de contraste sería TR2 de la regresián anterior, que bajo especificación correcta sería una x2 con un grado de libertad. Este contraste sería la generalizacíán del contraste de autocorrelación residual al caso ARCH. Si se quisieran contrastar conjuntamente varios retardos, habría que incluirlos en la regresión (V) y ajustar el número de grados de libertad del contraste. Los contrastes que se proponen son fáciles de computar y de interpretar y pueden ser de utilidad para e1 investigador aplicado. Los contrastes de autocorrelación pueden ser útiles en situaciones comunes en la práctica. Anteriormente ^,r:^:)I`J^FNTr^F^IC;``, Diebold (1986) había propuesto un contraste de autocorrelación de orden 1, siguiendo otro enfoque diferente. Hay que resaltar que se puede usar la misma estrategia de contrastación para modelos estimados por GARCH y por ARCH-IV1, uti^izando en [II] todo el gradiente cuando no se dé la diagonalidad por bloques. REFERENCIAS ADICIONALES D^EBO^o, F. X. (1986). «Testing for serial correlation in the presence of ARCH ». Proceedings of the American Statistical Association, Business and Economics Section, 323-328. P^REZ AnnARA^, T. (1993). «Contrastes m y de la matriz de inforrnación dinámica con una aplicación a regresión lineal». Próxima publicación en Estadística Española. SPArvos, A. (^ 991). « A parametric approach to dynamic heteroskedasticity: the Student's t and related models», presentado en los European Meetings de la Econometric Society, Cambridge. WH^-rE, H. (1987). «Specification testing in dynamic models», en T. Bewley (editor). Advances in Econometrics, Fifth World Congress, vol . 1, New York, Cambridge University Press. . ? „^,I ^^^.:...^ r ;l. (", ^ r,.,(^.^,r{n ESTHER RUIZ Departamento de Estadist^ca y Econometría Universídad Carlos III de Madr^d 1. INTROD^JCCION EI artículo de A. Novales y M. Gracia-Díez es una contribución a la literatura sobre modelos ARCH que puede ser muy útil para los usuarios de dichos modelos en el sentido de clarificar cuáles son las expresiones analíticas a utilizar para su estimación por rnáxima verosimilitud. Sin embargo, y a pesar de que los modelos ARCH y GARCH son los más ampliamente utilizados para modelizar series temporales heteroscedásticas, las más recientes investigaciones en este área parecen indicar que existen otros modelos alternativos más adecuados para la modelización de la volatilidad de series financieras. En esta nota primero vamos a describir brevemente las propiedades y limitaciones de los modelos GARCH y después analizaremos algunos de los modelos alternativos que se han propuesto en la literatura: los modelos GARCH exponenciales (EGARCH) y los modelos de volatilidad estocástica (SV). 2. MODELOS GARCH EI modelo GARCH fue propuesto independientemente por Bollerslev (1986) y Taylor ( 1986) como una aproximación parsimoniosa a los modelos ARCH introducidos por Engle ( 1982). EI modelo GARCH que empíricamente ha demostrado ser el más apropiado para modelizar !a volatilidad de numerosas series financieras es el modelo GARCH ( 1,1) que se define como Yc = ^t 6t [1l 6t = c^ + a yt ^+^3 6t ^ [2] donde ^t -- N ID (0,1 }, 6t es la volatilidad e yt es la serie a modelizar que habitualmente es el rendimiento de la serie financiera que se esté considerando. Es importante señalar que en (2), a^t modeliza la varianza de yt condicional en la historia pasada de la serie hasta el momento t-1. Por lo tanto, los modelos GARCH son condicionalmente Gaussianos y pueden ser estimados por Máxima Verosimilitud (MV), como se describe en el artículo de A, Novales y M. GraciaDíez. Las restricciones sobre los parámetros necesarias para garantizar la positividad de la varianza son c^ > 0, a? 0 y^i ? 0. Además, la condición de estaciona- (,{. ^'y M E^ ^^11 A Fl I ^^) <..^ riedad en sentido amplio de yt es que a+[3 < 1. Finaimente, la condición para la existencia del momento de cuarto orden de yt es que 3a^ +^3^ + 2a^3 < 1. Estas restricciones tienen como consecuencia que los modelos GARCH tengan limitaciones importantes que condicionan su utilización empírica. En concreto, Nelson ( 1991) señala las siguientes limitaciones: i) Las condiciones sobre los parámetros del modelo necesarias para garantizar la positividad de la varianza condicianal son a menudo violadas por las estimaciones con series reales. ii) La definición de persistencia en un modelo GARCH es confusa en el sentido de que dependiendo de cuál sea la norma respecto a la cual se mide tal persistencia, se puede Ilegar a conclusiones contradictorias. Por ejemplo, en el caso de un proceso GARCH integrado (IGARCH), i.e. a+ R= 1, el proceso es estrictamente estacionario pero no es estacionario en covarianza. iii) Los rnodelos GARCH no son capaces de modelizar la respuesta asirnétrica de la volatilidad ante cambios positivos y negativos de los precios de los activos financieros. Además de las limitacianes señaladas por Nelson, en aplícaciones empíricas se han estimado modelos GARCH que, aunque cumplan la estacionariedad, violan la condición de existencia de! momento de cuarto orden de yt. Finalmente hemos de señalar que la generalización de los modelos GARCH al caso multivariante, aunque no presenta grandes dificultades teóricas, tiene limitaciones prácticas debido a que es necesario imponer restricciones para la positividad de la matriz de covarianzas y al gran número de parámetros que es necesario estimar. Bollerslev et al. (1992) y Bera y H iggins (1993) realizan una revisión detallada de todos los modelos basados en ARCH y desarrollan todos los puntos tratados brevemente en esta sección. 3. MODELOS EGARCH Para rnodelizar la volatilidad, Nelson (1991) propuso el modelo EGARCH que no tiene algunas de las limitaciones señaladas en el apartado anterior para ios modelos GARCH. EI modelo EGARCH (1,1) viene dado por (1) con a? definida como log at = c^ +[3 l09 6i ^+ 7 Yt-^/^t_^ + a[I Yt-^^at-^ ^-- (2/^t)'^2] [3l Nótese que dada la definición de la volatilidad en [3], c^t es observable con la información disponible en el momento t-1. En consecuencia, los modelos /'^^^) F^ ^` t C,[;,ic,i„ ^ : t..,t;l'^r:^'1( ; EGARCH comparten con los modeios GARCN la propiedad de ser condicionalmente Gaussianos y, por lo tanto, su estimac^ón no presenta grandes dificultades teóricas, aunque suelen encontrarse problemas de convergencia de los algoritrnos de maximización de la verosimilitud. AI modelizar el logaritmo de la volatilidad, no es necesario imponer restriccia nes sobre los parárnetros para garantizar la positividad de la varianza condicional. Los modelos EGARCH son además capaces de representar el comp^ortamiento asimétrico de la volatilidad observado a menudo en series financieras. Finalmente, Nelson (1991) deriva las condiciones de estacionariedad de yt, que no presentan las confusiones dei modelo GARCH. Frente a estas propiedades atractivas, los modelos EGARCH tienen el inconveniente de que es complicado derivar las propiedades estadísticas de yt; ver el apéndice de Nelson (1991). En aplicaci^^ones empiricas, los modelos EGARCH están proporcionando, en general, mejores ajustes de la volatilidad que los modelos GARCH; ver, por ejemplo, Pagan y Schwert (1990) y Engle y Ng (1991) para aplicaciones con rendimientos de activos financieros. Esta superioridad de los mode^os EGARCH sobre los GARCH parece satisfacerse incluso cuando se modelizan series financferas que no presentan comportamientos asimétricos; ver Taylor (1991) para una aplicación a tipos de cambio. Higgins y Bera (1992), analizando tipos de cambio semanales, también señalan qu^e los datos parecen favorecer la modelización logarítmica de la varianza. En consecuencia, aunque la evidencia empírica acumulada hasta el momento es muy escasa, las comparaciones entre los ajustes proporcionados por modelos EGARCI^ y por modelos GARCH parecen señalar que ajustar un modelo lineal al logaritmo de la varianza en lugar de a la varianza misma proporciona mejores estimaciones de volatilidad. Los modelos EGARCH tienen una limitación importante en cuanto a su aplicación a series financieras multivariantes que es incluso más complicada que en el caso de los modelos GARCH. 4. MODELOS DE VOLATILIDAD ESTOCASTICA Tanto los modelos GARCH como los modelos E^ARCH modelizan la volatilidad, 6t, como la desviación típica de los errores de predicción un período hacia delante. Sin ernbargo, la volatilidad puede ser considerada como una variable inobservable. Los modelos de volatilidad estocástica (SV) modelizan el logaritmo de la v©latilidad como un proceso estocástico lineal, normalmente un proceso autorregresivo; para una detallada revisión de los modelos SV ver Taylor (1991). ^,c )ME ^`^t:^k1i,:^i^ ^! En el modelo SV estacionario más sencillo, el logaritrno de la volatilidad se modeliza como un proceso AR (1). Por lo tanto, el proceso SV-AR ( 1) viene dado por (1) con cst definida como log cs? = y+^ l09 6i ,+ r^t [4] donde r^i - NID (0, 6ñ) y(^ ^< 1. Los modelos SV son aproximaciones en tiempo discreto de I©s modelos en tiempo continuo habitualmente utilizados en la literatura financiera en, por ejemplo, los modelos de valoración de opciones; ver Taylor ( 1991). Esta caracteristica también la tienen los modelos EGARCH, pero Dassios ( 1992) señala que la aproximación de 1os modelos SV es mejor que la de los modelos EGARCH. Además, los modelos SV, al modelizar explícitamente la volatilidad como un componente inobservable, permiten que noticias inesperadas en el período t puedan afectar a la volatilidad a través de rlt. Las principales ventajas de los rnodelos SV sobre los modelos GARCH y EGARCH son: i) su generalización at caso multivariante es mucho más sencilla; ver Harvey et al. (1992). ii) Las propiedades de yt se pueden obtener fácilmente, ya que se pueden utilizar los resultados clásicas en el análisis de series temporales. Por ejemplo, las restricciones necesarias para asegurar que yt es un proceso estacionario, tanto en sentido amplio como en sentido estricto, son las restricciones estándar para garantizar la estacionariedad de log 6t . Además, el momento de cuarto orden de yt existe siempre si log c^t es un proceso estacionario. Sin embargo, los modelos SV no son condicionalmente Gaussianos, por lo que su estimación no es, ^en principio, tan sencilla como en los modelos GARCH y EGARCH. Habitualmente la estimación de modelos SV se ha realizado mediante variantes del Método Generalizado de Momentos (GMM). Nelson (1988) y Harvey et al. (1992) propusieron independientemente un método de Quasi Máxima Verosimilitud (QML) cuyas propiedades han sido analizadas por Ruiz (1992). Ruiz compara dichas propiedades con las del método GMM, concluyendo que, para los casos de interés cuando se analizan series financieras, el método QML es más eficiente que el rnétodo GMM. Los modelos SV han sido escasarnente analizados hasta el momento, por lo que presentan el incanveniente de que muchas de las extensiones de los modelos basados en ARCH (como, por ejemplo, ARCH-M}, todavía no han sido suficientemente investigadas para los modelos SV. Sin embargo, se está realizando extensiva investigación en este sentido. ^'^? 5. ^ ,'.,i. CONCLUSIONES EI artículo de Novales y Gracia-Díez presenta un tema interesante y de mucha utilidad para aquellos analistas de series temporales financieras que modelicen la volatilidad mediante modelos GARCH. Sin embargo, las más recientes investigaciones en el análisis de series financieras parecen indicar que los modelos que modelizan el logaritmo de la volatilidad proporcionan mejores ajustes que aquellos que modelizan directamente la volatilidad, como es el caso de los modelos GARCH. Entre los modelos que especifican una forma funcional para el logaritmo de la volatilidad, podemos destacar los modelos GARCH exponenciales (EGARCH) y los modelOS de volatilidad estocástica (SV). Estos últimos modelos están siendo actualrnente objeto de intensiva investigación y los resultados obtenidos hasta el momento parecen indicar que ésta puede ser una línea de investigación sobre la modelización de la volatilidad fructífera en el futuro. REFERENCIAS BERA, A. K. y HIGGINS, M. L. (1993). «A Survey of ARCH Models: Properties, Estirnation and testing», próxima publicación en Journal of Econamic Surveys. BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroskedasticity» . Journal of Econometrics, 31, 307-327. BOLLERSLEV, T., CHOU, R. Y. y KRONER, K. F. (1992). «ARCH Modeling in Finance», Journal of Econometrics, 52, 5-59. DAss^os, A. (1992). «Asymptotic Approximations to Stochastic Variance Models», manuscrito sin publicar, Departamento de Estadística, London School of Economics, Londres. ENGLE, R. (1982). «Autoregressive Conditional Heteroskedasticity with Estimates of the U.K. Inflation», Econometrica, 50, 987-1008. ENGLE, R. F. y NG., V. K. (1991). «IVleasuring and testing the Impact of News on Volatility», manuscrito sin publicar. HARVEY, A. C., Ruiz, E. y SHEPHARD, N. G. (1992). «Multivariate Stochastic Variance Models». Financial Markets Group Discussion Paper, London School of Econom ics, Lond res. HIGGINS, M. L. y BERA, A. K. (1992). «A Class of Nonlinear ARCH Models», International Economic Review, 33, 137-158. ^ )^.^Ef^ f AR^t.)^; %.i NELSON, D. B. (1988). «The Time Series Behaviour of Stockk Market Volatility and Returns», Tesis Doctoral, Massachusetts Institute of Technology. NELSON, D. B. (1981). «Conditional Heteroskedasticity in Asset Returns: A New Approach», Econometrica, Vol. 59, n.° 2, 347-370. PAGAN, A. R. y SCHWERT, G. W. (1990). «Alternative Models for Conditional Stock Volatility», Journa! of Econometrics, 45, 267-290. Ru^z, E. (1992). «Quasi-Maximum Likelihood Estimation of Stochastic Variance Models», Econometrics Discussion Paper Series, London School of Ecanomics, Londres. TAYLOR, S. J. (1986). «Modelling Financial Time Series», John Wiley, Chichester, Reino Unido. TAYLOR, S. J. (1991). «Modelling Stochastic Volatility», manuscrito sin publicar, Universidad de Lancaster, Departamento de Contabilidad y Finanzas. i^ ^ ';^^i)f`,CI' A E. tF'^1r^^'! ^^{. ENRiQUE SENTANA Centro de Estud^os Monetar^os y F^nanc^eros Este interesante trabajo de Aifanso Novales y Mercedes Gracia-Díez hace honor a su nombre, y, a mi entender, no pretende ser un panorama exhaustivo de la plétora de investigaciones teóricas y aplicadas sobre modelos ARCH. EI lector interesado en una lista exhaustiva de referencias puede consultar también Bera y Higgins (1992), Bollerslev, Chou y Kroner (1992) y Nijman y Palm (1991). De hecho, a este ritmo, icasi se podría escribir una panorámica de panorámicas sobre los modelos ARCH! En base a estas consideraciones, mi intención es simplemente señalar cinco aspectos de las modelos ARCH que considero relativamente infrainvestigados y a los que he prestado interés recientemente. a) NO NEGATIVIDAD DE LOS COEFICIENTES Y CONTRASTES DE UNA COLA Para que un modelo ARCH sea realrnente el proceso generador de las observaciones, es necesario que las varianzas condicionadas asociadas sean no negativas. Dada la forma funcional, ello, evidentemente, impone restricciones sobre los coeficientes. Por ejemplo, en un ARCH (q) en el que el soporte de !a distribución condicional es infinito, los parámetros a^ (j=1,...,q) han de ser no negativos [cf. ecuación (3)]. Sin embargo, en el caso de un GARCH ( p,q), las restricciones de positividad son más complicadas. Ta! y como Drost y Nijman (1992) y Nelson y Cao ( 1992) han señalado, lo más adecuado es imponer dichas restricciones sobre los coeficientes de la forma ARCH (^) implícita en el GARCH ( p,q). Expandiendo dichos coeficientes en términos de los parámetros originales, estos autores demuestran que las condiciones impuestas por Bollerslev (1986) [cf. ecuación ( 28)] san excesivamente restrictivas. Por ejemplo, en un proceso GARCH ( 1,2), bastaría con que aco > 0, a^,[3^ >_ 0 y[3^a^ + a2 >_ 0, de modo que a2 puede ser negativo. Nótese, sin embargo, que para el modelo más comúnmente estimado, el GARCH ( 1,1), las restricciones habituales siguen siendo válidas. Para el caso de los ARCH (q) la existencia de condiciones de no negatividad sobre los coeficientes no fue aprovechada por Engle en su contraste de los multiplicadores de Lagrange (cf. sección 4.2), ya que dicho contraste es de dos colas. Este hecho es importante porque la potencia puede incrementarse sustancialmente si se tiene en cuenta la naturaleza unilateral de la hipótesis alternativa. Demos y Sentana (1991) y Lee y King (1991) han sugerido recientemente versiones de una cola para este contraste. Para el caso de alternativas ARCH (1), ^;^ ^MFr^T^aF^^.r,^, ambos contrastes coinciden, siendo equivalentes al t-ratio asociado con la primera autocorrelación de x?, pero con un valor crítico de una cola. b) FORMA FUNCIONAL Y ASIMETRIAS EN VOLATILIDAD Aunque sin duda la forma funcional originalmente propuesta por Engle (1982), y generalizada por Bollerslev (1986) es la más común en la literatura aplicada, la modelización de la varianza condicional en términos de residuos pasados al cuadrado presenta ciertas limitaciones. Por ejempla, no permite capturar el efecto asimétrico dinámico ampliamente documentando para series financieras, y generalmente conocido como «leverage effect», en el que la volatilidad aumenta rrás tras una perturbación negativa que tras una positiva de igual magnitud. Para suplir esta deficiencia, otras formas funcionales más generales han sido propuestas. Una de las más populares es el Ilamado GARCH exponencial (EGARCH) de Nelson (1991), que rnodeliza el logaritmo de la varianza condicional, y permite el efecto diferenciado de shocks positivos y negativos al incluir tanto el valor absoluto de los retardos como su nivel. No obstante, el EGARCH es un modelo de heteroscedasticidad multiplicativa que no anida el ARCH de Engle. Posteriormente se han propuesto alternativas anidadas que permiten efectos asimétricos. La más simple es el Ilamado QARCH (o ARCH cuadrático) que completa el polinomio cuadrático mediante términos lineales y productos cruzados de retardos. EI caso más simple es el QARCH {1 } en el que 6t = 6+ a^ xt ^+ y^^ xt_^ [véase Engle (1990) y Sentana (1991)]. AI no abandonarse la forma funcional cuadrática, es sencillo hallar condiciones sobre los coeficientes que garantizan la positividad d e 6t . c) DEPENDENCIA TEMPORAL Y DISTRIBUCION INCONDICIONAL Los modelos ARCH y GARCH implican autocorrelación para los cuadrados de las observaciones. En particular, los modelos GARCH implican especificaciones ARMA [cf. ecuación (29)]. Dos características de esta dependencia temporal merecen ser recalcadas. En primer lugar, la magnitud de la varianza incondicional de la varianza condicional. Como dicha varianza está directamente relacionada con el cuarto momento incondicional de x, en vista de la expresión en la pág. 29 del texto es fácil comprobar para un GARCH ( 1,1) que la varianza condicional cambiaría sustancialmente en el tiempo si a es grande y^3 pequeña, mientras que con R grande y a pequeña se obtendría un proceso muy suave. En segundo lugar, también es interesante analizar la persistencia del proceso de varianzas condicionales. En este sentido, quisiera señalar que aunque la suma de los coeficientes ARCH y GARCH es la medida de persistencia generalmente j^ i F LA L), ^,1^ ^ r A k^^^, ^^^ ^^^, ^i empleada, no es necesariamente la mejor, puesto que únicamente nos proporciona la tasa a la que decae el efecto de los shocks. A mi juicio, es mejor considerar el proceso ARMA asociado con los cuadrados y utilizar medidas tradicionales de persistencía, tales como el retardo med^o. Así, para el caso de un GARCH (1,1), obtendríamos a(1-^i)-' [1-(a+^3^]^^, que depende no sólo de (a+^i), sino también de a y^i separadamente. No obstante, es de destacar que cuando se estiman modelos GARCH para series temporales financieras es bastante común observar que la suma de los parámetros es muy próxima a la unidad, en especial si la frecuencia de observación es alta. Esta regufaridad empírica 11evó a Engle y Bollerslev a proponer los modefos GARCH integrados, o IGARCH. Aunque dichos procesos se asemejen a los procesos ARIMA, existen algunas diferencias significativas. En primer lugar, Nelson (1990) demostró que en cualquier proceso GARCH (y en particular IGARCH) con constante igual a cero es implausible porque su varianza condicionai, y por tanto él mismo, converge a cero con rapidez. Por tanto, los IGARCH empíricamente relevantes son aquellos que contienen deriva. Otro rasgo distintivo es que pese a tener varianza infinita, los procesos IGARCH con deriva son estrictamente estacionarios [véase Nelson (1990) y Bougerol y Picard (1992)]. Por último, también se cumple que los estimadores pseudo-máximo verosímiles de los parámetros del modelo tienen una distribución asintoticamente normal incluso cuando existen raíces unidad en la varianza [Lumsdaine (1991)). Otra cuestión distinta, pero sin duda relevante, es si el proceso IGARCH es plausible desde un punto de vista económico. Nótese que la integración implica que cuaiquier shock en la volatilidad de un activo es permanente y no existe reversión a la media, y que nuestras previsiones sobre la volatilidad futura siguen una tendencia lineal debido a la deriva, aunque ésta es generalmente pequeña. Estos hechos pudieran parecer contraintuitivos, aunque es necesario recordar que los modelos con distribuciones incondicionales estables que se usan para series financieras generan varianzas incondicionales infinitas. En este sentido, el modela 1GARCH presenta una ventaja notable sobre las distribuciones estables desde el punto de vista de la teoría financiera, pues permite un análisis mediavaríanza condicional incluso cuando ello na es posible incondicionalmente [véase King, Sentana y Wadhwani (1990)]. Existen al menos dos explicaciones sobre la aparente existencia de integración en varianza. En primer lugar, puede deberse a la alta frecuencia de las observaciones [Nelson (1992)]. La intuición es aquí la misma que para procesos autorregresivos en media. A medida que un proceso estacionario generado en tiempo continuo mediante una ecuación diferencial estocástica de primer orden es muestreado a mayores y mayores frecuencias, los parámetros autorregresivos del AR (1) en tiempo discreto que aparentemente siguen las observaciones tienden a la unidad [véase p.ej. Priestley (1981)]. Evidencia a favor de esta explicación C;i ;^^1E N TARP( a`^ Tl es el hecho de que las series financieras muestreadas a frecuencias bajas tienden hacia la homoscedasticidad condicional, lo cual no debería abservarse si realmente contuvieran una raíZ unidad. La segunda explicación, que también ha sido tomada prestada de la literatura sobre media condicional, es que la aparente integración en varianza puede ser el resultado de cambios estructurales [véase Lamoureux y Lastrapes {1990)J. AI mismo tiempo, es cierto que los procesos GARCH presentan agruparnientos de volatilidad, lo que puede dar la impresión de que existe cambio estructural en la varianza sin que lo haya. Del mismo modo que ocurre en la media, ambas explicaciones pueden ser dificiles de distinguir. d} APLICACIONES FINANCIERAS EI éxito de los modelos ARCH se debe en gran medida a su adecuación tanto desde el punto de vista teórico como empírico a las aplicaciones financieras. No obstante, es de destacar que múltiples cuestiones financieras como la valoración de activos, la selección de cartera o la evaluación de la gestión de fondos de inversión no pueden ser analizadas satisfactoriamente desde un punto de vista univariante síno que requieren un enfoque multivariante. Por ejemplo, el momento condicional de interés desde un punto de vista de teoría financieras a!o CAPM es la covarianza con e! mercado. Estrictamente, pues, los modelos univariantes ARCH-M sólo se adecuarian al estudio de la prima de riesgo agregada. EI mayor problema de los modelos rnultivariantes es su dimensionalidad. Con N series, hay N varianzas y N(N-1)/2 covarianzas condicionales que modelizar. Incluso para valores de N moderadamente pequeño, el problema es insoslayable sin restricciones. Ello explica que las aplicaciones univariantes de modelos ARCH sean las más extendidas. Sin embargo, empiezan a aparecer parametrízaciones multivariantes parsimoniosas que son computacionalmente factibles. Dada la larga tradición del uso de modelos de índices o factores en finanzas, no es quizá sorprendente que uno de los enfoques más populares sea los rnodelos factoriales condicionalmente heterocedásticos [véase por ejemplo, Dieáold y Nerlove (1989), Engle, Ng y Rothschild (1990), y King, Sentana y Wadhawani (1990)]. Dichos modelos se basan en que la hipótesis bastante plausible de que una parte importante de la volatilidad de diversos activos financieros es común. e) MODELOS ARCH COMO MEDIDAS DE VOLATILIDAD La varianza condicional estimada a partir de un rnodelo ARCH univariante nos da una medida de la volatilidad del activo financiero de que se trate. Es importante destacar que no es ciertamente la única que se ha sugerido, ni necesariamente /`'^ C^^r Í ^^.'w.}í':':a ; Il_ ^^ C"^ h::r,^{^^^1 ll la mejor. Para poder discutir este tema en profundidad, sin embargo, es necesario definir qué es volatilidad. A mi juicio, la definición más precisa es la Que se encuentra en un reciente trabajo de Andersen (1992), quien identifica volatilidad con la varianza condicional de un activo. EI problema es condicional en qué. Desde el punto de vista financiero, es natural suponer que el conjunto de información relevante es el que disponen los participantes en los mercados. En cambio, el estudioso sólo cuenta con un subconjunto muy limitado de dicha información, tanto porque la frecuencia de observación de sus datos es sustancialmente menor que el cuasi-continuo que observan los agentes, como por considerar sirnultáneamente un número de variables pequeño, normalmente sólo la serie en cuestión. Ello implica que aunque conociéramos los parámetros que caracterizan la varianza condicional a nuestro conjunto de información, ésta seguiría siendo una estimación de la volatilidad subyacente. En parte relacionado con lo anterior, está el hecho de que a diferencia de los modelos ARIMA, los modefos ARCH entendidos como especificaciones de la distribución condicional de una serie temporal, no constituyen una clase cerrada a su agregación temporal o contemporánea. Es decir, que si por ejemplo los datos de rentabilidades del mercado de divisas se generan minuto a minuto para todas las divisas simultáneamente can una distribución condicional multivariante ARCH, la distribución condicional de los datos de la peseta-dólar diarios no será la de un proceso univariante ARCH. Este problema se puede resolver reinterpretando los modelos ARCH como ARMA para los cuadrados de las diversas series, en cuyo caso sí que están cerrados respecto a la agregación ternporal y contemporánea [véase Drost y Nijman (1992) y Nijman y Sentana (1993)]. Las propiedades de los estimadores pseudo-máximo verosímiles en tal caso aún no son bien conocidas. BIBLIOGRAFIA ADICIONAL ANDERSEN, T. G. (1992). «Volatility». Kellog Graduate School of Management Working Paper 144, Northwestern University. BERA, A. K. y H^GG^NS, M. L. (1992). «A Survey of ARCH Models: Properties, Estimation and Testing», manuscrito, University of Illinois at Urbana-Champaign. BOLLERSLEV, T., CHOU, R. Y. y KRONER, K. F. (1992). «ARCH Modeling in Finance: A Review of the Theory and Empirical Evidence», Journal of Econametrics, 52, 5-59. B^UGEROL, P. y PICARD, N. (1992). «Stationarity of GARCH processes and of some nonnegative time series», Journal of Econometrics, 52, 115-127. r.^_^nnE^ r^^ 1^F,^zi^^^-^ 79 DEMOS A. y SENTANA, E. (1991). «Testing for GARCN effects: A one-sided approach», manuscrito, London School of Economics. DIEBOLD, F. X. y NERLovE, M. (1989). «The dynamics of exchange rate volatility: A multivariate latent factor ARCH model», Journal of Applied Economectrres, 4, 1-21. DROST, F. C. y NIJMAN, Th. E. (1990). «Temporal Aggregation of GARCH Processes», de próxima aparición en Econometrica. ENGLE, R. F. (1990). «Discussion: Stock market volatility and the crash of 87», Review of Financial Studies, 3, 103-106. ENGLE, R. F. , NG, V. y ROTHSCHILD., M. (1990). «Asset pricing with a Factor-ARCH covariance structure: Empirical estimates for treasury bills», Journal of Econometrics, 45, 213-237. «Volality and links between national stock markerts», NBER Working Paper 3357. Í'C{NG, M. A., SENTANA, E. y WADH1l'VANI, S. B. (1990) . LAMOUREUX, G. C, y LASTRAPES, W. D. (1990). «Persistence in variance, structural change and the GARCH model», Journal of Business and Economic Statistics, 8, 225-234. LEE, J. H. y K^NG, M. L. (1991). «A locally most mean powerful based score test for ARCH and GARCH regression disturbances», Monash University Department of Economics Working Paper 9/91. LUMSDAINE, R. L. (1991). «Asymptotic Properties of the quasi-rnaximum likelihood estimator in GARCH (1,1) and IGARCH (1,1) models», rnanuscrito, Princenton University. NELSON, D. B. (1990). «Stationarity and Persistence in the GARCH { 1,1) Model», Econometric Theory, 6, 318-334. NELSON, D. B. (1991). «Conditional heteroskedasticity in asset returns: A new approach», Econometrica, 59, 347-370. NELSON, D. B. (1992). «Filtering and forecastíng with misspecified ARCH models: Getting the right variance with the wrong model», Journal of Econometrics, 52, 61-90. NELSON, D. B. y CAO, C. Q. (1992). «Inequality constraints in the univariate GARCH model», Journal af Business and Economic Statistics, 10, 229-235. NIJMAN, Th. E. y PALM, F. C. (1991). «Recent Developrnents in Modeling Volatility in Financial Data», Center Discussion Paper 9168, Tilburg University. N^^MAN, Th. E. y SErvTANA, E. (1993). «Marginalization and contemporaneous aggregation in multivariate GARCH processes» , Center Discussion Paper 9312, Tilburg University. PR^EST^EY, M. B. (1981). «Spectral Analysis and Time Series» Academic Press, Londres. SENTANA, E. (1991). «Quadratic ARCH Models: A potential re-interpretation of ARCH Models», LSE FMG Discussion Paper 122. i) ^^,^ E_ ^^^J 1 r, k ^^:_^ ^.^^ ^Í F. JAVIER TRIVEZ Departamento de Análisis Econámico Facuitad de Ciencias Económicas Universidad de Zaragoza Los modelos econométricos que consideran conjuntamente la modelización de las medias y las varianzas condicionales constituyen actualmente uno de los temas de investigación más fructíferos en el análisis de series temporales económicas. Por ello, resulta muy oportuna la elección por parte de la revista Estadística Española del artículo invitado «Guía para 1a estimación de modelos ARCH ». Mis felicítaciones, por tanto, a la dirección de la revista, y mi agradecimiento por su invitación a participar en la discusión de tan importante tema. Los profesores Alfonso Novales y A/lercedes Gracia-Díez presentan una revisión de los modelos de heteroscedasticidad condicional autorregresiva, prestando especial atención a su estimación de máxima verosimilitud (MV). Su principal contribución consiste en deducir las expresiones analíticas del vector gradiente y de la matriz hessiana con el fin de facilitar la programación del algoritrno de «scoring» para la estimación MV de los parámetros de distintos modelos con estructura de heteroscedasticidad condicional. En este sentido, se efectúa una revisión de diferentes modelizaciones de la presencia de heteroscedasticidad condicional, comenzando por la formulación ARCH enunciada en el traba^ o pionero de Engle {1982), y continuando con la generalización de dicho modelo el modelo GARCH propuesto por Bollerslev (1986), así como con el denominado modelo ARCH en media o modelo ARCH-M de Engle, Lilien y Robins (1987). EI trabajo está expuesto con la claridad y el rigor que caracteriza a los autores, y supone una estupenda introducción al estudio de los modelos tipo ARCH. Mi comentario se va a centrar en posibles extensiones del traba ^ o, teniendo en cuenta que recientemente se ha producido una extensa literatura sobre modelos ARCH, una buena revisión de la misma puede verse en Bollerslev, Chou y Kroner (1992), que ha incidido fundamentalmente en dos cuestiones: la formulación de nuevas modelizaciones de la varianza condicional y el desarrollo de rnétodos de estimación alternativos al de máxima verosimilitud. SOBRE NUEVAS MODELIZACIONES DE LA VARIANZA CONDICIONAL Dentro de la amplia literatura referida a nuevas modelizaciones de la varianza condicional, cabe destacar dos enfoques no considerados en el articulo de Novales y Gracia-Díez, y para los que sería interesante derivar {as expresiones pertinentes que facilitaran la programación del método de estimación máximo verosímil; por un lado, el modelo GARCH exponencial, y, por otro, la aproximación multivariante. a) EI modelo EGARCH Una limitación importante del modelo GARCH escrito en (28) viene dada por el hecho de que, como consecuencia de las restricciones que se imponen en los parámetros, la estructura GARCH sólo permite modelizar relaciones de magnitud y no de signo (positivo o negativo) entre la varianza (ht ) y^,t. En ocasiones, sin embargo, resulta conveniente contrastar relaciones de signo y no sólo de magnitud. Por ejemplo, para analizar si tal y como señala Black (1976) existen correlaciones negativas entre los rendimientos presentes de las acciones y la volatilidad futura. Con el fin de superar esta limitación, Nelson (1991) ha propuesto el modelo GARCH exponencial o modelo EGARCH, en el que la varianza condicional se define como q P In hx = bo +^ ó^ [$^ zc-^ + Y(IZc-^I - E IZc-^I ) +^ E^; I n h i; ^ ^ [1J donde: Zt = ^t/ht En (1) no se necesita ningún tipo de restricción paramétrica para evitar varianzas negativas. Por tanto, a partir de [1 ] si se cumple que b;^; ^ 0, podemos concluir que la varianza tiende a aumentar (disminuir) cuando ^t_; es negativa (positiva), pudiendo contrastar, en consecuencia, relaciones de signo entre la varianza y las innovaciones. b) ARCH multivariante E! artículo de Novales y Gracia-Díez se centra en modelos univariantes. En ocasiones, sin embargo, puede ser conveniente plantear modelos multivariantes. Denotando ahora mediante ^,t un vector N x 1 de innovaciones, podemos escribir: ^t = Zt H t^^^ [2] donde zt es un vector de N variables aleatorias que se distribuyen idéntica e independientemente con vector de esperanzas nulo y matriz de varianzas y covarianzas igual a la matriz identidad; y siendo Ht una matriz variable en el tiempo definida positiva, cuadrada de orden N. ^:^ a r^^ ^ r^^ t ^^F^ i^^ ;^ ^-; A partir de (2), suponiendo normalidad, se obtiene: ^'t I S^t-^ ^ N(G, Ht) C3] Todas las parametrizaciones univariantes consideradas en el art+culo de Novales y Gracia-Díez pueden plantearse en un contexto multivariante. Por ejemplo, el modelo GARCH (p,q) multivariante vendría definido por [3] y: 4 p vech (Ht) = c + ^ A; vech (Et_; ^'t_;) + ^ B; vech (Ht_;) ^ __. ^ ^ -_ ^ [^l donde vech (.) denota un vector columna formado por los efementos de la diagonal principal y los inferiores a ella, de la matriz simétrica Ht, c es un vector de orden 1/2 N(N+1) x 1 y A;, i= 1, .. ., q y B;, i= 1, ..., p son matrices cuadradas de orden 1/2 N(N+1). Un probíema asociado con la expresión [4] es que el número de parámetros a estimar si no se impone ningún tipo de restricción es muy elevado. Entre las soluciones adoptadas, cabe citar el considerar las matrices A; y B; como diagonales. Esta solución es la que adoptan Bollerslev, Engle y Wooldridge ( 1988), quienes consideran además un modelo GARCH-M multivariante, definiendo en conjunción con [3] y [4): Yt=a+^9(Ht)+^t donde yt es un vector de variables aleatorias de orden N x 1 y a es un vector columna de N constantes. Además suponen: g(Ht) = Ht c^_^, siendo c^_^ un vector de ponderaciones. Para estimar este modelo aplican el algoritmo de Berndt, Hall, Hall y Hausman (1974) a la maximización de la función lograrítmica de verosirnilitud, que vendrá dada por: donde: It =- T In(2^) - ^ In IHt(^)I ^ ^^t (^)' Hi 1(^) ^c (H) 2 2 2 estando definido el vector de parámetros 6 como: 8' _ [a', ^3', c', vec (A^ )', . . . , vec (Aq)', vec ( B ^ )', . . . , vec ( B p)'] y siendo ^t = yt - a- ^iHt c^__^ . ,^i (, r,°, 4 f, ^. ^ SOBRE METODOS DE ESTIMACI^N Los madelos tipo ARCH han sido estimados habitualmente mediante el procedimiento de máxirna verosimilitud, dada la simplicidad relativa del mismo, así como las buenas propiedades que dichos estimadores cumplen bajo condiciones ^deales. Así, cuando la hipótesis de normalidad condicional en correcta, resulta evidente que los mejores estimadores son los MV ya que, bajo ciertas condiciones de regularidad, son asintóticamente eficientes. Como señalan, sin embargo, Engle y González-Rivera (1991) y Bollerslev y Wooldridge (1992), el supuesto de normalidad condicional puede ser muy restrictivo. En concreto, en las series financieras, que configuran la base ínformativa más frecuentemente utilizada en las aplicaciones de los modelos tipo ARCH, existe suficiente evidencia para rechazar el supuesto de normalidad condicional. Véanse, por ejemplo, Ios trabajos de Singleton y Wingender (1986), French, Schwert y Stambaugh (1987) y Badrinath y Chatterjee (1988). Por este motivo, en diversos trabajos se ha estudiado la robustez de los estimadores MV. Bollerslev y Wooldridge (1992) aplican el procedimiento cuasimáximo verosímil (CMV) con el fin de examinar el comportamiento de estos estimadores en una clase general de modelos dinámicos, cuando se maximiza el logaritmo de la función de verosimilitud normal, pero se incumple el supuesto de normalidad, obteníendo que en este caso, y siempre que se dé una especificación correcta de los dos primeros momentos, los estimadores MV aplicados a modelos GARCH son cvnsistentes aunque la verdadera función de densidad no sea la normal. Engle y González-Rivera (1991) cuantifican la pérdida de eficiencia que conlieva la estimación MV cuando se supone erróneamente la normalidad. Para ello, definen la eficiencia relativa de la estimación CMV de un parámetro 6 como el cociente entre la varianza asintótica de este estimador cuando se conoce la hipótesis de normalidad y cuando se supone equivocadamente, esto es: Var ( ^ MV) ERf^ = Var ^ ( [5] CMV) Considerando dos posibles distribuciones alternativas, la gamma y la t de Student, obtienen una cuantificación del ratio (5), concluyendo que aunque la pérdida de eficiencia al estimar bajo el supuesto de normalidad siendo la verdadera distribución la t de Student no es muy elevada, cuando la verdadera distribución es la gamma la pérdida de eficiencia puede Ilegar a ser muy importante (en concreto, Ilegan a obtener valores del ratio iguales a 0,21). Esta es la razón por la que Engle y González-Rivera (1991) proponen un método de estimación semiparamétrico desarrollado por Tapia y Thompson ^"^"E ^+ T!"^^?^' )`^ (1978), que según demuestran mediante un estudio de Monte-Carlo, mejora la eficiencia de los estimadores CMV. Mark (1988) encuentra que el método de momentos generalizados (GMM) de Hansen (1982) es robusto, si bien, como señalan, estos estimadores tienen la desventaja de no ser, en general, asintóticamente eficientes. Este método de estimación ha sido aplicado también, entre otros, por Bodurtha y Mark (1991), quienes apuntan como desventaja del GMM el que disminuye las posibilidades de mala especificación, debido a que al aplicar este método no es necesario el parametrizar y estimar muchas características de los modelos que tan sólo tienen un interés incidental. Otras estrategias de estimación utilizadas en la literatura, véase Pagan y Schwert (1991), han sido los no paramétricos, tales como los métodos Kernel y de la Forma de Fourier Flexible. Todos estos trabajos, si bien no deben conducir a un rechazo del método de estimación MV, sí ponen de manifiesto la necesidad de seguir estudiando la problemática de la estimación de los modelos tipo ARCH. En esta línea, un estudio comparativo de las propiedades y del comportamiento en muestras pequeñas de los diferentes métodos de estimación propuestos en la literatura sería de gran utilidad. REFERENCIAS BIBLIOGRAFICAS BADRINATH, S. G. y CHATTERJEE, S. (1988). «On Measuring Skewness and Elongation in Common Stock Return Distributions: The Case of the Market Index», Journal of Business, 61, 451-472. . «Estimation and Inference in Nonlinear Structural Models», Annals of Economic and Social Measurement, 4, 653-665. BERNDT, E. K., HALL, B. H., HALL, R. E. y HAUSMAN, J. A. (1974) BLACK, F. (1976). «Studies of Stock Price Volatility Changes». En Proceedings of the Business and Economic Statistics Section American Statistical Association, 177-181. BODURTHA, J. M. y MARK, N. C. (1991). «Testing the CAPM with Time Varying Risks and Returns», Journal of Finance, 46, 1485-1505. BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroskedasticity», Journal of Econometrics, 31, 307-327. BOLLERSLEV, T., CHOU, R. Y. y KRONER, K. F. (1992). «ARCH Modeling in Finance. A Review of the Theory and Empirical Evidence», Journa/ of Econometrics, 52, 5- 59 . ^i f.:> ^ '_ ^ ^ ^•, ^ c , ^r BOLLERSLEV, T., ENGLE, R. F. y W^OLDRIDGE, J. M. (1988). aA Cap'rtal Asset pricing Modei with Time Varying Covariances», Journal of Pofitical Economy, 96, 11fi-131. BOLLERSLEV, T. y WOOLDRIDGE, J. M. (1992). «C^uasi Maximum Likelihood Estimation and Inference in Dynamic Models with Time Varying Covariances», Econometric Reviews, 11, 143-172. ENGLE, R. F. (1982). «Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K. Inflation», Econometrica, 50, 987-1007. ENGLE, R. F. y GONZÁLEZ-RIVERA, G. (1991). «Semiparametric ARCH Models», Journal of Business and Economic Statistics, 9, 345-359. ENGLE, R. F., L^L^EN, D. M. y RoB^NS, R. P. (1987). «Estimating Time Varying Risk Premia in the Term Structure: The ARCH-M Model», Econometrica, 55, 391407. FRENCH, K. R., SCHWERT, G. W. y STAMBAUGH, R. F. (1987). «Expected Stock Returns and Volatility», Journal of Financial Economícs, 19, 3-29. HANSEN, L. P. (1982). «Large Sample Properties of Generalized Method of Moments Estimators», Econometrica, 50, 1029-1054. MARCK, N. (1988). «Time Varying Betas and Risk Premia in the Pricing of Forward Foreign Exchange Contracts», Journal of Financial Economics, 22, 335-354. NELSON, D. B. (1991). «Conditional Heteroskedasticity in Asset Returns: A New Approach», Econometrica, 59, 347-370. PAGAN, A. R. y SCHWERT, G. W. (1990). «Alternative Models for Conditional Stock Volatility», Journal of Econametrics, 45, 267-290. SINGLETON, J. C. y WINGENDER, J. (1986). «Skewness Persistence in Common Stock Returns», Journal of Financial and Quantitative Analysis, 21, 335-341. TAP^A, R. A. y THOMPSON, J. R. (1978). «Nonparametric Probability density Estimation», Baltimore: Johns Hopkins University Press. ESTADISTICA ESPAÑOLA Vol. 35, Núm. 132, 1993, págs. 87 a 89 CO NTESTACION ALFO^ NSO NOVALES MERCEDES GRACIA-DIEz No podemos sino comenzar agradeciendo a Estadística Española la invitación que en su día nos hizo a publicar este artículo acompañado de comentarios. En ellos, los diversos autores ponen de manifiesto el interés que existe actualmente por la rnodelización de esquemas de varianza carnbiante en el tiempo, concentrándose en las líneas específicas de extensión de los modelos ARCH-GARCH que consideran de mayor interés. Nuestro interés al escribir el artículo fue, como su nombre indica, el poner a disposición del lector una breve síntesis intraductoria a la modelización ARCH, así como profundizar en cuestiones descriptivas concernientes a la programación de los algoritmos numéricos para su estimación por máxima verosimilitud. Los comentarios presentados por los distintos autores invitados por Estadística Española son, por tanto, un complemento muy adecuado, así como conveniente, para quien quiera tener una visión rnás completa de este tipo de modelizaciones. Los profesores E. Ruiz, I. Peña y E. Sentana se concentran en el interés que suponen las diversas generalizaciones a los modelos ARCH que actualmente se están proponiendo en la literatura especializada. Entre los muchos citados, las representaciones GARCH exponencial (EGARCH) y ARCH cuadrática (QARCH), así como la representación de volatilidad estocástica en que E. Ruiz se halla actualmente trabajando, parecen especialmente interesantes. E. Sentana también expone otras consideraciones importantes basadas en investigaciones más recientes. Las condiciones menos restrictivas sobre la no negatividad de coeficientes en los modelos GARCH, las diferencias entre los procesos IGARCH y los modelos ARIMA, la necesidad en muchos casos de Ilevar a cabo una modelización multivariante y las consideraciones realizadas por este autor sobre la relación entre varianza condicional y volatilidad, son aspectos que deben tenerse en cuenta a la hora de utilizar este tipo de modelos. fif^ ^^ ^,'.'•[;^i^.. ^,, f Los profesores J. Trívez y T. Pérez Amaral prestan especial atención en sus comentarios a las consecuencías de posibles errores de especificación en modelos ARCH. J. Trívez se centra en la posible pérdida de eficiencia (y quizá cansistencia) ante un incorrecto supuesto de Normalidad, aspecto sin duda merecedor de un mayor anáiisis. Nuestras expresiones se basan en el supuesto inicial de Normalidad, pero podrían extenderse sin ninguna dificultad a otro tipo de distribuciones. T. Pérez enfatiza la importancia de ilevar a cabo los contrastes de especificación adecuados para poder justificar plenamente los resuftados de la estimación máximo-verosímil de este tipo de modelos. Tanto la propia existencia de estructura ARCH, como los aspectos distribucionales y la correcta especificación del vector de variables explicativas, pueden y deben ser objeto de contraste. Los profesores J. del Hoyo y A. Martín Arroyo por un lado, y A. García Ferrer y A. de Juan por otro, proponen una reflexión metodológica sobre un aspecto que consideramos crucial y que ha recibido alguna atención en la literatura, si bien no tada la que por su importancia merece. A. García Ferrer y A. de Juan sugieren la consideración de que las estructuras ARCH no sean, en algunos casos, sino mero reflejo de otras características del rnodelo. En algunos casos, la existencia de un alto número de valores atípicos de magnitud importante, puede conducir a!a creencia de que existe una estructura ARCH; en otros casos, como ya se ha mostrado en la literatura, variables como el volumen de negociación, no incorporadas al modelo, pueden sugerir la existencia de estructuras ARCH que desaparecen si las variables mencionadas se explicitan. EI tema de los posibles valores atípicos sugiere la necesidad de examinar rigurosamente los residuos de una estimación inicial con varianza constante, antes de proceder a una especificación ARCH-GARCH. Estos modelos se basan en conceptualizaciones en que la varianza de una serie varía temporalmente, pero con cierta suavidad, y no para aquellos casos en que los cambíos en la varianza se deben únicamente a valores extremos aislados. Especial interés tiene la propuesta de !os profesores J. del Hoyo y A. Martín, que sugieren que la modelización de una varianza cambiante en el tiempo no es sino una manifestación más de los cambios estructurales asociados a toda relación entre variables económicas. Las estructuras económicas no son inmutables, sino todo lo contrario; sus variaciones son, seguramente, muy suaves, pero debe considerarse seriamente la ganancia en eficiencia ( en sentido genérico) que supondría la rnodelización correcta de tal aspecto. Como manifiestan estos autores, existe equivalencia analítica entre modelos ARCH y modelos de coeficientes cambiantes lo que, nuevamente, aporta más ambigi^edad a este tema. Su propuesta de utilizar el filtro de Kalman para la estimación de modelos ARCH-GARCH merece ser objeto de detallado estudio. ,^^1i r, r,•,Fr,, ^,-, ^it^ Nuestro agradecimiento a todos estos autores, tanto por acceder a completar nuestro trabajo, como por habernos proporcionado a nosotros mismos una panarámica más global de ia clase de modelos aqui analiZados. De nuevo, al Consejo de Redacción de Estadística Española, nuestro agradecimiento por el tratamiento dado a nuestro artículo.