Guía para la estimación de modelos ARCH

Anuncio
ESTADISTICA ESPAÑCJLA
Vol. 35, Núm. 132, 1993, págs. 5 a 38
Guía para la estimación de modelos ARCH
ALFONSO NOVALES (*)
MERCEDES GRACIA-DIEZ (*)
Departamento de Econornía Guantitativa
Facultad de Ciencias Económicas
Universidad Complutense
RESUMENJ
Este trabajo presenta una revisión de los modelos de heteroscedasticidad condiciona! autorregresiva, prestando especial atención a su
estimación de máxima verosimilitud. Se consideran las siguientes
formulaciones: e1 proceso univariante ARCH, el modelo ARCH de
regresión, los modelos ARCH generalizados tGARCH) y la especificación ARCH en media (ARCH-M). Para cada uno de ellos, se deducen las expresiones analíticas del vector gradiente y de la matriz
hessiana, lo que constituye su principal aportación, ya que dichas
expresiones no aparecen, por lo general, de forma suficientemente
explícita en la literatura. Además, se resumen las propiedades estadisticas de estos modelos, los contrastes de existencia de heteroscedasticidad condicional y la estrategia de identificación del orden del
proceso.
Palabras clave: heteroscedasticidad condicional, estimación por ^náxima verosimilitud, estrategia de identificación.
Clasificación AMS: 62M 10, 62P20, 90A20.
{*) Queremos agradecer los comentarios recibidos de Juan Ayuso, M.a Luisa de la Torre, Víctor
Gonzalo, Teodosio Pérez-A^maral y dos evaluadores anónirnos. Todos fos errores son nuestros.
E^^-^,r^,^,i^..,r^r^,f^ E ^.,E^^,-,r^^^^^; ^^
^^
1.
INTRODUCCI4N
La c^eciente disponibilidad de datos procedentes de ios mercados financieros,
hace que un número cada vez mayor de investigadores dedique parte de sus
esfuerzos al análisis empírico de las múltiples cuestiones teóricas de interés
relativas a tales mercados. Dentro de esta área de trabajo, fa modeiización tipo
ARCH (heteroscedasticidad condicional autorregresiva) ha sido ampliamente
utilizada, sin duda debido a ios aceptables resultados empíricos que ha venido
proporcionando.
A pesar de la existencia de «software» destinado, más o menos específicamente, a la estimación de este tipo de modelos, puede ser preferible Ilevar a cabo
la programación de la estimación de r^áxima verosimilitud (MV) de la estructura
ARCH por parte del investigador. Ello se debe a que, en algunos casos, las
rutinas de evaluación numérica de las derivadas de primer y segundo orden
incorporadas en los paq^etes estadisticos estándar no son lo suficientemente
precisas para garantizar la convergencia del proceso de estimación.
En nuestra propia experiencia hemos comprobado que, en ocasiones, un
proceso de estimación MV que resultaba no convergente utilizando expresiones
analiticas sólo para las primeras derivadas de la función de verosimilitud, ha
resultado rápidamente convergente al pragramar ia utiiización de expresiones
para las primeras y segundas derivadas. También hemos comprobado que cuando no se utilizan expresiones analíticas para las segundas derivadas, los problemas de convergencia del algorftmo de estimación son más frecuentes en modelos
con pocas variables explicativas. Por el contrario, modelos de regresión con
estructura ARCH y con un cierto número de variables explicativas relevantes han
alcanzado generalmente la convergencia en la estimación MV sin necesidad de
recurrir a segundas derivadas analíticas. Por todas estas razones, el investigador
puede preferir tener total control del código de programación que utiliza en la
estimación del modelo.
Una segunda motivación para este artículo consiste en la ut^lidad de recoger
en un mismo trabajo 1as diversas especificaciones de modelos con heteroscedasticidad c©ndicional, las distribuciones de sus estimadores, contrastes y posible utilización de dichos r^todelas.
EI propósito de este trabajo es, por tanto, proporcionar una introducción a los
rnodelos ARCH desde el punto de vista de la esti^nación de los mismos, prestando especial atención a las expresiones analíticas del vector gradiente y la
rnatriz hessiana necesarias para utilizar un aigoritmo iterativo en ia estimación
MV. Es en este último aspecto donde reside su contribución original, por no
aparecer dichas derivadas de forma suficientemente explícita en los artículos
^habitualmente referidos en esta literatura. En todos los casos, la formulación es
(^UTA F'Af^2A l A E STfMA^;i(=^N [^f= Mf )Df
^ ,c
A ^^2 C ^: N
7
lo suficientemente genérica para perrnitir que cualquier potencial usuario traslade
directamente !as expresiones que aquí se proporcionan a su propia aplicación, de
modo que pueda programar e! algoritmo de estimación MV sin mucho esfuerzo.
La organización del trabajo es la siguiente: en fa Sección ^ se justifica la
modelización de heteroscedasticidad condicional. En la Sección 3 se presenta el
modelo univariante ARCH como generalización de un proceso de ruido blanco.
En la Sección 4 se trata el modelo ARCH de regresión, su estimación MV y
contrastes de estructura ARCH. La Sección 5 se dedica a la especificación,
estimación y contrastes de la estructura ARCH generalizada (GARCH). En la
Sección 6 se desarrolla el procedimiento de estimación del modelo ARCH en
media (ARCH-M). Finalmente, en la Sección 7 se resumen las principales cuestiones metodológicas respecto a la utilización y estimación de estos modelos.
2.
JUSTIFICACION DE LA MODEL1zACION DE HETEROSCEDASTICIDAD
CONDICIONAL
Cuando se considera el modelo univariante AR(1): yt = pyt_^ +^ con ( p ^< 1 y
^t^i.i.d.N(0, 6^), se tiene que la esperanza matemática del proceso estocástico yt
es cero y que su varianza es 6? /(1 - p2). De modo más general, si el modelo
fuese yt = a+ pyt_^ +£t, se tendría que E(yt) = a/(1 -- p) y var(yt) = cs2/(1 - p^), por
lo que la inclusión de un término constante afecta a la esperanza, pero na a la
varíanza del proceso.
Los términos «esperanza» y«varianza» que acabamos de usar son incondicionales, o dicho de otro rnodo, corresponden a la distribución marginal de yt.
Alternatívamente, podemos preguntarnos acerca de la distribución condiciona/ de
y^ dado el conjunto de^ información S2t_^ de que se dispone en el instante t-1, que
suponemos que incluye todo el pasado de la variable yt: S^t_^ _{ Yt_^, yt_2,... }. En
tal caso:
E(Yt I S^t-^ )= Et-^ Yt = a+ pYt-^
mientras que:
var (Yt ^ SZt_^ ) = vart-^ (Yc) = Et-^ (Yt - Et-^Yt )2 = Et-^ ^t =
donde estamos suponiendo que el modelo univariante está carrectamente especificado y, en particular, que yt_^ realmente resume toda la información contenida
en S2t_^ acerca de yt. Es importante observar que, aunque var (yt j S2t_,) < var (yt),
las varianzas condiciona! e incondicional son ambas constantes en el tiempo.
F`^1A[?I`.;il( ;A. ^ 5^'APJ^ )1 F^
Esta distincíón puede generalizarse a todo modelo de regresión: yc = xt'^3 + ut,
con variabies explícativas deterministas y uc ^ i.i.d.N(0, cs^ ). La distribución de yt
condicional en s2t _ ^, donde S2t _ ^={ xt, xc ^,^^^, Yc ,, Yc 2, •••} es, en este caso,
también Normal con Et__^ yt = xt' ^i y vart__ ^(yt) - csú, momentos que coinciden con
los de la distribución marginal de yt. Sin embargo, si ut tiene autocorrelación de
orden uno, por ejemplo ut = put_ ^+ ct con ^ p ^< 1 y^t ^ i.i.d. N(0, 6? }, entonces la distribucíón rnarginal de y^ es:
Yt^N(xt'^3,csu)
con6^-
2
1-p
mientras que la distribución condicional es:
Yt
^
^
z
S^t_^ ^ N [ PYt-^ +( xc - Pxt-^ ) R^ ^^^ j
con menor varianza que la distribución marginal. Obsérvese que ambas varianzas son, nuevamente, constantes a través del tiempo.
Tanto en el modelo AR(1) como en el de regresión, utilizar como fórmula de
previsión la esperanza condicional E(yt ( S^t_^ ) resulta óptimo si se quiere minimizar el error cuadrático medío (ECM) de la previsión resultante. Sin embargo,
no se utiliza la varianza condicional de yt para tratar de mejorar estas previsiones
y ésta puede ser una información relevante.
^En qué sentido puede utilizarse la varianza de la distribucíón condicional para
mejorar la previsión? Si dicha varianza es constante, como es el caso de los
ejemplos anteriores, y el objetivo es obtener la previsión con menor ECM, esta
información no es relevante. Sin embargo, puede haber modelos en los que la
varianza condicional no sea constante, sino que dependa del conjunto de informacidn disponible en cada instante. En este caso, ignorar tal hecho conduciría
a estimadores ineficientes y por ello, con intervalos de confianza para la previsión
más amplios, así como con mayar variabilidad de la propia previsión puntual,
como reflejaria la mayor amplitud del ranga de sus posibles valores para un nivel
de confianza dado. ^
Los textos habituales de Econometria describen los procedimientos para mejorar la eficiencia de las estimaciones en situaciones de heteroscedasticidad
estática, especialmente cuando ésta se hace depender explícitamente de variables de dentro o fuera del modelo. Sin embargo, no es tan habitual encontrar
referencias al caso especial de heteroscedasticidad condicional que acabamos
de apuntar. Este tipo de heteroscedasticidad puede ocurrir en datos de series
temporaies y su detección y tratamiento ha sido el objeto de diversos trabajos
de investigación en los últimos años, a partir del artículo pionero de Engle (1982).
C;l)IA F'ARA L.A ESTIMACI(^N UE MC)DEl_(^S AHCN
9
Supongamos, por ejemplo, que los residuos grandes y pequeños de un modelo
de regresión aparecen agrupados a intervalos; ello sugiere que la varianza del
término de error cambia suavemente en el tiempo, y que podría predecirse a
partir de los residuos previos. De este modo, se especificaría una dependencia
del tipo: ^= f(ct ^, st 2, . ..) donde at denota la varianza de ^ cambiante en el
tiempo, y f es una función continua del vector de residuos pasados elevados al
cuadrado (1).
Existen, además, teorías que requieren la rnodelización y estimación numérica
de variables que representan la volatilidad de yt (generalmente de su componente
no predecible), que puede asocíarse al concepto estadistico de varianza condicional. Así, en Finanzas, las carteras de activos de inversión se escogen a partir
de la media y varianza esperadas de las tasas de rendimiento, de forma que los
cambios en la composición de la cartera deben explicarse por estos factores. En
este contexto, si se especifica un modelo econométrico tradicional para el rendimiento medio esperado, su varianza queda restringida a una constante y no es,
por tanto, consistente con el supuesto teórico de partida.
En consecuencia, necesitamos desarrollar modelos econométricos en que se
permita que la varianza condicional del proceso cambie en el tiempo. Una posible
alternativa son los modelos ARCH, que describímos en las secciones siguientes.
3.
EL MODELO UNIVARIANTE ARCH
Comenzamos por el caso más sencillo, considerando la siguiente generalización de un proceso observable de ruido blanco, que denotamos por Et, cuyos
momentos condicionaies son:
Et-^ cr = 0
Et-^ ^t2 = ht
donde ht es una función contenida en el conjunto de información disponible en
el instante t-1 : ^t-1 ^ 4 Et-1 ^ £c-2, • • • }. En consecuencia:
E^=E Et_^ ^=0
var(^) =E^^=E Et_^ ^2=E ht
(1) Los residuos se incluyen como argumentos de f elevados al cuadrado para hacerios comparables con la varianza a^
E^ `^^T^1.C^ál^-^1I^^,^^ F^,^;F'AN^^d ^^a
1O
Si suponemos, por ejemplo, que:
ht = óo + b^^t ^,
con bo > 0, ^> > 0,
se tiene el modelo ARCH de orden 1, puesto que la varianza condicional depende
de un retardo de Et. En términos de la distribución condicional de Et, suponiendo
además Normalidad, el rnodelo ARCH(1) puede escribirse como:
^t ^ ^^t-^ ^N(^^hi )
[1)
ht =óo+b^ ct ^ , bo> 0, ^^ ?0
[2]
Más generalmente, si se supane que:
hi =So+S^ ^t ^+...+óp^t p óo>O,S;>0
, ^•, p
[3]
las ecuaciones [1] y[3] constituyen el modela ARCH(p).
Nótese que ht ha de ser positiva, puesto que es la varíanza condicional de
Et, por lo que los parámetros b; i= 1,...,p deben ser no negativos. Una estimación
de ó;<o, aun pudiendo ser compatible con hi ? 0 a l0 largo de todo ei intervala
muestral utilizado, debe generar sospechas de mala especificación de la heteroscedasticidad condicional, bien en relación al número de retardos de ct incluidos, o bien a que !a representación de dicha heteroscedasticidad requiera un
modelo más general que el de la ecuación [3].
Por otra parte, tomando esperanzas en [2], se tiene que Eht = óo + b^ Eht ^,
por lo que es obvio que el proceso ARCH(1) debe satisfacer además la condición
I S^ I< 1 para obtener la estacionariedad en varianza del modelo y evitar que
hi sea explosivo. Esta candición, en general se expresa:
Teorema
EI proceso ARCH lineal de orden p definido por las ecuaciones [1 ] y[3] es
estacionario en covarianza si y sólo si las raíces de la ecuación característica de
ht caen fuera del círculo unidad [ver Engle (1982) para su demostración].
Dicha estacionariedad es una condición necesaria para aceptar como especificación correcta el modelo ARCH que se ha estimado.
C^^IJIA F'AF2A LA E^^`^^fIMACIC)N C7E "^1<)C7F^.^^)`^ Af^C:F^^
3.1.
Distribución del modelo ARCH(1)
Bajo el supuesto de que el proceso €t en [1] y[2] sigue una distribución Norrnal,
sus momentos de orden ímpar serán nulos por simetría. En cuanto a los momentos de orden par, la varianza incondicional es:
E^t = E hi = óo + S^ E^t ^
con lo que, bajo el supuesto de estacionariedad, se tiene:
2 -_---So
-_
E Et2 -- ^^.
1 - ^i ^
De esta forma, utilizanda la expresión de 6? en [4J, el proceso ARCH(1) en [2]
también puede escribirse como:
2
2_
2
ht - 6^_ - b^ (^t-^ --
por lo que la varianza condicional del proceso, ht , excede a su varianza incondicional, 6^, en aquellos períodos en que el cuadrado de la observación previa
excede a su varianza. Es decir, sorpresas altas (positivas o negativas) hacen que
la varianza condicional de Et en el período siguiente sea asimismo elevada.
Por otra parte, obsérvese que la predicción de la varianza condicional del
proceso s períodos hacia adelante viene dada, a partir de [2], por:
Ethi+ s=sp(1+b^+ó;+...+^,-^^+ó;^^
con lo que, si el proceso es estacionario, la predicción de la varianza condicional
converge a la varianza incondicional cuando el horizonte de previsión s-^^.
En cuanto al momento de orden 4 respecto al origen, en Engie (1982) se
demuestra que tiene la siguiente expresión:
E ^4 = 3 (var£t ) 2
1 -^^2
1 - 3 á^
Como puede observarse, este momento es igual a 3 veces la varianza de ^t
al cuadrado (como el de una variable Normal dependiente e idénticamente
distribuida) por un factor adicional que excede a la unidad. Ello quiere decir que
las colas de la distribución marginal de ^t tienen más densidad que las de la
distribución Normal. En particular, los momentos de cuarto orden podrian no existir,
lo que ocurrirá si b> >^(1 /3 ). De este modo, puede probarse que al aumentar el valor
de b^, se van teniendo resultados de inexistencia de momentos de orden par.
Todos estos resultados se generalizan a procesos ARCH de orden superior.
12
ESTAC)I ;TI(::A E SPANC)L A
3.2.
EI modelo AR(1) con estructura ARCH
Para una mejor comprensión del tema, examinemos las propiedades de un
proceso univariante AR(1) con estructura ARCH(1). En particular, prestaremos
especial interés a las semejanzas y diferencias que presentan sus momentos con
respecto a un proceso AR(1) habitual. Sea el proceso:
Yt = PYt-^ + Et, ^ p ^< 1
[5]
donde Et es una perturbación aleatoria, tal que:
Et-^ £t = 4 y Et_^ £i = h?
y ht se define como en [2]:
ht =^+ b^ ^2 ^ con b° > 0, b^ ? 0
Respecto a la perturbación ^t, se tiene que E^t = 0 y si ^ b^ ^< 1:
var (ct ) - a^ -
^°---1 - b^
Adem^s, E( ct ^_1 )= 0 por hipótesis del modelo, y lo mismo ocurre para
desfases mayores, por la que €t no presenta autocorrelación. Sin embargo, las
perturbaciones ^t no son independientes en el tiempo, pues sus momentos de
segundo orden están correlacionados.
Respecto al proceso yt, los momentos de su distribución marginal vienen dados
por:
E yt=0
var ( Yt ) -
6^
-
1
S°
1-p2 1--p21-b^
mientras que los momentos de su distribución condicional en
S^t_ ^_{ yt_. ^, yt_2, ... } son:
Et-^ Yt = PYt-^
vart-^ ( Yt )= Et-^ ^ Yt - Et-^ Yt ) 2= Et_^ £i = ht
=ó°+b^ ^2^ =b°+S^ [Yt-^ -PYt-2l2
^^
C^:^UTA f^'AF^A LA E^^TIMAC:IUN D^ w1t)l)F;_^ ^`^ Ak^^;^^
En cualquier caso, es importante observar que tanto la esperanza como la
varianza condicionales de yt dependen de la información disponible en cada
instante y no son, por tanto, constantes.
Estos resultados se generalizan fácilmente a un modelo AR(1) con estructura
ARCH(p), definido por las ecuaciones [5] y[3]. En este caso, la varianza incondicional de yt es también constante:
so
var(Yt)=__
1 -Q2 1 -b1 - ...
mientras que la varianza condicional del proceso en S2t _ 1 depende de la información disponible en cada instante, siendo su expresión:
vart-1 (Yt)=ht =bo+ólEt 1+...+bp^t p
! ^0 + S1 ( Yt-1 T PYt-2 )2 + • • • + bp ( Yt-p-1 - P Yt-p )2
3.3.
Estimación de máxima verosimilitud del modelo ARCH(p^
univariante
Sea el proceso descrito en las ecuaciones [1 ] y[3]. Dado que cada observación
^t del proceso tiene una distribución condicional Normal independiente de las
dernás, el logaritmo de la función de verosimilitud condicional es ia suma del
logaritmo de la verosimilitud de cada una de ias T observaciones muestrales, por
lo que puede escribirse como:
T
T
^=^ 1,=-^
^-, t-,
2
1- in ( ht ^ + __^t 2
2ht
[6]
donde se han eliminado las constantes y It denota el logaritmo neperiano de la
contribución del período t a la función de verosimilitud, cuyas derivadas primera
y segunda respecto a b son:
ai , - _^ _ an,2 E^2
as 2 n, as n,
- 1
aht ^ht ^t + ct 1
a2 It
-_ - ^ 1
___._ _ ^ ___1 _
^b'
hi
^b'
ht
^b
2h?
ab^b'
2h4
[7]
ht
E s^rfa[^i^^rit^,^ E sF^^>^n^^:^^i A
1^^^
En estas expresiones b es un vector cie p+1 parámetros desconocidos y el
resto son escalares, por lo que el gradiente anterior es un vector (p+1)x1 y la
matriz hessiana es simétrica de orden (p+1)x(p+1).
La estructura ARCH introduce dependencia entre las distribuciones de probabilidad de ^t correspondientes a períodos sucesivos de tiempo, por lo que tiene
sentido definir la matriz de información como la esperanza condicíonal del hessiano de la función de verosimilitud, cambiada de signo. Entonces, utilizando el
hecho de que ht es medible respecto a S^2t_^ (es decir, depende sólo de variables
en S2t _ ^) así como que: Et._ ^^^ ^ hi , se obtiene: Et_ ^(^^ I ht )= 1, por lo que la
matriz de información resulta:
Is^=--^
^
a^ It_^
Et_
1 4 ahi ahi^
- ^
as<^s
2ht ^^s as
^
[8]
En el caso habitual con que ht se supone una función líneai como en [3]:
ht =so+s^ Et ^ +... +sp^t P --^ ht =zt's
donde
2 )
Zt^ = ( 1, ^_2 ^ , . . . , st_p
s'=( sp, s^ , ... , sp )
entonces, ah^ /as = zt y a partir de la expresión [7] se tiene que:
alt _
aL
_._ _
_^ -..._^
as
^ as
1_ ._ Z t
^ zht
£t
_^__ 1
ht
[9]
mientras que la expresión en [8] puede escribirse:
,
_1 ^t zt-_ h4-zt
I ss 2
t
[10]
Las expresiones [9] y[10] resultan útiles al programar la estimación numérica
del vector gradiente y la matriz hessiana del modelo univariante ARCH(p). Estos,
a su vez, se utilizan en un algoritmo iterativo del tipo de ^^scoring» para obtener
el estimador MV de los parámetros del modelo. Este algoritmo es:
^
^
Si+ 1 ^ Si + ^^
-1
^
si
a^t
^ _.___
^
t as s;
1^
(aUIF1 F^AFtf^ lA E^TIMAC^C^.JN DE- MCiOE^ l C^^^ Af^^^;r^
n
n
donde b;, ^ y b; denotan las estimaciones numéricas del vector b en dos iteraciones sucesivas.
De este modo, a partir de las expresiones [9] y[10], el algoritrno iterativo de
estimación quedaría:
[11]
5^+^=b;+(Z^ Z)+'Z^ W
donde:
^,
zt =( 1,^2^ , ... ,E^2p)/ht
.^,
^ ^
Z =(z^,z2, . .., zT ) es una matriz ( p+ 1) x T
wt - ( t/ht)-1
,
W =(w^ ,w2, . .,wT) esunvectorl xT
por lo que la variación a introducir en la estimación del vector b en cada etapa
del proceso iterativo, viene dada por los coeficientes MCO en una regresión de
fa variable wt sobre e1 vector (p+1)-dimensional zt' para t=p+1,...T, donde Et es
conocido en el período muestral y ei valor numérico de ht en cada iteración se
obtiene con los parámetros estimados en la iteración previa.
La matriz de covarianzas del estimador MV del vector b se estima consistentemente a partir de la inversa de la matriz de información en [10]. Dicha matriz
de covarianzas no es, en nuestra notación, sino 2( Z' Z)-' . La utilización del
factor 2, en lugar de la habitual estimacíón de la varianza condicional dei proceso,
es asintóticamente válida, ya que:
Et
2
2
N( 0, 1), por Io que: Et ^^c'; Y var ^t = 2
ht
h?
En el proceso de estimación, se utiliza generalmente como criterio de convergencia el estadístico G:
G ^^
^2 L ^^ aL
^ as' as^s'
^s
[12]
que se distribuye ^;. Puede probarse que este estadístico coincide con el R2 de
ia última regresión efectuada en ei algoritmo descrito. Si dicho estadístico toma
un valor superior al de las tablas, se interpreta que el cambio en la estimación
es grande, y se continúa iterando. En caso contrario, se detiene el proceso de
estimación, conservando el último valor obtenido.
Í ^>
f^^TAI)1;^;11r,A f^^F^ArJr)l F+,
Obsérvese que la consideración de una estructura ARCH(p) supone estimar
los p+1 parámetros de dicha estructura. Para limitar la dimensionalidad del
espacio paramétrico, aunque manteniendo p retardos en la estructura ARCH, en
ocasiones se utiliza la parametrización de ht siguiente [Engle (1983)]:
h^ = bo + b1 ^, ^^ ^i ^
,
[ 13]
donde los c.^ i^ 1,...,p son números fijos que ponderan la importancia que las
observaciones recientes tienen en la determinacíón de ia varianza. Generalmente, los parámetros c^; se escogen de modo que ^ P c^ = 1
Con esta parametrización se tiene que ^ht / ab' =( 1, St ), donde St =^p c^; ^t _; y
el algoritmo en [11 j funcíona como el de un ARCH(1), con St jugando el papel
de Ft 1. Sin embargo, hay que notar que la condicíón de estacionariedad debe
comprobarse a partir de las raíces del polinomio: ^- 51^1 B^•••- b1^p Bp - g Y
no en la raíz de 1- b^ B= 0.
4.
EL MODELO ARCH DE REGRESION
EI modelo ARCH de regresión es la extensión natural del modelo ARCH
univariante, en el sentído de que ahora es el término de error de un modelo de
regresión el que adopta una estructura ARCH.
Así, denotando el conjunto de información disponible en t-1 por SZt_1 ={ xt, xt_^,
•••, Yc-1, Yt-z •••}, el modelo ARCH de regresión es:
Yt I s^t-, ^ N( xt' R^ ht )
2-
ht - h (^t_1, . . , ^t_P , ^
Et = Yt - xt
[ 14]
)
,
donde xt es un vector (kx1). Este modelo podría también generalízarse con la
ínclusión del vector de variables explicativas xt en la ecuación de la varianza
condicional:
ht ~ h (Et-1, . . . , F.^_p, xt, xt_1, . . . , xt_p, ^)
aunque no consideramos este caso en nuestro desarrollo.
Si en [14] no aparecen retardos de la variable endógena como variables
explicativas del modelo de regresián, entonces el estimador MCO aplicado a este
modelo satisface el Teorema de Gauss-Markov, ya que la esperanza de yt
1%
C^111A PARA LA E5TIMACION UE MODfL<)5 ARC:^N
condicional en xt es xt` [3 para todo t y la matriz de varianzas y covarianzas del
vector y es a? IT, por lo que es un estimador insesgado y consistente. Sin
embargo, el estimador MCO no alcanza la cota de Cramer-Rao. En este sentido,
el estimador MV, que es no lineal, es asintóticamente más eficiente. Si el vector
xt incluye retardos de yt, los estimadores MCO seguirán siendo consistentes,
aunque sus errores estándar, estimados por el procedimiento habitual, no lo
serán, ya que las perturbaciones al cuadrado están correlacionadas con el cuadrado de las variables retardadas del modelo [extensión del resultado de White
(1980)]. En este caso, el estimador MV es también asintóticamente más eficiente
y proporciona estimacianes consistentes de los errores estándar.
4.1.
Estimación de máxima verosimilitud del modelo ARCH de regresión
EI logaritmo de la función de verosimilitud condicional del modelo [14J viene
dado por la expresión en [6] donde, en este caso, Et no es observable y se
determina por ^= yt - xt' R
Para poder utilizar un algoritmo del tipo Newton-Raphson en el cálculo del
estimador MV precisamos de la expresión analítica del vector gradiente y la
matriz hessiana. Obtendremos por separado las derivadas con respecto a los
subvectores [i y b utilizando, en primer lugar, la parametrización más general que
figura en [3]:
ht =So+cS^Et ^+...+ópEt p So>O,b;>_0 i=1,
,p
Las derivadas de cada término del logaritmo de la funci ón de verosim i litud con
respecto al vector (3 de coefi cientes de las variables expli cativas son :
^It _- 1 1_2^hi
ct _^ __ +1 2cC2
h4 _^ahi
__ + xt
_^2__
2 ^t
aR
t R
t
R
2
= Xc ^t +__^_ ._ a ht_
^t
2h2 aR
2
Et__ _ 1
ht
donde aparece explícitamente la dependencia de ht respecto del vector (3.
Teniendo en cuenta que:
a ^2
aR
-- -2 xt-^ Et-^
[ 15]
E^ ^^ i af)i^:; r ir^^.^, f^ ^,i7A^W^^)^ A
1
se tiene que:
^^h? -
- -2 ^L ,s, xt_, ^t-;
f^^
lo que implica:
P
-1
^ ^^ xt-^ ^-^ ^
,
ue a 9
ru P
ando términos en x E,
Y la derivada
P or lo q^
`^^
^-^ _ ^ ^)^^t
R
R
puede escribirse:
1
^^t_ _
- ^ xt ^`t
^R
2
2
£t^ ^ -- ht,^ ^ )
^ hi
[ 16]
=^xtEt^
t
donde c^ denota el corchete en la expresión anterior.
Derivando de nuevo, se tiene:
xt xt' 2xt.__Et ^ht
_. _ 1 et c^ht c^ht
____ - h4
h?
aR' 2h^ h^ ^R ^R^ +
_. ^^? L - ^
^R^R^ - ^
a
^R'
2 h?
an; 1
aa ^
Tomando esperanzas condicionales en S2t. ^ y utilizando las propiedades:
Et__^ Et = 0 y Et_^ ct = ht con lo que Et_^ (^a / ht )= 1, se tiene que la parte de la
matriz de información correspondiente al vector [3 es:
=_E_ ^^2L_E^1^
t
t^ ^^3^^ ,
^
xt xt'
hz _
1 _ ^^h, ^^ht
2h4 ^[i ^R,
Teniendo en cuenta que:
E
t^
_ ^^ht
__
_ _.1 _^ht
2h4 ^^ ^Q^
__ 2.
ht
^
2 2
S^ Et-^ xc-^ xc-^ ^
[17]
cjIJIA F'A^tr^ l_A E 5TlMA(_:lí:)N C)E:: M(^C:)E l!: ^^ AF^(,Hi
1^
ya que la esperanza condicional de 1os productos cruzados r,t ;^t ^ cuando i^j es
cero, la submatriz I^3^^ de la matriz de información puede escribirse:
xt xt'
2^ 2 2
,
_ 2_+ 4
S^ ^t-^ xt-^ xt-^
ht
ht ,
y agrupando términos:
P
I
^R
= ^ Xt Xt' -^-
t
h^
I
2 ^2 ^ ^2
t
^ _ ^ xt xt^ r?
4^
[1 g]
r
donde rt denota la expresión dentro dei corchete.
Por otra parte, las derivadas con respecto al vector b se obtienen del mismo
modo que en el modelo ARCH(p) univariante. Es decir, la expresión del vector
gradiente aL/^b viene dada en [9] y para estimar la matriz de información I^ puede
utilizarse la expresión en [10].
Lema
Si un modelo ARCH de regresión con bo>0, b^,..,óp> 0 es simétrico (2), se tiene:
I^^ - Ec-^ ^
^
^ht aht '
= 0
^ b ^^i' ^
lo que implica que la estimación de ó y^i por separado es asintóticamente
eficiente [para su demostración, ver Engle (1982)].
Sobre la base de este lema y de los desarrollos anteriores, puede proponerse
la siguiente estrategia de estimación MV:
1)
Estimar ^i por MCO en el modelo de regresión yt = xt' R+ ct y obtener las
residuos ^
2)
Utilizar ^t para estimar el vector b por un algoritmo iterativo (MV).
^
Alcanzada la convergencia en la etapa anterior, utilizar b para estimar el
3)
vector ^3 por un algoritmo iterativo (MV).
4)
Volver a iterar en b y R si se desea.
(2)
Un proceso ARCH se dice simétrico si la función ht y su vector gradiente (respecto al vector b)
son funciones reales pares en todas sus componentes ^.t .^,..., ^t _p, mientras que las derivadas
parciales de h^ respecto de ^r ^,..., ^;_^ son funciones impares en b^ ,..., bp.
E `^TAC)ISTI(`^A FSPAN(.71A
En cada etapa del proceso se sugiere también utilizar el algoritmo de «scoring». La descornposición de este algoritmo en las dos etapas 2 y 3 anteriores,
que utilizan el algoritmo para los subvectores [3 y b por separado, es eficiente
gracias al lema anterior.
EI algoritmo iterati^^o del vector S en la etapa 2 del proceso de estimación, se
deduce a partir de las expresiones [9] y[10] y viene dado en [11 J. Es, por tanto,
el mismo aigoritmo que se utiliza en la estimación de un proceso univariante
ARCH(p) donde, ahora, Et no es observable y se estima a partir de los residuos
MCO del modelo de regresión. De la misma forma, la matriz de covarianzas de
los estimadores MV se estima consistentemente por 2( Z' Z)^' .
Las interaciones sobre el vector ^i en la etapa 3 del proceso, pueden hacerse
a partir de las expresiones [1 fi] y[18] mediante el algoritmo:
^
^
_
R;t^=^;+(X'X)^'X'e
[ 19]
donde se han efectuado las siguientes transformaciones en las variables:
-• = xt, rt
xt
X' _{ x^' , x2', .. ., xT ) es una matriz k x T
et = Et c^/ rt
e' _( e^ , e2 ,..., eT ) es un vector 1 x T
por lo que el término de la derecha en [19] puede de nuevo interpretarse como
el vector de coeficientes estimado en una regresión de et sobre el vector xt' para
t=p+1,...,T. Obsérvese que para construir estas variables transformadas, se utilizan los residuos MCO del modelo de regresión y la estimación del vector S
obtenida en la etapa 2. También, la matriz de covarianzas del estimador MV del
vector [i se estirna consistentemente mediante la matriz ( X' X)-^ . En cada una
de las etapas, puede utilizarse como criterio de convergencia el estadístico G
que figura en [12].
Con la parametrización más restringida, que se ha considerado en la ecuación
[13]:
ht = S^ + b^ St
St = ^ ^i ^t2 i ,
,
,
^i ( Yt-i - xt-i ^ ) 2
(^^111A F'ARA L^ ESÍIMI^C^_:IO^J (^E ^Jlt")[)E^l.^)`^ AR(^.F
21
se tiene que:
^^ht _
___ _ _
c^b'
1
St
^h^
,
__ _ ._ _
_ -2 b ^ ^ ^ xc-^ ^ t-^
y
^^[i
,
por lo que las derivadas necesarias para calcular los estimadores MV son casos
particulares de las correspondientes a la parametrización más general. En concreto, el vector de derivadas primeras de It con respecto a^i, que para la
parametrización más general figura en [15], es en este caso:
xt ct
ht
S,r E^ _ ^
hi L ht
^ U^i xt-i ^t-i
,
por lo que, agrupando términos en x y E, el vector gradiente `^^- _^ `^it
^ ^^
^R
puede escribirse:
^._2.
_^ _ ^ xc Ec __^ - - S^ ^ ^; - __._1 _ ( Et-+
^
ht+ ^ >
2
t
,
4
aR
ht
[20]
ht+ ^
que es claramente un vector kx1, mientras que fa matriz de información que
aparece en [18] es, bajo la nueva parametrización:
= ^ xt xt'
t
-^ + 2 ó ^ ^2 ^ c,^?
,
ht
c
^
[21 ]
Por otra parte, respecto al vector S, las expresiones [9] y[10] se reducen
respectivamente a:
^L _
'
2hi
t 2h
E^ - 1
h^
[22]
C231
expresiones que no dependen de la composición del vector de variables explicativas xt en el modelo de regresión.
^^^ ^-a ^^^ ^^ r^^^^ ^^ 1 ^^ ,^^ ^ ^^>F^^^ r^^ , ^ ^^
A partir de [22J y[23], el algoritmo de estimación para b puede, por tanto,
escribirse:
^
^
^;+^=b^+
1 St
S, S;
1
2hi
1
I
^z
2hi ^- hi
1
S^
[24]
por lo que la variaci ón en la estimación del vector S puede obtenerse como el
resultado de una regres ión MCO de :
C
s
^? - 1
sobre el par de variables : ñ` ^ 1 , S, ^
^bsérvese que con la parametrización sugerida, se ha reducido de p+1 a 2 el
número de parámetros de la estructura ARCH, por lo que el proceso de estimación es similar al de un modelo de regresión con estructura ARCH(1), donde St
juega el papel ^2 ^ .
La idea del procedirniento de estimación es la misma que acabamos de
exponer para la especificación más general. Consiste en comenzar con el vector
^3 estimado por MCO, generar los residuos correspondientes y utilizarlos como
se indica en [24] para iterar sobre el estimador de ó. La matriz de covarianzas
de los coeficientes estimados se obtiene del mismo modo que en la especificacíón general del modelo, es decir:
,
n
VO
cov
L ^^ J
^2
1
St
En cuanto al algoritmo de estimación MV del vector ^3, comparando las expresiones [20] y[21 ] con [16] y[18], es inmediato comprobar que el algoritmo es ei
mismo que figura en la ecuación [19], donde deben tenerse en cuenta las
pequeñas diferencias existentes entre las respectivas expresiones para la construcción de las variables transformadas c^ y rt . De nuevo, para la construcción
de estas variables se utilizan los residuos MCO del modelo de regresión y los
coeficientes estimados de ó en la etapa anterior. La matriz de varianzas y
covarianzas de los estimadores MV de [3 se estima consistentemente a partir de
la inversa de la matriz de información en [21 ].
Finalmente, obsérvese que la estimación MV de un modelo AR(1) con estructura ARCH(p), como el que se ha introducido en la Sección 3.2, es un caso
(;I,)IA F'AFZA ^.A E:STiM^tiC;I(^N [)E^^ MC^C^ELr:^S AkC;H
23
particular de la estimación del modelo ARCH de regresión, tanto si la parametrización de ht es la general dada en [3] o la más restrictiva en [ 13]. Esto se debe
a que las expresiones que se han desarrollado en esta sección son independientes de las variables contenidas en el vectos^ xt. Obviamente, el proceso de
estimación descrito también es aplicable a modelos AR de orden superior con
estructura ARCH.
4.R
Contrastes de estructura ARCH
La estimación de modelos ARCH es apropiada cuando estamos ante la presencia de varianzas condicionales que dependen del tiempo. Si en un modelo de
regresión las perturbaciones no son condicionalmente heteroscedásticas, los
estimadores MCO son óptimos. Por lo tanto, dado que la estimación con estructura ARCH requiere un procedimiento de estimación iterativo, es deseable contrastar si este tipo de modelo es el apropiado antes de hacer el esfuerzo de
estimarlo.
Para Ilevar a cabo los contrastes de estructura de heteroscedasticidad tipo
ARCH es indicado utilizar el contraste de los multiplicadores de Lagrange (LM).
En general, dado un modelo de regresión yt = xt' ^i + ct, ^^ N(o, a^ y^ ( 6}) en el
que se desean contrastar m restricciones lineales:
Ho^ 9(7) = 0
H^^J(7)^0
donde ^=([3', 9', 6? ) y g es una función vectorial de dimensión m, el contraste
LM consiste en determinar si el gradiente del logaritmo de la función de verosimilitud del modelo, calculado para el modelo más general y evaluado bajo Ho, es
próximo a cero. Se demuestra [Engle ( 1984)] que el estadístico a utilizar es:
bLM - ^
a^ ^
0
]
^ ^ (Yo)^ ^ C ^^,
o ^ ~ ^m
Para el caso particular de1 contraste de existencia de estructura ARCH, la
hipótesis nula es:
Ho: h? ^ hó
es decir, ausencia de heteroscedasticidad, frente a:
H^: ht -h(zt', b)
^ ^,^r^^,C^^i^,rir;^ E^^^^^Nrr^,^^
A partir de la expresión [9], es fácil obtener que bajo Ho el vector de derivadas
primeras respecto a ó es:
^)L
_ 1 ^ Zt
0 2ho ^
^^s
E2
t _1
hó
_ ^ Z' V1/o
2hó
donde Wo es el vector W evaluado bajo Ho. Mientras que a partir de la expresión
[10], la matriz de información bajo Ho es:
Ibb
0
1
2
^Z Z Z^ Z
^o
J
Por lo que el correspondiente estadístico para Ilevar a cabo el contraste puede
estimarse consistentemente como:
,
,
^ ,
2
^LM ^ - __ WO Z ^ Z z )i Z WO ~ ^p
^
Dado que el plim ( Wo' Wo / T)= 2, un estadístico asintóticamente equivalente
vendría dado por:
^^M = TWó Z( Z' Z)^^ Z' Wo/Wó Wo = TR2 ^
donde R2 es el coeficiente de determinación de la regresión de Wo sobre Z. Es
inmediato comprobar que R2 es también el coeficiente de determinación de la
regresión de Et sobre una constante y p retardos suyos, todos ellos obtenidos
bajo la hipótesis nula. EI producto TR2 se distribuye de acuerdo con una variable
^p (el número de grados de libertad no incluye la constante). Para Ilevar a cabo
esta regresión se utilizan los residuos MCO del modelo, por lo que el contraste
de existencia de estructura ARCH puede realizarse sin necesidad de estimar bajo
la hipótesis alternativa. Es importante resaltar que este contraste es válido con
independencia de la forma funcional de ht, siempre que ht dependa de ó tan sólo
a través del producto zt' b. Como puede apreciarse, el contraste es condicional
en un orden p del modelo ARCH especificado en !a hipótesis alternativa H^, por
lo que debe realizarse para varios valores de dicho parámetro.
También, las funciones de autocorrelación simple y parcial de los residuos al
cuadrado puede utilizarse en la identificación del orden p del posible modelo
ARCH. En este sentido, obsérvese que los modelos ARCH pueden asimilarse a
una estructura AR en varianza.
Para contrastar un modelo ARCH de un determinado orden frente a una
estructura ARCH de orden inferior, por ejemplo, para contrastar la hipótesis nula
Ho: b2=0 en el modelo: ht = bo + ó^ Et ^+ ó2 ct 2, se compara el producto TRó con
C;UTA F7Af^ l..A ESTIMAC;I(^N DE MC.)[)ELC:^S ^.R(,hi
_ _ __ _
^^j
una variable ^c^, donde Ró proviene de la regresión de un vector (Tx1) de unos
sobre el vector gradiente de la función de verosimilitud. En efecto, si denotamos
por go la matriz de observaciones del vector gradiente calculada para el modelo
más general, pero evaluada bajo la hipótesis nu{a, el contraste de los muitiplicadores de Lagrange utiliza el estad istico:
,
^^M = 1 90 ( 9ó 90 )--1 9ó 1= TRó
donde Ró es el coeficiente de deterrninación no centrado de una regresión de un
vector de unos (Tx1) sobre go.
Como es obvio, {os contrastes anteriores pueden tarnbién utitizarse para detectar la existencia de estructura ARCH en un proceso univariante, como el que
se ha introducido en la Sección 3.
5.
EL MODELO ARCH GENERALIZADO: GARCH
5.1.
EI modelo GARCH (1.1)
EI modelo GARCH especifica que, en cada período, la varianza condicional de
^, h? depende de los úftimos residuos, pero también de sus propios valores
previos. Es decir:
ht = SD + á1 Et 1+ 6^ h^ 1, COn ^p > Q,
S1, e 1^ Q
[25]
por lo que las ecuaciones [1 ] y[25] representan el modelo GARCH(1,1).
Obsérvese que ^ 61 ^< 1 es una condición necesaria para la estabilidad del
modelo. Bajo esta condición, el modelo GARCH (1,1) equivale a un modelo ARCH
de orden infinito:
h2t - 1_e
s^ 1^_e.^^-,
+ ^1
2
1
1
Esto indica que un proceso GARCH(1,1 } puede aproximarse por un ARCH(p)
si p es lo suficientemente grande. Sin embargo, al igua! que en los modelos
ARMA, el proceso GARCH se justifica sobre la base del principio de parsimonia.
En el modelo GARCH(1,1) se tiene, a partir de [25]:
Et ht S=^o + S^ Et ^2 S_^ + e^ Et ht S_1 = bo +( b1 + 8^ ) Et ht S-1
donde puede verse que, para que el proceso de varianza condicional sea estacionario, es preciso que ^ b1 + 6^ ^< 1. En tal caso, la varianza incondicional de
^t viene dada por:
F: c;r^,(>^^;Ti{^^ E `;F'APv(^,l ^
^^
6? = E ^ t =
^o
1-1^1+H^)
y al aumentar el horizonte de previsión s, puede probarse que el valor esperado
de la varianza condicional Et ht S converge hacia 6?.
En general, los momentos de orden 2n del modelo GARCH (1,1) existen si [ver
Bollerslev ( 1986)]:
^ n J a; S^, 9;-^ < 1
1
[26]
donde:
^
ao = 1; aj - Il ( 2j - 1), 1? 1
i =^ 1
Por ejemplo, en el caso del proceso ARCH(1), 61=0 y la condición [26] se
reduce a a^ b^ < 1. Por otra parte, particularizando [26], el momento de cuarto
orden en el modelo GARCH(1,1), existe si:
3 ó^ + 2 b^ e1 + 9^ < 1, en cuyo caso:
.
E (cC2 ) = óo ( 1 - b1 - e1 >-1 y
E(^4)=3óó(1+b1+61) [(1-S1-e1) (1-6^-25161-35^)]-1
por lo que es fácil ver que el coeficiente de curtosis es:
K=[Ec4--3(E^t )2] (Ect )-2=65^( 1-81-2ó161-3b^ )-1
que es positivo bajo nuestras hipótesis, por lo que el proceso GARCH(1,1) es
leptocúrtico, al igual que ocurre con los modelos ARCH.
En las aplicaciones prácticas de este modelo, se tiene con frecuencia que
b1 + 61 es aproximadamente igual a la unidad, con lo que el proceso ht no se
separa mucho de uno no estacionario. Tal proceso se dice que es integrado en
varianza, ya que la primera diferencia de éste sería un proceso estacionario. En
tal modelo, la previsián de la varianza condicional Et ht S para s> 0, no converge
hacia a? al crecer el horizonte de previsión, sino que depende explícitamente de
S2t.
2l
t^l_ ^ IA E^AFZF+ L.A E=ST^MA(.:iOrJ C)E Mt 7f)E l^:).•^> Aflc: ri
EI proceso GARCH ( 1,1) integrado se representa por [Engle y Bollerslev
(1986)] :
ht = zci 1 +(1 - ^) hi i
[27]
donde 0«<1. Este proceso satisface la condición de que la predicción de la
varianza condicional s períodos hacia adefante es:
Et ht S= ht ^ = iEt +(1 - t) ht ,
s> 0
Esto es, la varianza condicional s períodos hacia delante es la misma que la
varianza condicional un período hacia adelante para todo s>o, por lo que guarda
cierta semejanza con un proceso de camino aleatorio. Por consiguiente, en este
proceso, las innovaciones en la varianza condicional tienen un efecto permanente.
Si en [27] se incorpora una tendencia µ:
ht = µ+ Z^t ^+(1 - T) ht ^
se tiene:
Et ht S= sµ + ht ^_(s + 1) µ+ t^t +(1 -- i) hi ,
s> 0
similar a un paseo aleatorio con deriva. Nótese que, aunque la importancia
relativa de ht 1 en la previsión de la varianza condicional decrece con s, su efecto
es permanente.
5.2.
EI modelo GARCH(p,q)
EI modelo GARCH(p,q) para un proceso Et, queda definido por la expresión en
[1 ] junto con:
q
P
ht = bo + ^ b; Et ; + ^ 6; ht ; = óo + b ( B ) ^t + 8 ( B ) ht
[28^
donde: p?o, q>o, ^>o, S;>_0 i=1,...q; 6;>0 i=1,...,p, reduciéndose a un modelo
ARCH(q) cuando p=o, y a un proceso de ruido blanco cuando p=q=o.
Análogamente al modelo GARCH(1,1), si todas las raíces del polinomio 1-8(B)
están fuera del círculo unidad, se tiene:
hi = bo[1 --9(1)]T^-+- b(B)[1-e(B)]-^£2= bo 1-^
e^
;^^
+^, -^a^ ci ^
E `^>TA^11^iT1(,A E `^^'AN()l A
^ ^3
donde H(1) denota el valar numérico que resulta de sustituir B por 1 en el
polinomio H(B). Es decir, el proceso en [28] puede escribirse como un ARCH(^),
donde los coeficientes a, provienen del desarrollo de la expresión
b(B)[1 -H(B)]_^.
Teorema
EI proceso GARCH{p,q) definido en [1 ] y[28] es estacionario de segundo
orden, con E^=O, var(Et) = S^, [ 1- b(1) - 8(1) ]-^ y cov(^t, ^S) = 0 para todo t^s,
si y sólo si b(1)+H(1)< 1[para su demostración ver Bollerslev ( 1986)].
5.3.
Identificación del modelo GARCH(p,q)
Para un modelo GARCH(p,q), si definimos el proceso: vt = ct - ht , que claramente tiene estructura de ruido blanco, se tiene a partir de [28]:
F^2= vt+ b^+ ó^^2^+...+ SqE^^+ 6^ ht ^+...+ Hpht p=
m
p
= s^ + ^ ( bi + ei ) £t i - ^ ei ut-i + Vt
^-i
e-^
[29]
donde m= máx{p,q}. Por tanto, Ex sigue un proceso ARMA (m,p) con un término
de error sin autocorrelación. Ello ha conducido a la sugerencia [ver Bollerslev
(198^) y(1988)] de utilizar las funciones de autocorrelación simple y parcial
muestrales de ^2 para identificar los órdenes del proceso GARCH.
Si denotamos las covarianzas de Et por ^yn = cov (Et , Et n), se deduce a partir
de [29] que:
m
^n - ^ ^i ^n-i +
,-,
n ? p+ 1
[30J
donde yr = b; + H; i= 1,..., q, 9; = 0 para i>p y 5;=0 para i>q. De [30] es inmediato
deducir que las autocorrelaciones de ct vienen dadas por:
m
P n= 7n 1^p ^-^ Wi P n-i ^
^ -,
n? p+1
[31]
De esta forma, las p primeras autocorrelaciones de Et dependen directamente
de los parámetros b^,..., bp y 6^,..., H^, mientras que las autocorrelaciones de
orden superior se calculan recursivamente a partir de [31 ].
^^;^.a^^ F^A^2^ ^a EST^^^,a^^^^^^^ [^E t^^r^^UE ^_C^^ a^r^;^^
29
Por otra par#e, dado que las ecuaciones en [31 ] son análogas a las de YuleWalker, la autocorrelación parcial de orden k para ^t que denotamos por ^kk, se
deriva a partir de la resolución del siguiente sistema de k ecuaciones con k
parámetros ^k^,...,^kk^
k
pn = ^ ^ki Pn-i ^
,.,
n=1,...,k
Estos resultados son similares a los correspondientes a un proceso ARMA(m,p) [Box y Jenkins (1976)). Si el proceso es un GARCH(p,q) estacionario,
las autocorrelaciones simples y parciales no se hacen cero, pero decaen rápidamente. También, un procedimiento similar con yr; = S;, podría utilizarse para
identificar el orden de un proceso ARCH(q), donde ^kk = 0 para k>q, al igual que
ocurre en un proceso AR(q).
Obsérvese que para Ilevar a cabo estos contrastes, los valores de p„ y^kk a
utilizar en las ecuaciones previas deben sustituirse por sus valores estimados,
utilizando su varianza asintótica que, bajo ta hipótesis nula de no existencia de
estructura GARCH, es igual a 1/T. Por supuesto, una vez que se ha estimado un
modelo GARCH, el contraste de las funciones de autocorrelación de los residuos
se debe hacer con los residuos estandarizados.
5.4.
EI modelo GARCH de regresión: es#irnación de máxima verosimilitud
EI modelo de regresión GARCH(p,q) se obtiene si las ct' s en [28] son las
perturbaciones de la regresión: yt - xt' [i +^t.
Si denotamos por:
(^' _ ( ^+ 51^...., ^q, 8^,..., ^p ^
r'=cR',^^
se tiene que el logaritmo de la función de verosimilitud del modelo viene dado en
[6) con et = Yc - Xí R Y que sus derivadas primeras y segundas con respecto a^
son:
aL _ ^ _.....
1 ^h^ e ?
-__1
-z a^
hi -^2h
a2 L _
_
^^^^'
t
^ht
_ __ __1.._ . ____
_ ^ht
_ __._ Et
__ __ +
2ht ^^ ^$' ht
[32]
£2 J
t -1
hi
^^,
^hr 1
2ht d^
`-^ i ^+C^JI ;T I!:^ f^ `:^F^,A^^f^^^l ^•
donde:
^)hi = z +
e ^^ht ^
t Z^
(^ Qi
^
^
[34]
C^(^
siendo el segundo término de [34] la diferencia con respecto al modelo ARCH
de regresión. Por otra parte, la esperanza condicional del segundo término en
[33] es cero, por lo que la submatriz de la matriz de información correspondiente
al vector ^ puede estimarse consistentemente a partir del primer término en [33],
sustituyendo ^2 / ht por su valor esperado de 1.
Por otra parte, las expresianes para el gradiente y la matriz de información
correspondientes al vector ^ son las mismas que las desarrolladas por el modelo
ARCH de regresión, que figuran en las ecuaciones [15] y[17] respectivamente.
En ambas expresiones hay que tener en cuenta que si la estructura de h^ es
GARCH(p,q):
c^ht
^^
-
_2Q
X
+ p ^^h? ^
^ ^, t-^ ^c--^ ^ e^ _ _ __
^-^
^_^
[35]
^^
donde, de nuevo, el segundo sumando en [35] es la única diferencia con el
modelo ARCH de regresión. También, al igual que en el modelo ARCH de
regresión, el bloque fuera de la diagonal en la matriz de informacián resulta ser
cero, por lo que ^ puede estimarse por separado de [i sin perder eficiencia
asintática.
La presencia de términos recursivos en [34] y[35] hace que no podamos
representar el algoritmo de <cscoring» como una regresión. Por ello, es aconsejable utilizar el algoritmo de Berndt, Hall, Hall y Hausman (1974), que para un
vector genérico 6 puede escribirse:
^
^
e^^+ = e^^ +
^,^
aL ____
c^L r1 ^L
_ ___
^^é ^e^ é; ae
[36]
donde ^.; denota el parámetro de salto habitual en los procedimientos de optimización numérica. En este algoritmo, la dirección de salto puede obtenerse a partir
de una regresión de un vector de unos sobre la matriz muestral ^L/^r. Además,
dado que ht depende de sus valores pasados ht_; para i=1,...,p, en cada iteracián
las derivadas en [34] y[35] deben evaluarse recursivamente a partir de p condiciones iniciales. Finalmente, por las razones ya vistas, el algoritmo puede aplicarse por separado a^ y a.
^ ^^A t^,"^f<,.^ ^ r^ F^<,.,T,^.^^•r .^ ;^^ ^;^
tif( ,[,4 ,. ^
•F.^
••
,i 1
Si no se parte del supuesto de normalidad condicional de ^,, entonces la
distribución asintótica del estimador que resulta de este algoritmo es Normal, pero
con matriz de covarianzas:
i( r)-' B( r} i( r^._,
donde:
^(r}-^ _ - E [^2LI^T'^^^ ^'
B(r) = E [(^L/^^r) (^Ll ^^r")]
estimándose ambas por sus respectivos momentos muestrales.
5.5.
Contrastes de estructura GARCH
Si descomponemos ia estructura de la varianza condicional en [28]:
ht = z, c^^, + ZZt^^2
donde:
2 ..., 2
z^t^ = { 1, Et_..^,
ct _q )
2
2
z2t • = ( ht_..,
, . . . , ht_p
)
^1^ ` 1^0^ ^1,..., ^q^
^ ^2 - (8^, 82,..., ^^}
y se quiere contrastar la hipótesis nula: Ho:^2=0 (un proceso ARCH frente a un
GARCH), el estadístico de los multiplicadores de Lagrange correspondiente es,
de nuevo:
1
^^M `,.,
+
^
+i
^^
^
*
WO ZO ^ ZO ZO ^^ ZO w0
W 0 ^_[
^/h^ ) - 1, ..., (^^T/hT ) -- 1
siendo:
Zó ^ =
h^ ( ^^h^/ ^)^ ) ,...,hT ( ^^hT/^)^ )
0
^
donde la expresión para ^ht /^^7^ aparece en [34] de forma que Z*o es una matriz
Txs (siendo s el número de variables en ht ) evaluada bajo Ho, es decir con ^2 = 0 y
con los valores estimados del vector ^^ .
EI estadístico ^^M en [37] se distribuye ^? donde r es el número de parámetros
en c^2. La mayor diferencia con el caso ARCH(q) es que ^^ht /^^^ no tiene una
expresión sencilla si la ecuación de h; incluye algún retardo de ht . Como es
habitual, este estadístico coincide asintóticamente con el producto TR2, donde
R2 es el coeficiente de la regresión MCO en la primera iteración del procedimiento
de Berndt, Hall, Hall y Hausman (1974) a partir de la estimación obtenida bajo
Ho.
En este tipo de contraste se tiene un resultado similar al de los contrastes de
modelos ARMA(p,q): si la hipótesis nula es ARCH(q), la matriz (Zó^ Zó) es singular
para cualquier alternativa GARCH (r^, q+r2) con r^>0, r2>0. Ello ocurre, en particular, para el contraste de ruido blanco frente a GARCH(p,q). Otra propiedad es
que, frente a Ho: ARCH(q), los estadísticos para las alternativas ARCH(q+r} y
GARCH(r,q) coinciden.
fi.
EL MODELO ARCH EN MEDIA: ARCH-M
EI modelo ARCH-M [Engle, Lilien y Robins ( 1987)] incorpora el supuesto
adicional de que la varianza condicional del término de error influye en cada
período sobre el nivel de la variable que se pretende explicar, por lo que representa un nivel superior de generalidad con respecto a los modelos que hasta
ahora hemos considerado. Tal supuesto es muy apropiado en modelos financieros que traten de caracterizar la magnitud de las primas de riesgo de los tipos
de interés yt, definidas como la diferencia entre el tipo forward Ft y la expectativa
actual del tipo futuro Et rt+^. La idea es que siendo h; una medida de la incertidumbre existente en el período t acerca de yt, un mayor valor de ht supone, en
el caso de !os mercados financieros, un mayor riesgo, que podría aparecer
reflejado en una mayor prima al riesgo. Ello generaría una mayor diferencia entre
Et r^_^ y el tipo forward Ft que aparece a partir de la condición de ausencia de
arbitraje ( 3), por lo que la magnitud de la diferencia Yt = Ft -Et rt+^ dependerá, en
general, de ht .
Consideramos, por tanto, el modelo ARCH-M:
Yc = a + ^3 g ( ht ) + ^t
[38]
S2t_^ ^. N ( 0, h? )
^>
ht ^ ^D + S1 ^ Wi ^t i
,
(3) Según la cual Fc, en términos continuos, es la diferencia entre los tipos a largo y corto plazo
hoy vigentes en el mercado. Véase por ejemplo Ayuso et al. (1990).
"3:^3
r^^t,^it^^ F^ARA L^, E:^IiMa^,it^^r^ C^E^^ ^^^1^^^>f^)^^t^)^, t^,^^
donde g es una función continua y, por simplicidad, se reduce a una constante
el conjunto de las restantes variables explicativas. También se mantiene la
parametrización reducida de ht considerada en [13].
6.1.
Estimación de máxima verosimilitud del modelo ARCH-M
EI logaritmo de la función de verosimilitud del modelo [38j viene dado por la
expresión en [6] donde, en este caso, Et es una perturbación no observable, dada
por:
cc= Yc--a-R9 ( hi )
[39]
y ht puede escribirse como:
P
[40]
ht = bo + S^ ^^^ Yt-^ - a-- a 9( hi ^) 2
,
Si denotamos por 9 el vector de coeficientes a estimar: 9' _(a, ^3, bo, ó^), es
fácíl ver que:
^t
_2 . 2
1 ^ _ .21 __._-^ht + ---_
1 ^
_ _ .-_.
-^L
-- _ _
2^ ht ^6
^8
2 t( ht )
^^hi
^ct
^t
_..--._ _ ^ _ _2 ._._____
d6
ht
^
c^6
y, dado que, a partir de [39]:
^cc _
^8
el vector de derivadas primeras es igual a:
1
c^L _
^^ ^
1
2
t
1
ht2
1 _ ^^
ht2
^^ht +
f)H
^
^
^'t ^^g
( ht ) +
_` __
2
ht
^)H
^
t
^'t
ht2
g ( h^ )
0
0
^^ ^^
f ` ^ ^"+ í
y teniendo en cuenta que:
rlg ( h^ ) ^1h;
^)g ( ht 1
^IH
^)8
^
^lht
se tiene:
+
^)L ;
^ h2,
^)H
.
^Ft
^^g ^ h?
[41 ]
^^h?
donde ha que incorporar la derivada:
_ 2 b^
^^^; ^t_;
- 2 b1 Z u^i g( ht i^ f'c-^
1
St
En el apéndice, particularizamos la expresión [41] para algunas formas funcionales de g.
Para la estimación MV del modelo [38], Engle et al. (1987) recomiendan utilizar
la sugerencia de Berndt, Hall, Hall y Hausman (1974), tal y como figura en [36].
La matriz de covarianzas de los correspondientes estimadores es:
var(8)= ^
^L
^L ^
^ .._... ___ _._
^
^e ^^e^
que, a diferencia del modelo ARCH simple, no es diagonal a bloques entre los
vectores de coeficientes de las ecuaciones de yt y ht , por lo que en el modelo
ARCH-M la estimación de estos vectores por separado no es eficiente.
Debido a esto, la estimación del modelo ARCH-M no puede descomponerse
en las etapas propuestas para la estimación del rnodelo ARCH de regresión. En
el modelo ARCH-M, los parámetros de la ecuación de regresión y los de la
estructura ARCH de las perturbaciones deben estimarse conjuntamente, existiendo una complejidad adicional para evaluar el vector gradiente ^^L/^^H en cada
iteración. Ello se debe a que, como puede apreciarse en la expresión [40], hi
depende de sus valores pasados ht ; para i^1,...,p. Por lo tanto, en cada iteración,
ht debe calcularse recursivamente a partir de p condiciones iniciales en las que
^'
,
,^
^
^, ^ ' p. ,^1 r^ +`
^
"." ^^ ^^ f ^ f .
i".^
se supone que [3=0. Una vez calculado h^ es inmediato evaluar ^, a partir de [39].
Teniendo esto en cuenta, el algoritmo en [36^ se itera hasta alcanzar convergencia.
?.
COAAENTARIOS FINALES
En este trabajo se ha presentado una revisión de las posibles formas de
modelizar la presenc^a de heteroscedasticidad condicional mediante formulaciones autarregresivas (ARCH) y autorregresivas generalizadas (GARCH). Las principales cuestiones metodológicas que se han tratado en 1as páginas anteriores
son
(i) Ignorar ia presencia de heteroscedasticidad condicional conduce, en el
mejor de los casos, a una pérdida de eficiencia en ia estimación de 1os parárnetros del modelo. Si en el modelo aparecen retardos de la variable endógena como
variables explicativas, ocurre además que las estimaciones de los errores estándar de los parámetros estimados no son consistentes.
(ii) Para detectar la existencia de estructura GARCH, el contraste de los
multiplicadores de Lagrange es un instrumento útil y de fácil aplicación. También,
el examen de las funciones de autocorrelación y de autocorrelación parcial de
las observaciones de la serie al cuadrado ( en un modelo univariante) o de los
residuos MCO al cuadrado ( en un modelo de regresión) es de gran ayuda para
identificar el orden de la estructura GARCH.
(iii) La estimación consistente y asintóticamente eficiznte de este tipo de
modelos debe lievarse a cabo por rnáxima verosimilitud, lo que conduce a un
problema de optimización no lineal. En un modelo de regresión con estructura
ARCH o GARCH, la estimación por separado de los parárnetros de la regresión
y de los del modelo de la varianza condicional de las perturbaciones es eficiente,
ya que la matriz de información es diagonal a bloques. Sin embargo, este
resultado no es aplicable a modelos ARCH-M, donde la varianza condicional
también influye en la variable que se pretende explicar y en cansecuencia, la
matriz de información no es diagonal a bloques.
En este trabajo, hemos intentado contribuir a facilitar la programacián del
algoritmo de «scoring» paa la estimación MV de los parámetros de distintos
modelos con estructura de heteroscedasticidad condicional. Pensamos que dicha
estimación puede Ilevarse a cabo, por parte del usuaria, de forma relativamente
sencilla con un lenguaje de prograrnacián estándar.
r^L .
[. ^...:
r J^^1 L.1
^) T^, ^{ ^
APENDICE
En este apéndice se particulariza la expresión [41 ] para algunos casos, según
la forma funcional de g:
--^
(i) g(ht )-ht
^9 ( hi
c^ht
P
2
b 1^ UÍ ^ t-I
1
1
P
^^L i ^ 1
^39
^ ht
1
2
_ 2 S 1^ U} ^t_i h? i
1
ht
£t
0
1
0
St
)
1
^g ( h^ __
)_
---^
9 ( hi ) = hc
2^1 ht
^^hi
^
- 2 ^ 1 ^ ^i £t-i
,
P
2
E^
^8
^ ht
,-h^2J
_Et-2ht
- 2 b 1 ^ ^i ^c-i ht-i
1
1
ht
0
0
St
(iii) g(ht)=1nht
--^
^
- 2 ^ 1 ^ ^i Et-i
i
P
^L = ^ _1_
^8 ^ ht
- 2^ 1^, ^i ^'t-i I n ht i
+p ht2
1
St
1
In ht
0
0
£t
^ ^ ^ ^ i^^
i^^ F^^^J'^
^
!(?ri a
l Fi f;^:^3 ^ l^ff^1^^
' ^ L^
... 1 [„
r^e^,
,
i^;r . ^
;-
^',^::^
^ . ^;
^ ^ l^
REFERENCIAS BIBLIOGRAFICAS
AYUSO, J., NovALES, A. y M. L. DE LA ToRRE ( 1990). « ^Incorporan los tipos del
interbancario una evaluación del riesgo?». FEDEA, Docurnento de Trabajo
90-08.
BERNDT, E., HALL, B., HALL, R. y HAUSMAN, J. (1974). «Estimation and inference in
non linear structural models». Annals of Economic and Social Measurement,
4, 653-665.
Box, G. E. P. y JENrc^NS, G. M. (1976). «Time series analysis forecasting and
control», Holden-day, Inc.
BOLLERSLEV, T. (1988). «On the correlation structure for the generalized autoregressive conditional heteroscedastic process». Journal of Time Series Ana/ysis,
9, 121-131.
BOLLERSLEV, T. (1986). «Generalized autoregressive conditional heteroscedasticity» . Journal of Econometrics, 31 f, 307-327.
ENGLE, R. (1984). «Wald, likelihood ratio and lagrange multiplier tests in Econometrics», en Handbook of Econometrics, Griliches Z. y M.D. Intriligator Eds.,
2, 776-826.
^NGLE, R. (1983). «Estimates of the variance of U.S. inflation based upon the
ARCH model». Journal of Money, Credit and Banking, 15, 3, 286-301.
ENGLE, R. (1982). «Autoregressive Conditional Heteroscedasticity with estimates
of the variance of United Kingdom inflation». Econometrica, 50, 4, 987-1007.
ENGLE, R. y BOLLERSLEV, T. (1986). «Modelling the persistence of conditional
variances». Econometrics Review, 5, 1, 1-50.
ENGLE, R., LILIEN, D. y RoBBiNS, R. (1987). «Estirnating time varying risk premia in
the term structure: The ARCH-M rnodel». Econometrica, 55, 2, 391-407.
WHITE, H. (1980). «A heteroscedasticity consistent covariance matrix estimation
and a direct test for heteroscedasticity». Econometrica, 48, 817-838.
SUMMARX
A GUIDE TO ARCH MODELS ESTIMATION
This paper presents a review of the autoregressive conditional heteroscedasticity models, focusing on their maximum likelihood estimation. The following formulations are considered: the univariate ARCH
process, the ARCH regression model, the generalized ARCH models
"i^?
^
! .,"
^., .
'i
4
. ,,^ ,^^^^,
(GARCH) and the ARCH in mean specification (ARCH-M). For each
formulation, the analytical expressions for the gradient and the hessian
are derived. This is the main contribution of the paper since these
expressions are not sufficiently explicit in the literature. In addition, the
statistical properties of these models, the testing procedures for conditional heteroscedasticity and the model identification strategy are
summarized.
Key words: conditional heteroscedasticity, maximum likeiihood estimation, identification strategy.
AMS Classification: 62M 10, 62P20, 90A20.
ESTADISTICA ESPAÑOLA
Vol. 35, Núm. 132, 1993, págs. 39 a 86
COMENTARIOS
ANTONIO GARClA FERRER
Y
ARANZAZU DE JUAN FERNANDEz
Departamento de Análisis Económico
Universidad Autónoma de Madrid
RESUMEN
EI presente comentario expone los principales problernas que pueden aparecer a la hora de identificar, estimar y verificar efectos no
lineales en variables económicas, fundamentafinente proporcionadas
por el mercado financiero. Para ello, se utiliza como ejemplo los
problemas encontrados en la modelización de tales efectos para tres
series de tipos de cambio del mercado de divisas español. Surgen así
tres tipos de problemas, dos estrechamente relacionados con la correcta especificación del modelo, siendo la omisión de variables relevantes y la modelización de valores atípicos las principales fuentes de
probiemas en este tipo de modelos. Finalmente, se plantea la interpretación económica de estos modelos como uno de los objetívos
fundamentales a la hora de estimar modelos no tineales.
I.
INTRODUCCION
EI trabajo de los profesores A. Novales y M. Gracia-Díez supone una importante aportación de cara a la estimación de las modelos ARCH y sus derivados
(GARCH y ARCH-M) por dos razones fundamentales. Por un lado, la frecuente
utilización de estos modelos aplicados a los datos proporcionados por los rnercados financieros ha provocado que la mayor parte de los programas estadísticos
incorporen rutinas de evaluación numérica para la estimación de estos modelos.
Sin embargo, tales rutinas se han centrado fundamentalmente en los modelos
de heteroscedasticidad condicional autorregresiva más sencillos (ARCH) c^n una
menor cobertura para la estirnación de modelos más complejos (GARCH y
ARCH-M). Por ello, el trabajo de los profesores Novales y Gracia-Díez supone
un gran avance en la estimación de este tipo de modelos debido a que desarrollan
con extrema claridad los pasos necesarios para la estimación consistente y
asintóticamente eficiente de máxima verosimilitud de los modelos de heteroscedasticidad condicional autorregresiva.
La segunda razón que revela la importancia de este trabajo es que los autores
realizan una cuidadosa recopilación de los procesos de identificación, estimación
y verificación de los modelos de heteroscedasticidad condicional autorregresiva,
recopilación inexistente hasta el momento. Los trabajos relativos a este tipo de
modelos se centraban en un análisis teórico, sin excesivo detalle, de un determinado modelo (ARCH, GARCH o ARCH-M) y una aplicación empírica de éstos
a datos recogidos principalmente de los mercados financieros. Por ello, pensamos que este trabajo supone una aportación importante al haber incluido los
autores tanto una excelente revisión teórica de los modelos como la derivación
de las expresiones analíticas del vector gradiente y de la matriz hessiana, que
posibilitan la prograrnación y la estimación de forma eficiente de estos modelos.
Dado que el trabajo recoge prácticamente todo lo relativo a los modelos
teóricos, nos gustaría concentrar nuestros comentarios en los problemas que se
pueden plantear en las aplicaciones empíricas realizadas con éstos, centrándonos principalmente en la correcta especificación de los modelos, antes de pasar
al análisis de la estructura de la heteroscedasticidad condicional autorregresiva
de los residuos.
II.
PROBLEMAS EN LAS APLICACIONES EMPIRICAS
DE LOS MODELOS DE HETEROSCEDASTICIDAD CONDICIONAL
AUTORREGRESIVA
La enorme aceptación que han tenido los modelos de heteroscedasticidad
condicional autorregresiva durante los últimos años ha Ilevado a que numerosos
autores se hayan lanzado a la aplicación de estas técnicas a todo tipo de series,
principalmente diarias y semanales, relacionadas con los mercados financieros.
Ha sido tal el número de artículos publicados en torno a estos ternas que se
podría decir que se ha convertido en una «moda» estimar modelos no lineales,
fundamentalmente del tipo ARCH. Sin embargo, hay razones para pensar que
se ha producido un cierto abuso de estas técnicas y que no se han seguido los
consejcs dados por Engle (1982) cuando alertado sobre la posibilidad de que,
en ciertas ocasiones, la aparición de residuos que presentan heteroscedasticidad
(^^.r_)ME^-r^^JT^F^^<^^^
41
condicional autorregresiva pudiera deberse a un error de especificación del
modelo. De hecho, Engle aconseja que, en tal caso, el procedimiento correcto
sería corregir este problema y, posteriormente, verificar si la estructura ARCH de
los residuos persiste. Este hecho se pone de manifiesto en Lamoureux y Lastrappes (1990) quienes encuentran evidencia de estructura GARCH en los residuos de un modelo para la rentabilidad de 20 acciones del CBOE (1). Sin
embargo, al incluir el volumen de negocio ^omo variable explicativa, los residuos
de la estimación de este modelo no presentaban evidencia de heteroscedasticidad condicional autorregresiva, debiéndose pues la estructura GARCH a la
omisión de una variable relevante.
Nuestra experiencia con estos modelos también nos Ileva a buscar una correcta especificación del modelo antes de recurrir a la estimación de modelos no
lineales. De hecho, en el análisis de tres tipos de cambio diarios de la peseta
frente a tres de las más importantes divisas negociadas en el mercado español
(Dólar norteamericano, Marco alemán y Franco francés), surgen dos causas de
errores de especificación que, sin su corrección, nos habrían Ilevado a la estimación de modelos no lineaies, a nuestro parecer, de muy dudosa interpretación
económica, tal y como ocurre en Peña (1989).
La primera fuente de errores de especificacíón en este ejemplo que estamos
comentando es la no modelización de los valores atipicos que presentan las
series. En el período muestral objeto del estudio (1 de noviembre de 1987 a 30
de noviembre de 1988) se identificaron gran número de valores atí picos, todos
con causas conocidas [de Juan (1993)] que, distorsionaban de forma importante
las funciones de autocorrelación simple y parcial, herramientas utilizadas para la
identificación de los modelos de heteroscedasticidad condicional autorregresiva,
tal y como señalan los profesores Novales y Gracia-Díez. Esta distorsión se
aprecia claramente en la tabla 1 donde se recogen los valores de las funciones
de autocorrelación simple y parcial para los tres tipos de cambio sin y con el
análisis de intervención. De hecho, numerosos autores [entre otros, Chang
(1982), Tsay (1986)] pusieron de manifiesto esta distorsión que también se
aprecia en las principales medidas estadísticas que han servido de base a
numerosos autores para decidir acerca de la presencia de modelos no lineales.
En la tabla 2, se presentan las principales medidas estadísticas de los tipos de
cambio sin y con el análisis de intervención a partir de las cuales cabe destacar
la importante reducción de la leptocurtosis al realizar el análisis de intervención,
característica que presentan las variables con efectos no lineales, así como una
mayor simetría en la distribución de los tipos de cambio intervenidos con respecto
a las variables originales. Estas dos características (leptocurtosis y asirnetría)
presentes en numerosas series de carácter financiero han rnativado la modeliza(1)
CBOE: Chicago Board Option Exchange.
ción de efectos no iineales, principalmente ARCH y GARCH, sin que los analistas
atendiesen a las posibles causas que provocaban la aparición de estos efectos.
De hecho, los modelos univariantes estimados conjuntamente con las variables
de intervención [ver de Juan ( 1993)] presentaron unos residuos que no permitían
identificar de forma cíara un modelo no lineal excepto para el tipo de cambio
pesetas/dólar, como posteriormente cornentaremos.
La segunda fuente de errores de especificación encontrada en et análisis de
los tipos de cambio diarios fue la omisión de variables relevantes. En este sentido
y al tratarse de series de observaciones diarias únicamente se pudieron establecer relaciones con el diferencial de tipos de interés a diferentes plazos de
vencimiento (uno de los determinantes fundamentales de los tipos de cambio) y
entre las tipos de cambio verificándose el carácter dominante de algunas divisas
frente a otras. Los modelos bivariantes, presentados en la tabla 3, estimados
conjuntamente con las variables de intervención, generaron unos residuos que
fueron sometidos a un conjunto exhaustivo de contrastes estadísticos aparecidos
a lo largo de las últimos años [un breve resumen de estos contrastes puede
encontrarse en de Juan (1990)].
Los tests utilizados no buscaban verificar únicamente la presencia de efectos
ARCH o GARCH de manera que se permitía cualquier tipo de estructura no lineal.
Los resultados de estos contrastes aplicados a los residuos de todos los modelos
estimados se presentan en la tabla 4, donde destacan las siguientes conclusiones:
1)
Unicamente et modelo univariante [ARMA ( 1,1) con intervenciones] del tipo
de cambio peseta/dólar presenta evidencia de estructura ARCH como
máximo de orden 3.
2)
En los casos de los tipos peseta/marco y peseta/franco, tanto en los
modelos univariantes como en los bivariantes, se rechaza la estructura
ARCH en los residuos, apareciendo únicamente en el caso del franco
efectos bilineales cuyos órdenes no permiten una interpretación económica adecuada.
3)
En el modelo bivariante entre el tipo de carnbio peseta/franco y el tipo de
cambio peseta/marco [modelo (B-3)], los contrastes rechazan mayoritariamente la presencia de estructuras no lineales, con la excepción de un
modelo bilineal no diagonal con retardos 8 y 12, planteándose de nuevo
el problema de la interpretación económica de este modelo.
De esta forma, desembocamos en e1 último problema que creemos merece la
pena destacar y que debe estar presente en todas las aplicaciones empíricas de
estos modelos: su interpretación económica. No podemos alvidar que somos
economistas y que estos modelos, si bien mejoran la eficiencia de nuestros
;!r,F^;^
estimadores, presentan en numerosas ocasiones una interpretación económica
muy dudosa, de manera que en estas situaciones, el procedimiento correcto, a
nuestro juicio, debe seguir los siguientes pasos:
1)
Realizar la estimación del modelo, ya sea de reg^resión o univariante, sin
error de especificación.
2)
Identificar los posibles valores atípi^os a través de los residuos, buscar
sus causas y analizar el esquema de análisis de intervención [Box y Tiao
(1975)] correspondiente en cada caso.
3)
Estimar conjuntamente el modelo con las intervenciones necesarias.
4)
Identificar los posibles efectos no lineales que puedan aparecer en los
residuos.
5)
Si los efectos no lineales tienen un significado ecanómico válido, estimar
conjuntamente todo el modelo.
De esta forma, se tendrá que el modefo no lineal estimado reflejará con
bastante probabilidad efectos no lineales reales y no provacados por omisiones
de variables.
Finalmente, únicamente nos queda felicitar de nuevo a los autores por la
importante aportación que realizan al campo de la identificación, estimación y
verificación de los modelos de heteroscedasticidad autorregresiva condicional,
Ilenando un vacío importante en este tipo de desarrollos.
REFERENCIAS
Box, G. E. P. y T^AO, G. C. (1975). «Intervention Analysis with applications to
Economic and Environmental Problems». Journal of the American Statistical
Association 70, 349, 70-79.
CHANG, I. (1982). «Outliers in Time Series». Ph Dissertation. Universidad de
Wisconsin, Madison.
ENGLE, R. F. (1982). «Autoregressive Conditional Heteroscedasticity With Estimates of the Variance of the United Kingdom Inflation», Econometrica, vol. 50,
n.° 4, julio, 987-1007.
DE JUAN, A. (1990). «Eficiencia del Mercado Español de Divisas: Análisis Mensual
y Diario de los Tipos de Cambio», Tesis Doctoral. Diciembre 1990.
DE ^UAN, A. (1993). «Univariate and Bivariate Analysis for Spanish Exchange
Rates», Documento de trabajo, DT-93 5.
4.1
^ _ t,^;ii^,,
..
LAMOUREUX, C. G. y L.ASTRAPPES, W. D. (199U}. «Heteroscedasticity in Stock Return
Data: Volume versus GARCH Effects». The Journal of Finance, vol. XLV, n.° 1,
ma rzo, 221-229.
PEÑA, J. I. (1989). «Análisis Estadístico de los Tipos de Cambio Diarios de la
Peseta», Cuadernos de opinión 3, Centro Internacional Car^os V.
TsAY, R. S. (1986}. «Time Series Model Specification in the Presence of outliers»,
Journal of the Arnerican Statistical Assaciation, vol. 81, n.° 393, 1321-141.
. j ^^-,
t ^^ J ",+ ^^ r , ^ :'. F,
c
N ^
^ ^
•cú a^
c ^
CD f^- O d' ^f7 p 1^- ^?' f^ N 07 00 ^-- ct N Q) C3^ cr7 r... f^- M 00 f`^- ^cCO f^- tI^ ^- N p h- M^ r- oO ^-- 00 N^t fTi CT) ^ r- CC7 c^7 O d' O
Cf^ ap ^- p^ ^f7 ^p ^t h- pp M O^ I'^- c'^ N N t,c^ ^^.^- t.f) C70 r p N
ct ^ Op ^-- O pp Q^ N^ CO ^f t` ^17 N O^ r- N h- r.. N^- N Q^ p -^
O r-MC3^ O M N ^t ^C ^N1^ -N O ('^OOQ) r- h- r- ^O ^
p r-O©00©OOO p O ^-- Or- O
^000^^-^.
^.
^. ^.
^.
^. OO
^.
•
,.
^
U
Q
^
LLLL.
(
^
^0
^ N
c
Ú^ C
LL
^
^
U
C
.p
N'
^
U
Q
a-
o^?ooooo^?o^-^?ooooo^?^?r-ooooo
^. ^. ^. ^.
^.
^.
^.
^. ^. ^. ^.
^. . ^. ^.
^ a^
C ^
{^ '
a^
^-^U
O r r- f^- f^- f^ M^t ti N^t O^- W^ 00 ^ O o0 CD 1^- N 1^- qp
O") C^ I^- ^.f ) 1^- CO r ti ti. N 1^- O N pp ^c- p^ O e^ DO e- O lf ^ ^^^ N^ a0 M CD CO M O 00 N 1.f ) M O ln 00 r^ ^- O(p O 1` ^
COMONr-^NO•^^CONCV ^NCOoOMMMp00Map
Z3
CD N QO ^!") O CO h- ^t Q^ r-- M^t' f^- Q) f^- ^ Cfl a0 M Cn c,p ^t f^ C^
cD ^ C7^ cD ^7 c•. Q^ N r... c^ M a0 CO r- ^f ^- ^t ^:7 cD ^t op ^-- O^ (^I
C^ oO N C4 r- CD tl7 I `+ l,n r- aD l17 ©^ O pp CD O(^,^ ^t ^ N C7 t.C)
^ l.C) QO r O Cy ^ l . f ^ ^ ^-- tf ) O C7 p e-- Cp O r-- Cp f`^- (y ^ Q^ O
O r M C3^ r M M l.( ) M l17 ^ -- UO r- ^ Q' ^ p O N C.,7) (V lf 7 r -' (p
OOOODe-OOpr. ^,
^, ^,
.
.
.
. OOOpOpOOpO
.
.
.
.
.
^,
^.
.
.
^,
^,
.
^_ r-O^--O
^.
.
^.
Q
O
^
^
^
27
°
^o.,
OMOOONC?^Ot^f^^pOoOr-(V ^tf^ h^-^^CDD ^t^ON
Q^Nh-^NCD^^OQ)O)^ d`aQr-^f}GOMQ00 NNMC^
^^ ^
;^
^
c Z
^
^^O^y^h-el!')M^7`QOe-CVOOOapNMN(yr-^--r
00 M a0 t .C) ^ N `r ^ N p r" ^ c ^ N O r- ^^-' ^ -- ^ Q U C^ O O
e-Nl^r-^ft17^ONr ^ti r-^tNe--OMMN COO^aO
^-- N^, r- tn ^t ^ f` ^- O^O f^- ^ t.C) M N O^ p t.f) ap N tn Cp
Q
OQ©OOOQpOr
00000000r--O
^. ^.
^^,
.
.
.
.
.
. pOOp
.
^,
^.
^,
.
.
.
^,
^, ^.
^,
^,
^.
^
^ .p
^
U
Q
Ñ
^ ^^
a
-cv a^
c Z
^
^ N
p
-U N
^
LL.
C„ )
Q
^
^: p
Q
^
a
^
^
_
- ^
.^ a^
c ^
^° ^
^-
C]
^
p
^
N^y CO b- N p CD ^y ^ C7^ C^0 r-- ('n t;f') <-- ^- O^-- ^t O) d' I^- M t.C)
^-- M I^•- ap N p O O P- O M p^- .- O'^ p^ M r-- CO O M^ N O
^,f- O^ ^ CO t- OC) M N^ 1^- ^ t.C) ap O M(y O I^ N C.^ N M f`
^ c^ r- c^ O•ct ^t p CD Q^ t . f) p N N^- .- op ^ I^- M O.-- O CO
O(y00^00^pe--pCDOrCOOlf70NN0(h^MMMeO p O p O p O p O O O p O p O p p O O r- O O O O
^^
^^
^^
^^
^^
^^
^^
^^
MN^CTNN^COt'7^ COI^.CO(`70NM^d'r (rlNC"^^
(V ^ M t17 p) r CO r-- ^- 1` Cn I„() .- p 00 CO p CO ^ O ti M^p O)
M r r Cn O CD t^7 M tn ^ O ll') O^ O c'^ pp CO M^- d- O^ M 1^^ CD CO i. f^ QO ^ 00 O 0^
^t (' V M O tn C^1 O ^O ^t ^ C3^ N (11 rCO p^ d ' Cn O r N O') O 1^- ^y M ct c^ e- ^ c^ p ^- t,n M ^ O
p OO
. . ppr--00©^-O
. . . . . OOO OO
. . p O. r-O. p O p O.
^
^ ^
^ '^
Z7
^
^ -p
^
opooo©ooooopooooooo•--oooo
. .
^.
^.
^.
^.
^.
^•
,•
^ ^
c^U
t^
E.^q
N N N^p I^- t.() 00 ^- N O N t,f^ ^ p^ ti Q^ a0 00 O lf^ CU O^
r^ M CD ct ^-- O h.. CO N CD ap aC7 ^ CD C^ M^ N^ C'^ OO O^ ll^
^^ N M O(^ O^^ 00 lf ^(^ i^- ^p 00 .r- M^- ^-- ^ O I^- t.C) ^-NI`--r-CO
M N ^ CO t,D O ^y ©C3')^ r-N (y © M COoOC7
O N 00 ^ 00 ^ M^y O^ i^- c'^ ap O ti o0 M O d' ^ N^t ^^-- N
^
.^
C
^
^
^
^
^
^
Ú'^
^
p
^
^
Ú
^
^
^
^
^
^
^
^
^
^
^
^
c^ ^^t f^- O^ M O^ c^0 Ct7 f^- O^^t N O N CO r- O^ c^ O f` ^-
N^ON^No00oOCD^d-rO00ctM ^`'-Oti^M^N
MN^^NCD^C77Cnr r--MOO^ONCOOI'`N 1f^000
t^ - ^^^ ^OMd'M^d' ^fi 0 ^ 0 ^0
^ O+:t r-p(V
Cp ^-- ^t tl^ Q'^ Cn N C^ O O 1^- .- c^7 ^ O N^t r` h^- ^^fi N ^!7 O
p O O p p p O O O r- O O O O O O O ^ O ^ O C? O O
^'
^'
^'
^' ^'
^'
^'
^'
^'
^'
^"
^'
^'
^'
^
U
Q
^
U
Q
a-
uU
^[
Ú
^
^ :Ó
Q
a
i=
_^ ^
.^
a-
•
t- Q^ d' O N r`- CD O ti r d' M I^ N CD M^ CD ^- t-- 00 O I^ N
OO^^NM^N^^CDOr-C^r-QOONOttCOMMcf ^-CU M p^ f^- ^- Cn pp f^- t1^ 00 00 CO N N O r M r- N N ^t M t-- ct
O^rC701`^CO(^ODOOOCi70r-f` lnoO^Nh-CDOOO
^ O l,n^--^^t p d'O r {V ^-O r f`M O O MIf^N ^ ^1 ' 3N
O^OOOOp00^-OOOp0000000^00
^•
^• ^•
^•
^•
•
•
^^
^•
^• ^•
^•
^•
^•
tf 7
.-- ^ Op r pp ^^-- M•^-- CO ^ 1^- Q) ^- l17 00
r
O
oO^C3^oOf^-n10^d'O^^t.-chMríNCO^^^^^0
CO ^O f` I'^ l^ ^ N^(y ^ f^. ^ ^- r Ñ í`O r OM C^ C^ tT CN M IN
M
^
^
^ a0 0^ 00
M o0 h ^
^
O
^t
1`^ O CD O^.C) ^ r-- CD O C^1 O M r- O CD M O ti d' N N r- ln r
O^
O
^ O
^©^
O
0 ^ O
^©
^. O
^. O
^.
^.
^.
^. ^ O
^.
^ . O©
^. O
^.
^.
^ . ^©
^. ^
^.
OpNOMOInOMr1^C^NMNN^`-d''r-r-opNO^M
^- l.C^ ^- Cp ^© Cp ^ O f^ r 00 ^ C7^ O) Ch O d` r- M r-- ^ CU M
Q) ^t7 ^ c- CV I^- r.. N ti r- ^- Cn t^ pp O P^- O^ O) 1^. 00 C^ O^('7
pN^`-^t^t^c^^to0No0Cn^^,COd ' OOr--Q7CC^^
N
lf') ^ I^- M d' N M ^1 O r- r 00 ^ p ^f7 CO CfJ CD (,^ r- r ('7 O (V
o,,
o.
ooo
^, ^. ^.
o
p^.
oor-ooo
. . . . .
^,^.
oooo
^
-
o00000
^. ^. ^.
^.
c
^ ^
c ^
^ -^
^
l.1_
U
Q
Y
OrO^^--M^oO^tMCDo(^tOp^CGN^NO0o^r000
e--^MM^-Nr•.©MNN^f7^-MCD^f7NdrCpP•.1^.^ctN^17
p^CDO^-^M^y^00f`^DOMNMOC3^^}-p'>tpf^-ON
Cfl ^^- c`'7 f^ M r- 00 tT t)O CO O CO O 00 M CO M CJ^ I^,^ 00 O C7^ CO
ln^t00N^tM^c'^o000o00r-C'^^^t'CO^0O^00
O 0 O O O ^ O O O r C^ O O p O O O O p p p O O O
^. ^.
^.
^.
•
^.
^. ^.
^.
^.
r-NC'^d'I.nCDti OOQ)OrNMd'tl7COf`OOOO+r CyM^
^-- t- ^- r s- r r- r- ^-- r- N N N N N
Í
I
;
O
^7
^
^
r
^
O
^
M
>
tv
.-.
^
O
Ó
M
O
O
O.
Ñ
^--
^
^
M
c3^
O
o
^
O
O
tn
^
O
O
í^
^`
N
O
c
^
w
^
©
^
O
O
^
©
.-
O
^
00
N
©
O
Ó
o
a
^
O
O
Ó
O
N
N
I
^!7
O
CO
N
^
^
Ó
o
^
O
M
O
N
Cn
O
^7
^
^
^
^
^
^
^
°
O
tn
^
^
C
^
^
0
(n
^
^
Ó.
O
O.
O
^
~
°
^
O).
O
M
O.
O
M.
O
^.
O
^
^-r-
r-
o
°
o
0
0
M
CD
`^
O
^^
M
N
^
^
^.
^
O
O
O
O
O
Cn
^
O
^
I^
'
^
O
M
cD
ln
O
O
o0
O^
I`^
^t
O
^
Ó
.
^
O
O
O
O
O
c^
^t
^
O
O
M
O
t`7
O
O
N
a
J
^
Q
^
°
^
p
^
•r-
^n
00
^-O
O
^t
M
r-o
^n
r7
©
^CO
Qj
0
^
Q?
N
^;
tl')
N
ó
^
^^
^
^
N
CO
^
N
N
^.f)
_
ct
tt^
^
^
^
O
C7
N
O
t^
C3)
N
^
^I
Ñ
^
Ó
O
^
^
^
O
N
N
^
Q
Ó
O
Ó
O
Ó
O
^
^
.C
`S
C
(p
•
^
^
^
^
'X
O
C^
C
^p
^
^
^
C?
Q
O
-p
c
N
^
_N
^
^
^
N
°
p
.
^ ^
^
O
c^
^,17
^
^--
M
^
^
o
I
C
^p
:D
^
^
o0
^j
N
I
^
c^
^p U
-p ^
^ =p
^
N
^
N
Z3
Z7
^
^ •^
C ^
^ ^
•
^
^ Ú
N
C
(p
.^
tLS
,^ ^
^ ^
^
'j .(p
^ %
^ •O
C '^
^ ^
•
4=. (^p
^ ^
C ^
^
•
^
^_ ^ ^
>
^ ^
O ^
O ^
O
U
U
U
^
^
^ ^^^ ^ r , r : ^^ ^
^ll
rn ©
O R-
^^
_v C
^t--
CD
^--
N
^
^
^
LL,J
II
II
.-^ .-^
N^t
r-- N
,.^- •,...
11
!I
^-•. .--.
N Q'
^-' N
..^• ....-
f^
II
^-•.. ..-^
N ct
r-' N
^ ...^
^ d
^ ^
^ ^
^
C7
r-
^
^
^,;
^
^
^
^
m
(^
N
N
^-
N ^
•-- cv
O^
N
c'7
r--
^--
'^ ^
P-
O
O
L
^
CO
C3^
O
C^
4D
O
O
^
N
o0
M
N
M
OO
N
^
F-
c^
ap ^
^
^ cY7
00
Q)
^
pj O
-rs
,I
o
^
Ó
^
0^0 ^
^
O
MN
ca '-''
ó
^
cn
Q
;^,
^
.0
O
I
^
^p
Q p^j a^0 c^
O CO N aU
p O Z 07
^p o N ^
^
^
^ ^
^^
^^
Ó ^
^^
O
-^oO
^
^ O
^
O
N
^
cn
^
^+
p
:.^
o
Ú
^
-p
^
+
ó^
^..., ^..
cn--.
M^
O
^
ÑM ^ ^
^--' QO
-^ ^ N^
00
o0
^^
,^ tV
N 0
V- N
^O
ppj ^
O
O
MO
^^
.
O
I
I
^00
^
a0 ,...,
`_ ^
^©
O
p
00
Q)
^Ñ
^
^
O
~
^ ©
QÑ
CO
^ 0
`--`..
O
O ^
^ ^
^?
^ ^?
M ^
°O .--.
00
O
_ t^-
^
^
^ ty
^
^f`^ CO
O
i
p
Ll„^
^• O
^^
c.^o
^ c`n
?
M p
^
^
+
o0
^
O^
-.^
r.oo ^-,
Cl
},
^-- ^
r
0 O'^
N O
o0 Ó
ó `'^
o,--. c^0
MM 0_p^
N ^
p ^
00 00 O
r- 0 ^t 0
.
d' ^.... CO O
^
M
O
O
-f-
I
ap
o0
00
^ j Q,.-^
Z ó.
Ñ Ñ
CfJ ^?
4) p
O^
O
^,..^
^ O
N C3)
-^ N
I
Ó^
°.^
^
+
ap
^-j
pp O p^
cn
c/^
O
^
07
M
oO
.N
^
O
(V
^ O
^
N
0
CO p
ó .^.-.
.
O
I
op
„_.,
f`^ p^
p ^
^
^ ,,,^
.^ ^-M ©
O
O
c^M
00 O
p^
•
I
ap
^
r- o
°° ^
n. ^n
^
00
a} ©
(nN
I
^
^
^^
(Ó
^c^
„-.
._
'
I
^
DO ,.^
^,
.^.._ p
[] Ñ
pp
^ O
QN
^-- O
CD ^
0..,^
O
I
a0
^ ,^
^"
O
N
^ j
r. p
^- ^-'
p
©
O
+
^
^
.^
+
QO
^
^U
N
Q O
OO
.
r-
.-.
^
c° Ó °
0 `..- +_
^ O'
p
I
I^00 ^
I
ó
^.
o
00
c .-..
+
^ ^-^d_'
^
^
t0
U
^
Zy
^^
CpDO
O
Z N
Ñ p
~o
O^.Cj
,(n
O
Q
M p
^~-'
^
I
^
..,=,
^
I
.^
..^
o
cO
,p
+
©
P^ ^
^, ^
^ ^
^
-^-
Q
^
a
Q ^ ^ O
_
^l M
Q Ñ
Q N
^1 ..--.
N
^
NO
^O ^p
O
p7 M
,p^,N
o00
cv
C
N
^ Ó
Q Ó
c'^ ^
O
~ O
©
©^
O O
N
^O
p.
^©
^^
^ ^-
^^
c'7 O
^
^
ZO
^ O
O
N^
^ ^....
O
O
©^-j
•L
+
O
^
Q
-+-
^O
M O
O
N O
O ti..
^,.,^
M
m
C
-}-
^
-+-
^t ^
O
O
-^-
I
+
I .,..-
I
(D
^
II
Ó
<l
^
^
.--^
^-`
II
^
<1
^ O ^-..
(U ^
^
^ ^ m
^ O
^ ^
^ ^
^.-..
N
m
`-^
^
^
^,O
p ^..-
'C
O
j
^
II
O
^1
©
^
^
N
^
^
O
U
C
^
,-.^
N
^
ll..
^ ^
TA B LA 4
Resultados de los tests de no linealidad
T^po de
cambio
Pta/$
Tipo de camb^o
Pta/DM
Tipo de cambío Pta/FF
( U-1)
(U-2)
(B-1)
(U-3)
(U-4)
(B-2)
(B-3)
GrangerNewbold
NL
NL
NL
NL
NL
NL
NL
Maravall
NL
L
L
L
NL
L
NL
McLeod-Li
L
L
L
L
L
L
L
L
L
(lineal
excepto
L
(lineal
excepto
L
(lineal
excepto
L
Modelo
Test
Keenan
Bilinear
* diagonal
L
NBL
(excepto
L
NBL
NBL
y super
diagonal
NBL
NBL
i=5,j_g;
i=6,1=10).
ARCH
ARCH
para p< 4
NBL
(excepto
NBL
NBL
NBL
* sub
para
M^ 2'3)
7,9,10)
NBL
NBL
para i= 3)
para i =. 9)
(excepto
para
i=8,j=9;
para
M- 2)
para
M = 4,5,6,
NO
ARCH
NO
ARCH
NBL
(excepto
(excepto
para
para
i=1,j=2;
i=9,j =12)
i-=1,j=2;
i==3,j=-4;
I =fi,j=7;
i=8,j=9)
NO
ARCH
NO
ARCH
NBL
(excepto
para
i=1,j=2;
NBL
(excepto
para
i=6,j=7;
i=8,j=9)
i-8 j_12
- )
NO
ARCH
NO
ARCH
NL: Efectos no líneales fueron detectados
L: residuos son lineales
NBL: residuos no son bilineales
Modelo {U-1): Modelo univariante estimado para el tipo de cambio Pta/$
Modelo (U-2): Modelo univariante estimado para el tipo de cambio Pta/DM
Modelo (U-3): Modelo univariante estimado para el tipo de cambio Pta/FF
Modelo (U•4): Modelo univariante estirnado para el tipo de cambio Pta/FF
Modelo (B-1): Modelo bivariante entre el tipo de cambio Pta/DM y el diferencial de tipos de interés
Modelo (B-2): Modelo bivariante entre el tipo de cambio Pta/FF y el diferencial de tipos de interés
Modelo (B-3): Modelo bivariante entre el tipo de cambio Pta/FF y el tipo de cambio Pta/DM
(^ OM1^^f h^^^T^A^I^'^^:.y
J. DEL H^YO
A. S. MARTIN ARROYO^
Departamento de Análisis Económico,
Facultad CC.EE.EE., U.A.M.
RESUMEN
Es bien sabido que el Talón de Aquiles de la Econornía Cuantitativa
lo constituye la especificación inicial del modelo, que se supone reúne
las características esenciales del sistema que se estudia. A medída
que se estirnan modelos que involucran datos con gran contenido
dinámico, la especificación de la parte sistemática se revela muy
precaria. Nuestros comentarios se centrarán en un doble aspecto. De
una parte, en rnétodos alternativos de estimación y, de otra, en la
verificación mediante estadísticos derivados de estimadores máximoverosímiles. Se propone el filtro de Kalman para obtener la función de
verosimilitud que posteriormente puede maximizarse por los procedimientos habituales.
Queremos en primer lugar agradeGer la invitación que la Revista Estadística
Española nos ha hecho para comentar el trabajo de los profesores Novales y
Gracia-Díez, en el que examinan la presencia de heteroscedasticidad condicional
autorregresiva (proceso univariante ARCH, modelo ARCH de regresión y especificación ARCH-M^ y autorregresiva generalizada (modelo GARCH), resumen
las propiedades estadísticas, contrastes y estrategia de identificación, y elaboran,
con especial atención, la estimación por máxima verosimilitud (MV).
Consideramos que dicho trabajo, de gran claridad expositiva, cumple perfectamente con el deseo de los autores, tal y como se recoge en ef propio título,
dado que será una guía útil para los investigadores interesados en el problema
de estimación y verificación de este tipo de modelos.
Nuestros comentarios se centrarán, después de algunas observaciones de
carácter general, en un doble aspecto. De una parte, en métodos alternativos de
estimación y, de otra, en la verificación mediante estadísticos derivados de
estimadares máximo-verosímiles.
Es bien sabido que el Talón de Aquiles de !a Economía Cuantitativa lo constituye la especificación inicial del modelo, que se supane reúne las características
esenciales del sistema que se estudia. En particular, se consideran modelos
especialmente favorables aquellos que resumen la información contenida en las
variables a explicar mediante dos partes aditivas. La primera parte contiene la
información sistemática asociada a un conjunto de variables explicativas, mientras que la segunda, denominada perturbación, resume la parte no sistemática.
En la situación más favorable se impone ortogonalidad entre los dos componentes; además, se procura que la perturbación sea ruido blanco con la finalidad de
que contenga la menor infarmación posible relativa a las variables que queremos
explicar y, naturalmente, porque ello simplifica en gran medida la obtención de
resultados estadísticos óptimos.
En un principio, ésta fue la práctica seguida y pareció dar buenos resultados
en los primeros modelos estimados con datos caracterizadas por su moderada
información dinámica. Sin embargo, a medida que se fueron estimando modelos
que involucraban datos con gran contenido dinámico, la especificación de la parte
sistemática del modelo se fue revetando como muy precaria.
En estas condicianes, parte de la información de la componente sistemática
pasa de forma tautológica a la perturbación y, por tanto, la probabilidad de que
ésta continúe siendo ruido blanco disminuye drásticamente.
La situación anterior se plantea con especial crudeza cuando se pasa a estimar
modelos can datos cuyo intervalo de rnuestreo es igual o inferior al mensual; por
ejemplo, con datos diarios u horarios y con modelos referidos a series financieras.
La forma que adopta la distribución del rendimiento de un valor se ha considerado
siempre un factor determinante del riesgo de una inversión. Si las distribuciones
de sumas de variables tales como cambios en los precios o rendimientos compuestos continuamente se aproximan a una distribución límite, entonces ésta
debe pertenecer a una clase estable de distribuciones de la cual la normal es un
caso especial. Además, aquellas distribuciones estables que sean simétricas y
no normales tendrán características leptocúrticas. En la literatura financiera, el mercado es quien valora la distribución conjunta de los precios en cada instante futuro
del tiempo con la información disponible en la actualidad. En este sentido, se dice,
si el rendimiento de un activo sigue un camina aleatorio (es decír, la mejor predicción
del rendimiento futuro es el rendimiento presente), entonces el tipo forward vigente
es simplemente el rendimiento esperado ahora sobre el período de mantenimiento
del activo (es decir, el precio se comporta como una martingala con respecto al
cs-álgebra generado por la partición en t del espacio de los estados).
La correcta especificación de un modelo requiere, previamente, el conocimiento de las leyes que gobiernan el comportamiento econórnico del sistema que se
va a modelizar. Además, en general, incluso si nos centramos en procesos
estacionarios de segundo orden, existe una multiplicidad de modelos que son
estadísticamente compatibles entre sí.
En concreto, para cada modelo ARCH(p) existe un modelo de parámetros
cambiantes que implica exactamente la misma pauta de comportamiento de las
covarianzas condicionales para la variable de interés.
^,^^E r^ ^ ;^ ^ .^^
Adernás, determinados modelos con parámetros cambiantes son equivalentes
a otros lineales con estructuras heteroscedásticas en las perturbaciones y que,
también, pueden interpretarse como modetos bilineales. Asimismo, si los comparamos con modelos univariantes, resulta que la función de autocorrelación identificaría un modelo ARMA(p,q) con parámetros constantes.
Un ejemplo de la primera proposición puede verse en Wolff ( 1987) donde a
partir del modelo ^^t = xt' Rt con ^ i^3 + ut y ut ^ NID(o, Q), se demuestra que, dadas las siguientes condiciones: (i) x' = (1 , ^.t_^, ...., ^t_p), (íi} ^3 = 0,
(iii) Q= diag(q?^ i= 0,..., p), entonces q? _^;. i= 0,..., p, los coeficientes de la varianza condicional. iEl análisis puede ser extendido al caso en el que las perturbaciones estén correfacionadas. Este método puede ser, por tanto, utilizado para
estimar perturbaciones ARCH en caso de que ias hubiere. De forma más precisa,
el modelo de coeficientes aleatorios irnplícito en el modelo ARCH puede ser
estimado mediante el uso de su representación de espacio de los estados. Así,
por ejemplo, la representación de filtro de Kalman del modelo de coeficientes
variables implícito en la especificación ARCH(1) de las perturbaciones aleatorias
sería de {a siguiente forma:
,
^t = (1 ^ cc-i ) ( ^o, ^^ )t
(^0^ t-'1)^ = Ut,
en donde ut ^ NID(o, diag(qo, q^)).
Un ejemplo de la segunda proposición puede verse en J. del Hoyo (1991).
Supongamos un modelo AR(1) en el que el parámetro (^ depende del tiempo de
acuerdo con un esquema de corrección que depende del error de predicción del
períoda anterior.
Yt = ^3t Yt_i + r.t
^t=R+^^t-^
que equivale a
Yt= ^Yt_^+^.Yt-^^c._^ +^t
y puede, también, interpretarse como un modelo no lineal en el que, la estructura
bilineal, proviene no de un intento más o menos ad-hoc de generación de una
perturbación heteroscedástica sino directamente de un modelo lineal con perturbación homoscedástica en el que está definido un mecanismo de adaptación del
parámetro autorregresivo de acuerdo con un esquema muy sencillo de corrección
de error de primer orden. Bajo ciertas condiciones, estos mecanismos pueden
generalizarse a otros más complejos con un mayor número de términos de la
corrección de los coeficientes del modelo.
i^'^^C^)^
Puede demostrarse igualmente que el modelo final de esta forma obtenido se
identifica mediante la f.a.c. de y, como un ARMA(1,1) heteroscedástico. Por otro
lado, como ia estructura heteroscedástica proveniente del modelo con parámetros cambiantes puede ser débil y como también, dependiendo del valor numérico
de los parámetros de los operadores autorregresivos y de media móvil del modeio
habitual ARMA(p,q), éste puede tener una apariencia heteroscedástica se tiene
que desde un punto de vista práctico, estos modelos, podrán ser considerados
como observacionalmente equivalentes.
En aqueilas situaciones en las que la Teoría Económica no facilita información
suficiente sobre la forma de la componente sisternática, tenemos, en principio,
dos vías alternativas para resolver los problemas de modelización que nos
plantea el hecho de que la perturbación no sea ruido blanco.
La primera consiste en invertir mayores recursos en mejorar la especificación
dinámica de la parte sistemática. Esta es una tarea difícil y en la que no puede
garantizarse el éxito. Sin embargo, dentro de esta vía de aproximación, existe la
posibilidad de identificar y tener en cuenta la presencia de valores atípicos que,
en gran medida, son responsables de que el comportamiento estadístico de la
perturbación no sea ruido blanco. Las observaciones atípicas, pueden alterar la
relación dinámica entre las variables haciendo que el sistema reaccione de forma
diferente según sea la intensidad o nivel de la variable explicativa, puesto que la
respuesta de la variable dependiente puede ser lineal y contemporánea frente a
variaciones ligeras de la variable explicativa, mientras que la respuesta puede
ser no lineal y con retardos frente a grandes variaciones de las explicativas.
Además, es sabido que la propia presencia de importantes valores atípicos puede
distorsianar la estructura dinárnica de las variables explicativas junto con la del
término de perturbación. En aplicaciones económicas, es muy frecuente asociar
la presencia de lo que se denominan «intervenciones» a los valores residuales
atípicos, y, como se puede demostrar [véase, por ejemplo, Box y Tiao (1975),
Chang (1982), Ghang y Tiao (1983), o Chang, Tiao y Cheng (1988)], cuando
estos atípicos se toman en consideración desaparecen los problemas.
La segunda alternativa es la que investiga la presencia de los residuos atípicos
modelizando convenientemente la camponente de perturbación del modelo. Dentro de esta aproximación se sitúan los modelos ARCH y sus modificaciones
posteriores.
Estimación
EI procedimiento de estimación analizado por los autores se centra en la
función de verosimilitud y presentan sus resultados en forma clara y concisa. Las
hipótesis de partida fueron las siguientes: el término de error se distribuye
^^ 1"f, F P' ^ 1 C.t i^! f;^
condicionalmente normal independiente, con covarianza incondicional nula, varianza incondicional constante, esperanza condicional nula, y varianza condicional continua que pertenece al conjunto de información disponible en un determinado momento del tiempo, pudiéndose así predecir a partir de !os residuos
previos al cuadrado. Además, se supone que el modelo está correctamente
especificado, en particular al definir el conjunto de información que incluye variables explicativas deterministas y el pasado tanto de la variable endógena como
el de su varianza condicional.
Nuestros comentarios a la estimación parten de proponer, como una alternativa
el filtro de Kalman para obtener la función de verosimilitud, que posteriormente
puede maximizarse por los procedimientos habituales. Los modelos estudiados
de regresión con esquemas de perturbaciones heteroscedásticas, pueden reformularse como modelos en espacio de los estados. En particular, el modelo de
regresión que los autores utilizan, puede escribirse directamente suponiendo que
sigue la representación siguiente:
Ecuación de transición de estados:
{^i = (i
Ecuación de observación
Yt=xt^+^`c
EI logaritmo de la función de verosimilitud de todas las observaciones del
modelo es función de las varianzas condicionales ht y de los residuos recursivos
del modeo, vt = Y- Yt^t--^^
A partir de unos valores iniciales, e1 filtro de Kalman aplicada a las ecuaciones
de transición y de observación permite obtener de forma recursiva las expresiones de los residuos y de las varianzas candicionadas.
En el caso que nos ocupa, con perturbaciones que presentan las estructuras
heteroscedásticas propuestas, se conoce el modelo de la varianza condicionada,
que depende de un conjunto de coeficientes, ^ y H, junto con los cuadrados de
las perturbaciones retardadas hasta p períodos, así como los retardos de las
varianzas condicionadas hasta q períodos. Por tanto, el problerna restante consiste en obtener los valores iniciales y fijar el comienzo de la recursión.
Una posible vía de solución consiste en efectuar una prirnera estimación en bloque mediante MCO, utilizar como valores iniciales ^30 =^3MCO Y Po =(X'X)-' junto
con los p primeros residuos MCO, ^^^ ...^P Y hó^ h2^ ^^^ h^ --- y-^MCO Y comenzar
la recursión en t= p+ 1.
Esta solución sólo nos proporciona la función de verosimilitud condicionada,
que se maximizará respecto a todos los parámetros del modelo. Sin embargo,
bajo las hipótesis de estacionariedad, coincidirá asintóticamente con la función
de verosimilitud exacta.
Así, pues, puede ser de gran utilidad comparar los resultados de estimación
propuestos por los autores y los que se conseguirían con este procedimiento
alternativo para evaluar la función de verosimilitud. Además, creemos que dicho
procedimiento recursivo tiene como ventaja adicionai que, en cualquier instante
t, se pueden comparar la varianza condicional con la estimación recursiva de la
varianza 6^ o bien 6t ^ t_^.
Cabría también la posibilidad de considerar alternativamente otros estimadores
no lineales, para este caso de observaciones dependientes, que fuesen consistentes y asintóticamente normales en condiciones menos restrictivas (por ejemplo, heteroscedasticidad a correlación serial de forma desconocida). En este
sentido, el estimador mínimo cuadrático no lineal (MCNL) existe bajo condiciones
generales. Las condiciones de ortogonalidad que se suelen imponer para asegurar que el valor esperado de la función a minimizar posea un mínimo se
cumplen automáticamente si el término de error se interpreta, como los autores
hacen, no como perturbación aleatoria o error aditivo de medida, sino como
diferencia entre la secuencia de observaciones y una esperanza condicional a
un 6-álgebra apropiado (aunque, para el caso en que algunas variables explicativas sean variables dependientes retardadas y el término de error esté serialrnente correlacionado se debería utilizar el estimador de variable instrumental no
lineal).
Dos tipos de estimadores podrían considerarse: el estimador del Método Generalizado de los Momentos (MGM) de Hansen (1982) y el estimador MCNL de
White (1980}. EI primero presupone estacionariedad estricta, mientras que el
segundo no supone estacionariedad, aunque sí impone restricciones más fuertes
sobre la memoria del proceso que la de ergodicidad y condiciones ligeramente
más fuertes sobre los momentos.
Hansen ha estudiado la consistencia de los estimadores MGM en el caso de
separación paramétrica y en el caso de continuidad y compacidad. En el primero,
se considera la estimación de un elemento po E P en un espacio paramétrico
P c lRk de dimensión menor que k que da cabida a posibles restricciones no
lineales sobre el espacio paramétrico. Limitando sustancialmente la interacción
entre las variables observables y los parámetros, el enfoque empleado para la
estimación se basa en la utilización de condiciones de ortogonalidad, como ya
hicieran Sargan con estimadores de variables instrumentales y Chaing y Ferguson con estimadores de mínima distancia. En el sengundo, restringiendo el
espacio métrico a que sea compacto, se consideran formas más generales de
no linealidad, utilizando igualmente condiciones de ortogonalidad para la cons-
+"j"^"É ^^ i AF?lí ^
trucción del estimador no lineal de variable instrumental. Este tipo de esti^madores
ha sido también estudiado por Amemiya y Jorgenson y Laffont, entre otras.
Por su parte, el estimador MCR1L de White, 6^, resuelve el problema
n
min Qn (8} = ^^^ ^(Yt -- f't ( Xt, 8))^, que existe bajo el supuesto de que la secuencia
r1 t=1
H^ n
de observaciones reales {Y^} pueda ser representada mediante Y^ = f^^t (Xt, 80) + ct,
t= 1, .., n, donde f^t: ^i`' x O-^ ^', v <^ son funciones conocidas medibles en
[R" para cada 6 en O, y continuas en G(un subconjunto compacto de [RP)
uniformemente en t casi seguramente. 6o es un vector p x 1 desconocido. Yt y
Xt son observables, pero ^ no lo es. Las condiciones util^zadas en el desarrollo
de este estimador permiten que los regresores y los errores exhiban dependencia
temporal y heterogeneidad simultáneamente.
En un futuro trabajo de investigacíón sería aconsejable, por tanto, estudiar y
verificar los resultados obtenidos por otros rnodelos y procedimientos de estimación
con los que aquí se proponen, y evaluarlos desde un punto de vista predictivo.
Verificación
La contrastación de la estructura ARCH se realiza mediante el contraste de
Multiplicadores de Lagrange ( ML), que puede interpretarse como la distancia
(norma} a cero de la proyección del término de error al cuadrado relativo a la
varianza bajo la hipótesis nula (ausencia de heteroscedasticidad) sobre el espacio generado por el pasado del térrnino de error al cuadrado y un vector de
constantes. Como se sabe, es asintóticamente equivalente al estadístico del tipo
TR2, donde R2 es el coeficiente de determinación en la proyección anteriormente
mencionada. Por otra parte ( véase Bollerslev, 1986), no es posible desarrollar un
test general que verifique ei efecto GARCH ya que el estadístico ML (así como
el de Razón de Verosimilitud y el de Wald) para un GARCH(p,q) es el mismo que
para un ARCH(p+q),
La identificación del orden mediante la f.a.c. y la f.a.p. de las observaciones
de la serie al cuadrado ( en el modelo univariante) o de los resíduos MCO al
cuadrado ( en el modelo de regresión) tiene el í nconveniente que los errores
estándar así como los estadísticos Box-Ljung y Box-Pierce se ven afectados ante
la presencia de efectos ARCH, por lo que es aconsejable la utilización previa de
una corrección y una normalización apropiadas (como, por ejemplo, en Diebold,
1988). Además, la f.c.c. entre los cuadrados de los valores observados y estimados, así como la estimación de los coeficientes de asimetría y curtosis pueden
dar lugar a la identificación errónea de efectos no lineales si los atípicos de la
serie original no han sido intervenidos con anterioridad.
^1^1
;^(') ` ^ i` :+ f
Finaimente, un último comentario referente a la propia estimación por Máxima
Verosimiiitud. Como es sabido [véase, por ejempio, Hi11 (1986)], el contraste de
un determinado parárnetro de interés, H, está siempre condicionado a la hipótesis
de partida que genera el modelo. Si, por el contrario, consideramos conjuntamente el parámetro y la hipótesis, la evidencia sobre ^ dependerá, en este caso, de
la elección de dicha hipótesis en relación a otras hipótesis, pudiéndose dar la
paradoja de que la evidencia sobre 8 sea contradictoria en experimentos diferentes, incluso cuando éstos conducen a 1a misma densidad marginai a posteriori
para 8.
Un ejemplo puede servir para clarificar esta situación. Supongamos que H^ y
H2 son dos hipótesis cualesquiera mutuamente exclusivas y exhaustivas que
representan modelos alternativos. Consideremos dos experimentos E^ y E2 tales
que si se Ileva a cabo E; entonces observamos el valor de la variable aleatoria
X;, i= 1,2. Sean p;(x; H), i= 1,2, dos densidades diferentes para las observaciones,
que dependen sólo del parámetro 8. Cuando ^ se conoce entonces la probabilidad o distribución muestral de las observaciones está completamente especificada.
Si se observa x^ en E^, entonces la verosimilitud de H es:
L(E^; E^, x^) = P{X^ = xi, E^ ^ 8}
=P{X^=xi f E^,6}xP{E^^6}
^ P{X^ = x^, Hi ^ E^, ^} + P{X^ = x^, H2 ^ E^, 8}
= P{X1 = x^ ^ H^, E^, 8} x P{H^ ^ E^, 6}
+ P{X^ = x^ ^ H^, E^, 8} x P{H2 ^ E^, 9}
donde la constante de proporcionalidad es P{E^ (^}. Similarmente si se observa
x^ en E2, L(e; E2, x2) a P{X2 = x^ ^ E2, H}, donde la constante de proporcionalidad
es P{E^ ( 8}.
Como las funciones de verosimilitud se rlefinen salvo una constante, se suele
entender que la inferencia marginal sobre H deber ser la misma en ambos
experimentos si éstos son no informativos ( misma densidad a priori) y las versomilitudes son proporcionales entre sí. Además, si éste fuese el caso, las densidades marginales a posteriori de 9 serían las mismas y cualquier decisión sobre
ei valor de 6 sería igualmente válida tanto si se observa x^ en E^ como si es x2
en E2.
Sin embargo, como hemos dicho anteriormente, ello no tiene por qué ser
necesariamente cierto si incluimos proposiciones conjuntas sobre el parámetro y
el modelo ( u otros parámetros implicados por H;).
^ ;^,n,^F^ r^T^k^^^^>^^
^,I
Considérense los siguientes supuestos que consiguen que ambas verosimilitudes sean proporcionales entre sí.
S.1 Si se realiza E^, entances la densidad de X, es p^(x,;8} si H, es verdadera
y p2{x^;H) si H2 es verdadera. Si se realiza E2, entonces la densidad de X2 es
p2(x2;8) si H^ es verdadera y p^(xz;8) si H2 es verdadera.
S.2 P{H1 ^ E;,9} = p,0 < p< 1, una constante conocida que no depende ni del
valor de 6 ni del experimento que se realice. Es decir, p es la probabilidad no
condicional de H^ y(1-p) será, por tanto, la probabilidad no condicional de H2.
S.3 La elección del experimento no es informativa; es decir, P{E; i a} no
depende 6.
S.4 Existe un valor x^ de X^ para el cual p^(x^;8) = 0 b' 8 y p2(x^;^) > 0^! 6.
Existe un valor x2 de X2 para el cual p^(x2;9) = 0`d 9 y p2(x2;9) > 0`d 8. Es decir,
x^ es imposible en E^ bajo H ^ y x2 es imposible en E2 bajo H2.
Introduciendo los supuestos anteriares en las funciones de verosimilitud, se
obtiene
L(B^E^, x^) °^ P^ {x^i 8) P+ P2 (x^^ e) (1- P) = P2 (x^^ 8) {1-- P)
L(e, E2, x2) °^ PZ tx2, e) P+ P^ (x2^ e) t 1-- P) = P2 íx2^ ^) P
que son proporcionales entre sí.
Consecuentemente (E^,x^) implica que H2 es verdadera, ya que x1 tiene probabilidad 0 si al realizarse E^ es verdadera H^ y, del mismo modo (E2,x2) implica
que H^ es verdadera, ya que x2 tiene probabilidad 0 si al realizarse E^ es verdadera H2.
Es decir, dependiendo del experimento que se Ileve a cabo y por estar asociado
6 a H;, decidiremos de forma diferente sobre 8 incluso cuando las distribuciones
marginales a posteriari de e sean las mismas en ambos experimentos.
En definitiva, se trata de un campo relativamente nuevo desde un punto de
vista estadístico que necesita de la continuidad de aportaciones como las que
tan brillantemente han sabido reflejar los profesores Novales y Gracia-Díez a los
que no nos queda sino felicitar de nuevo.
REFERENCIAS
BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroscedasticity». Journal of Econometrics, vol. 31, 307-327.
Box, G. E. P. y T^AO, G. C. (1975). «Intervention Analysis with Applications to
Economic and Environmental Problems», JASA, vol. 70 (349), 70-79.
CHANG, I. (1982). «Outliers in Time Series». Ph. D. Thesis, University of Wisconsin, Madison.
CHANG, I. y T^AO, G.C. (1983). «Estimation of Time Series Parameters in the
Presence of 4utliers», Techical Report, n.° 8, University of Chicago, 1-28.
CHANG, I., T^AO, G.C. y CHENG, C. (1988). «Estimatian of Time Series Parameters
in the Presence of Outliers», Technometrics, vol. 30 (2), 193-204.
DIEBOLD, F. (1988). «Empirical Modeling of Exchange Rate Dynamics», SpringerVerlag, Berlín.
HANSEN, L. P. (1982). «Large Sample Properties of Generalized Method of Moments Estimators», Econometrica, vol. 50, 1029-1054.
HILL, B. M. (1986). «On the Validity of the Likelihood Principle», W. P. University
of Michigan, 1-6.
HoYo, J. del (1991). «Generación de modelos bilineales a partir de esquemas con
parámetros carnbiantes», U. A. M. Doc. interno, Dpto. Análisis Económico,
1-15
WNITE, H. (1980). «A Heteroscedasticity-Consistent Covariance Matrix Estimator
and a Direct Test Heteroscedasticity», Econometrica, vol. 48, 721-746.
WOLFF, C. C. P. (1987). «Time-Varying Parameters and the Out-of-Sample Forecasting Perfomance of Structural Exchange Models», Journal of Business and
Economic Statistics, vol. 5 (1).
^;",^f ^^^^ i.^^?^r ,
`^^i
J. IGNAClO PEÑA
Departamento de Economía
Universidad Carlos III de Madrid
En los últimos años, se ha producido una gran cantidad de investigación sobre
el problema de la modelización del riesgo de los activos finane<cieros. Hay ya varias
revisiones de esta literatura, entre las que destacaríamos las de Pagan y Schwert
(1990), Nijman y Palrn (1991), Engle {1991), Granger (1991) y Bollerslev, Chou
y Kroner (1992). EI interesante artículo de Novales y Gracia-Díez {1993} viene a
sumarse a esta importante área de estudio, contribuyendo a la misma con un
detallado análisis de 1as expresiones analíticas de las derivadas de la función de
verosimilitud ernpleada en la estimación de esta clase de modelos.
Mi comentario se va a centrar en una perspectiva general sobre la utilidad e
importancia de esta clase de modelos.
Conviene recordar cuál era el enfoque tradicional para la modelización de la
volatilidad de ias rentabilidades de un activo financiero. La conocida observación
de Mandelbrot (1963) de que cambios (de precios) grandes en mercados financieros solían ser seguidos de cambios grandes (de cualquier signo) y lo mismo
con cambios pequeños, señalaba la existencia de esa tendencia a la agrupación
de la volatilidad de los mercados y por tanto su variabilidad en el tiempo (heteroscedasticidad).
Los participantes en los mercados, reconociendo que la volatilidad pod ía variar
en el tiempo, han usado durante mucho tiempo medidas del tipo
6t = ^ ^ ^? ;
p i =- 1
(1]
para reflejar ese riesgo dependiente del tiempo, que denominaremos como at , y
donde ct podían ser los errores de predicción de algún modelo ajustado a los
datos o bien directamente ios rendimientos del activo. Los agentes elegían p en
función de sus impresiones sobre la velocidad de cambio de la volatifidad pero,
en general, daban el mismo peso a la información más reciente y a la más
antigua. Una extensión de este enfoque se expone en French et al. (1987) que
sugieren estimar la volatilidad mensual si se dispone de datos diarios de la
siguiente forma
Nt
Nt-1
6mt-^^^t i+^^t^t+1
(2]
donde Nt es el número efectivo de días de mercado al mes, 6^-,t es la varianza
del mes m y los Ft son las rentabilidades diarias del mes m. Nótese la presencia
a^ i. .^' Í ^^7 • k '
^ ',1
^
'^+ ^!,^' ^
del término de productos cruzados que trala de corregir ia posible presencia de
contratación asíncrona o efecto Fisher, cuyas consecuencias sobre las series
financieras se exponen por ejemplo en Peña (1992a).
Los modelos anteriores y otros similares que podrían derivarse, presentan el
inconveniente de su carácter «ad hoc», al no tener en cuenta las características
estadísticas específicas de cada serie. Para tratar de solucionar esta situación
Engle (1982) propone los modelos ARCH (AutoRegressive Conditional Heteroskedasticy) que generalizan los modelos [1 ] y[2], permitiendo que el orden de
retardo p, el peso relativo de cada observación y una volatilidad de base se
incorporen ai modelo y se elijan usando los datos en vez de fijarse a priori. Ello
da lugar al modelo ARCH(P) de la forma
P
[3]
^t -^x0+^•ai^t i
donde los parámetros ao, a; y p se estiman usando procedimientos maximoverosímiles.
Si incluimos también una forrnulación general para la media condicional, una
representación general para una serie de rendimientos puede ser
Yt ^ It-1 ^ D(µt, 6?)
[4^
donde It_^ es el conjunto de información relevante y D es una función de densidad
condicional adecuada ( Normal, Student T, Mixturas, etc.).
Las generalizaciones del esquema ARCH inicial no se han hecho esperar y
entre ellas destacaríamos los modelos GARCH(p,q) de Bollerslev ( 1986), de la
forma:
P
q
at ` a0 + ^ ai ^t - i +` ^ ^j 6t j
i^1
j-1
[5)
Tanta los modelos ARCH como los GARCH imponen una serie de restricciones
en los parámetros para garantizar que la varianza sea siempre positiva, que son
del tipo oco, a;, Rj > 0. Para garantizar la estabilidad del modelo, una condición
adicional es
q
P
^ ^i + ^ aj ^ 1
i-^ ^
[6]
i-=1
Sin embargo, en la práctica no es infrecuente que los parámetros estimados se
encuentre en zonas próximas a la no estacionariedad, dando lugar a los modelos
GARCH integrados (IGARCH), véase Engle y Bollerslev (1986), lo cual implica
que las innovaciones de este proceso tienen influencia permanente, de modo
E, 1
similar a lo que ocurre con los modelos ARIMA, EI desarrollo de contrastes de
raíces unitarias para la varianza está aún en sus comienzos, aunque ya hay
resultados, Lumsdaine (1990), que sugieren que transformaciones simples de los
procedirnientos clásicos de contraste (Dickey-Fu11er, etc.) pueden ser de utiiidad.
Una limitación de los modelos ARCH y GARCH es que presentan restricciones
en los parámetros y además la varianza depende sólo de la magnitud de las ^^^
pero no de su signo. Trabajos anteriores, Black (1976), Christie (1982), sugieren
que los rendimientos de las acciones están negativamente correlacionados con
los carnbios en su volatilidad. Es decir, la volatilidad tiende a subir si los rendimíentos son menores de lo esperado y a bajar si los rendimientos son mayores
de lo esperado, probablemente debido a la presencia de efectos de apalancamiento que ocasionen que el riesgo previsto varíe diferentemente según el signo
de la innovación.
Para tratar de superar estos inconvenientes, Nelson (1991) propone el modelo
GARCH Exponencíal o EGARCH, donde la varianza es una función asimétrica
de las innovaciones;
4
P
In a? = ap +^[ij In csc j+^ ock (8 y^t-k+ ( I 4ft-k I- 2n0.5))
j =1
[7]
k =. 1
donde
4^t = Et
^t
[8]
Esta formulación tiene la ventaja de garantizar siempre que la varianza es
positiva, no impone restricciones en los parámetros y permite efectos asimétricos
y no líneales de las innovaciones sobre la varianza de la serie (líneales sobre el
logaritmo}.
Un desarrollo adicional que puede incorporarse a cualquiera de los modelos
anteriores es el ARCH-M de Engle, Lilien y Robins (1987). La idea está basada
en el modelo de Merton (1980) que postula una relación entre los rendimientos
esperados de una cartera y su varianza condicional, de la forma:
µc I It-^ = G tói ^^)
[9]
donde b puede interpretarse como el coeficiente de aversión relativa al riesgo de
un agente representativo y por tanto el rendimiento en exceso de un activo 0
cartera, siguiendo la formulacióri [9] puede interpretarse como una prima de
riesgo variable en el tiempo. Es decir, si un activo se hace más arriesgado, los
inversores exigirán un mayor rendimiento.
EI modelo general para la media y!a varianza condicional bajo este supuesto,
podría formularse como:
^F^ ^^t^)+F2(c^^, ^ó)+t`t
[10j
donde F^ puede ser cualquiera de las formulaciones líneales o no líneales
propuestas recientemente en la literatura como las discutidas en Tong (1990) o
Granger y Terasvista t 1992) [véase Peña (1992b) para una revisión crítica de las
mismas] y Fz suele ser una función lineal o logarítmica, con la varianza condicionai especificada de modo adecuado.
En los últimos años se han propuesto nuevas extensiones y modificaciones
del m^odelo GARCH básico, entre las que cabría citar el ARCH Semiparamétrico
(SPARCH^ de Engle y González (1991), el ARCH No Líneal (NARCH) de Engle
y Ng (1991), el ARCH estructural (STARCH) de Harvey, Ruiz y Sentana (1992)
y varios o#ros, cuyas potenciaiidades están todavía por explorar. De cualquier
forrna, parece claro que todos estos trabajos apuntan a ia necesidad y el interés
de modelizar adecuadamente la evolución temporal de la volatilidad de las
variables financieras, superando los planteamientos simplistas como los de la
ecuación (1) ya mencionados.
REFERENCIAS
BLACK, F. (1976). «Studies in Stock Price Volatility Changes». Proccedings of the
1976 Business Meetíng of the 8usiness and Economic Statistics Sectíon,
American Statistical Association, 177-181.
BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroskedasticity» . Journal of Econometrics, 31, 307-327 .
BOLLERSLEV, T., CHOU, R. Y., KRONER, K. F. (1992). «ARCH Modeling in Finance».
Journal of Econometrics, 52, 5-59.
CHRISTIE, A. { 1982). «The Stochastic Behavior of Common Stock Variances» .
Journal of Financial Economics, 10, 407-432.
ENGLE, R. (1982). «Autoregressive Conditional Heteroskedasticity with estimates
of the Variance of U.K. Inflation». Econometrica, 50, 987-1008.
ENGLE, R. (1991). «Statistical Models for Financial Volatility». Working Paper.
Department of Economics. University of California San Diego.
ENGLE, R., BOLLERSLEV, T. (1986). «Modelling the Persistence of Conditional Variances». Econometric Reviews, 5, 1-50, 81-87.
^^_
^ ..^ ^^ E ha f ^, ^t f ( ^^^ ^';
ENG^E, R., Li^iEN, D. M. y R©BBiNS, R. P. (1987). «Estimating Time Varying Risk
Premia in the Term structure: The ARCH-M model». Econometrica, 55, 391407.
ENG^E, R., NG., V. (1991). «Measuring and testing the Impact of News on Volatility». Working Paper. Department of Economics. UCSD.
ENG^E, R. y Gon,zQ^EZ-R^vERA, G. (1991). «Semiparametric ARCH Models» . Journal
of Business and Economic Statistics, 9, 345-360.
FRENCH, K. R., SCHWERT, G. W. y STAMBAUGH, R. !F. (1987). «EXpeCted StOCk retUrnS
and Volatility». Journal of Financial Economics, 19, 3-29.
GRANGER, C. W. J. y TERASV^sTA, T. (1992). «Modelling Dynamic Nonlinear Relationships». Oxford University Press.
GRANGER, C. W. J. (1991). «Forecasting Stock Market Prices: Lessons for Forecasters». Working Paper. Department of Economics. University of California
San Diego.
HARVEY, A., Ruiz, E. y SENTANA, E. (1992). «Unobserved Component Time Series
Models with ARCH Disturbances». Journal of Econometrics, 52, 62-74.
LUMSDAINE, R. L. (1990). «Asymptotic Praperties of the Maximum Likelihood Estimator in GARCH (1,1) and IGARCH (1,1) models». Working Paper. Department
of Economics. Harvard University.
MANDELBROT, B. (1963). «The Variation of Certain Speculative Prices». Journal of
Business, 36, 394-419.
MERTON, R. C. (1980). «On Estimating the Expected Return on the Market».
Journal of Financial Economics, 8, 323-361.
NELSON, D. (1991). «Conditional Heteroskedasticity in Asset Returns: a New
Approach» . Econometrica, 59, 347-370.
NIJMAN, T. C. y PALM, F. (1991). «Recent Developments in Modeling Volatility in
Financial Data». Working Paper. Center for Economic Research. Tilburg University.
PAGAN, A. y SCHWERT, G. W. (1990). «Alternative Models for Conditional Stock
Volatility». Journal of Econometrics, 45, 267-290.
PEÑA, J. I. (1992a). «Contratación asíncrona, Riesgo Sistemática y Contrastes de
Eficiencia». Cuadernas Económicos de ICE, 50, 81-89.
PEÑA, J. I. (1992b). «Nuevos Modelos Estadísticos para el Análisis de Mercados
Financieros». DT 92-11. Universidad Carlos III de Madrid.
ToNG, H. (1990}. «Non-linear Time series». Oxford University Press.
f.,.)`i
C
:^.'^, ^ `-i^..1^,.^ ! Í;, , /^^ t .;^i^^i^l^^^
TEODOSIU PEREZ AMARAL
Departamento de Economía Cuantitativa
Facultad de Económicas
Univers^dad Complutense de Madrid
1.
INTRODUCCION
E1 artículo de los profesores Novales y Gracia presenta de forma unificada y
sistematizada un conjunto de resultados que serán de gran utilidad a los investigadores que utilicen estos métodos de estimación. EI detallado y cuidadoso
desarrollo de las expresiones de los diferentes elementos de la estimación es lo
que ha rnotivado el desarrollo de los nuevos contrastes que se presentan a
continuación. En el epígrafe 2 agrupo un conjunto de comentarios puntuales que
pretenden ayudar a clarificar la intuición de este tipo de métodos de estimación,
y en el 3 presentó una aplicación de los contrastes de ia matriz de información
dinámica al caso de modelos estimados por ARCH; se presentan nuevos contrastes de autocorrelación de orden arbitrario.
2.
COMENTARIC^S GENERALES
Habría que mencionar que la normalidad condicional no es una característica
esenciaf de los modelos ARCH, y que se utilizan también otras distribuciones,
como la t, que permiten un mayor peso en las colas. Véase al respecto Spanos
(1991).
En la sección 2 se apunta la distinción entre heteroscedasticidad estática y el
«caso especial de heteroscedasticidad» que se presenta en este trabajo. A la
heteroscedasticidad tipo ARCH se le Ilama heteroscedasticidad dinámica por
algunos autores.
En la sección 4.2 se presentan contrastes de estructura ARCH. Antes de
proceder a contrastar formalmente la posible existencia de estructura ARCH, es
necesario recordar que es posible que conjuntos de observaciones atípicas o no
linealidades omitidas de la formulación pueden Ilevarnos a concluir, erróneamente, que tenemos una estructura de tipo ARCH. Para evitar ese peligro, resulta
imprescindible graficar los residuos del modelo de regresión e intentar detectar
si hay o no atípicos. Aparte de ello, sólo si hay un motivo teórico que lo justifique
se pasaría a la estimación de un modelo ARCH o GARCH.
AI final de la sección 4.2, la hipótesis nula Ho: b2 = 0, también podría contrastarse con el contraste de Wald, que requeriría la estimación bajo la hipótesis
í^) P^^ ^ ^J Í A F^ I()`7
alternativa, y entonces el estadístico t del coeficiente b2 sería el contraste de Wald
apropiado.
Cabría mencionar asimismo, que los modelos tipo ARCH y GARCH son la
generalización al caso de las varianzas condicionales de los modelos ARIMA.
Esto se aprecia de forma clara en la fórmula 25.
En el apartado (iii) de la sección 7, cabe señalar que la estimación por separado
de los parámetros de la regresión y de los del modelo de la varianza condicional
de las perturbaciones es eficiente sólo asintóticamente y que en muestras finitas
se mejora la eficiencia estimando conjuntamente, por ejemplo iterativamente.
3.
DIAGNOSTICOS DE LA MATRIZ DE INFORMACION DINAMICA
PARA iVIODELOS ARCH
Los diagnósticos de la matriz de información dinámica son contrastes generales propuestos por White (1987) y desarrollados para el caso de regresión lineal
por Pérez Amaral (1993), y son especialrnente útiles como diagnósticos de
modelos estimados por máxima verosirnilitud.
EI fundamento de los mismos es que sólo bajo especificación correcta las
formas del hessiano y el producto exterior de la matriz de información son
equivalentes (igualdad de la matriz de información). La incorrelación del gradiente
con sus propios retardos resulta ser una condición esencialmente necesaria para
la igualdad de la matriz de información, y son la base de los contrastes de la
matriz de información dinárnica (MID); White (1987).
En el caso de regresión lineal, diagnósticos basados en la correlación del
gradiente dan lugar a contrastes de autocorrelación residual de todos los órdenes,
autocorrelación con parárnetros variables, ARCH-M, ARCH-M no simétrico,
ARCH y ARCH no simétrico; Pérez Amaral (1993). En el caso de modelos
estimados por ARCH, la disponibilidad del gradiente, así como la relativa escasez
de contrastes de especificación hacen particularmente atractivo el uso de este
enfoque.
Contrastes MID para el modelo ARCH de regresión
Utilizaremos el modelo ( 14) del artículo que comentamos, cuya función de
verosimilitud viene dada por {6) y la parte del gradiente correspondiente a^i viene
dada por ( 15), siendo ^^I^/^^3 el gradiente. Bajo especificación correcta,
E(^^It/^^i ^It_^/^^^3') = 0,
j= 1, ...
[I]
'^ i t s ,.
bh
^ ^; E ^.,
Para comprobar si se cumplen las condiciones anteriores, podemos utilizar los
análogos muestrales de las mismas, eligiendo los elementos no redundantes
de (I).
Los diagnósticos se computarían como una regresión MCO en la que la
variable dependiente es la unidad y los regresores son los elementos de [I] que
se hayan elegido y el gradíente, evaluados en un estimador asintóticamente
eficiente (por ejemplo el de máxima verosimilitud).
1 sobre vec' (^^It/^a ^It_^/^^i'), ^It/^^R
[II]
EI estadístico de contraste sería el número de observaciones por el coeficiente
de determinación sin ajustar por el uso de una constante (TR2), que se comportaría bajo la hipótesis nula de especificación correcta como una x2 con un número
de grados de líbertad igual al número de indicadores que se estén contrastando
en la regresión [II]. Nótese que en la regresión anterior se ha utilizado la diagonalidad por bioques de la matriz de información.
En general, resulta conveniente seleccionar un subconjunto de indicadores
para obtener contrastes direccionales, con mayor potencia que la de contrastes
generales. Un caso particular del contraste [II] sería el contraste de autocorrelación residual, que presentamos a continuación. En el caso de que uno de los
regresores fuera una constante (p.e.: x^t = 1, t= 1,...), el gradiente con respecto
a ese regresor sería un caso particular de [15].
^It/^^3^ = Et/hi ^hil^^3 [Et /ht --1 ]
y los retrasos correspondientes serían:
71t ^/óR^ = ^t ^/h# ^ c^ht j/a[i [^t ^/ht j - 1 ]
con lo que un contraste de correlación de orden arbitrario se podría computar
con la regresión MC4 de
n
n
n
1 sobre altiaR, a!t ;^aR,, aIt/aR
[^]
y el estadístico de contraste sería TR2 de la regresián anterior, que bajo especificación correcta sería una x2 con un grado de libertad. Este contraste sería la
generalizacíán del contraste de autocorrelación residual al caso ARCH. Si se
quisieran contrastar conjuntamente varios retardos, habría que incluirlos en la
regresión (V) y ajustar el número de grados de libertad del contraste.
Los contrastes que se proponen son fáciles de computar y de interpretar y
pueden ser de utilidad para e1 investigador aplicado. Los contrastes de autocorrelación pueden ser útiles en situaciones comunes en la práctica. Anteriormente
^,r:^:)I`J^FNTr^F^IC;``,
Diebold (1986) había propuesto un contraste de autocorrelación de orden 1,
siguiendo otro enfoque diferente.
Hay que resaltar que se puede usar la misma estrategia de contrastación para
modelos estimados por GARCH y por ARCH-IV1, uti^izando en [II] todo el gradiente
cuando no se dé la diagonalidad por bloques.
REFERENCIAS ADICIONALES
D^EBO^o, F. X. (1986). «Testing for serial correlation in the presence of ARCH ».
Proceedings of the American Statistical Association, Business and Economics
Section, 323-328.
P^REZ AnnARA^, T. (1993). «Contrastes m y de la matriz de inforrnación dinámica
con una aplicación a regresión lineal». Próxima publicación en Estadística
Española.
SPArvos, A. (^ 991). « A parametric approach to dynamic heteroskedasticity: the
Student's t and related models», presentado en los European Meetings de la
Econometric Society, Cambridge.
WH^-rE, H. (1987). «Specification testing in dynamic models», en T. Bewley (editor).
Advances in Econometrics, Fifth World Congress, vol . 1, New York, Cambridge
University Press. .
? „^,I ^^^.:...^ r ;l.
(",
^ r,.,(^.^,r{n
ESTHER RUIZ
Departamento de Estadist^ca y Econometría
Universídad Carlos III de Madr^d
1.
INTROD^JCCION
EI artículo de A. Novales y M. Gracia-Díez es una contribución a la literatura
sobre modelos ARCH que puede ser muy útil para los usuarios de dichos
modelos en el sentido de clarificar cuáles son las expresiones analíticas a utilizar
para su estimación por rnáxima verosimilitud. Sin embargo, y a pesar de que los
modelos ARCH y GARCH son los más ampliamente utilizados para modelizar
series temporales heteroscedásticas, las más recientes investigaciones en este
área parecen indicar que existen otros modelos alternativos más adecuados para
la modelización de la volatilidad de series financieras.
En esta nota primero vamos a describir brevemente las propiedades y limitaciones de los modelos GARCH y después analizaremos algunos de los modelos
alternativos que se han propuesto en la literatura: los modelos GARCH exponenciales (EGARCH) y los modelos de volatilidad estocástica (SV).
2.
MODELOS GARCH
EI modelo GARCH fue propuesto independientemente por Bollerslev (1986) y
Taylor ( 1986) como una aproximación parsimoniosa a los modelos ARCH introducidos por Engle ( 1982). EI modelo GARCH que empíricamente ha demostrado
ser el más apropiado para modelizar !a volatilidad de numerosas series financieras es el modelo GARCH ( 1,1) que se define como
Yc = ^t 6t
[1l
6t = c^ + a yt ^+^3 6t ^
[2]
donde ^t -- N ID (0,1 }, 6t es la volatilidad e yt es la serie a modelizar que
habitualmente es el rendimiento de la serie financiera que se esté considerando.
Es importante señalar que en (2), a^t modeliza la varianza de yt condicional en
la historia pasada de la serie hasta el momento t-1. Por lo tanto, los modelos
GARCH son condicionalmente Gaussianos y pueden ser estimados por Máxima
Verosimilitud (MV), como se describe en el artículo de A, Novales y M. GraciaDíez.
Las restricciones sobre los parámetros necesarias para garantizar la positividad de la varianza son c^ > 0, a? 0 y^i ? 0. Además, la condición de estaciona-
(,{. ^'y M E^ ^^11 A Fl I ^^) <..^
riedad en sentido amplio de yt es que a+[3 < 1. Finaimente, la condición para la
existencia del momento de cuarto orden de yt es que 3a^ +^3^ + 2a^3 < 1.
Estas restricciones tienen como consecuencia que los modelos GARCH tengan
limitaciones importantes que condicionan su utilización empírica. En concreto,
Nelson ( 1991) señala las siguientes limitaciones:
i) Las condiciones sobre los parámetros del modelo necesarias para garantizar la positividad de la varianza condicianal son a menudo violadas por las
estimaciones con series reales.
ii) La definición de persistencia en un modelo GARCH es confusa en el
sentido de que dependiendo de cuál sea la norma respecto a la cual se mide tal
persistencia, se puede Ilegar a conclusiones contradictorias. Por ejemplo, en el
caso de un proceso GARCH integrado (IGARCH), i.e. a+ R= 1, el proceso es
estrictamente estacionario pero no es estacionario en covarianza.
iii) Los rnodelos GARCH no son capaces de modelizar la respuesta asirnétrica de la volatilidad ante cambios positivos y negativos de los precios de los
activos financieros. Además de las limitacianes señaladas por Nelson, en aplícaciones empíricas se han estimado modelos GARCH que, aunque cumplan la
estacionariedad, violan la condición de existencia de! momento de cuarto orden
de yt.
Finalmente hemos de señalar que la generalización de los modelos GARCH
al caso multivariante, aunque no presenta grandes dificultades teóricas, tiene
limitaciones prácticas debido a que es necesario imponer restricciones para la
positividad de la matriz de covarianzas y al gran número de parámetros que es
necesario estimar.
Bollerslev et al. (1992) y Bera y H iggins (1993) realizan una revisión detallada
de todos los modelos basados en ARCH y desarrollan todos los puntos tratados
brevemente en esta sección.
3.
MODELOS EGARCH
Para rnodelizar la volatilidad, Nelson (1991) propuso el modelo EGARCH que
no tiene algunas de las limitaciones señaladas en el apartado anterior para ios
modelos GARCH. EI modelo EGARCH (1,1) viene dado por (1) con a? definida
como
log at = c^ +[3 l09 6i ^+ 7 Yt-^/^t_^ + a[I Yt-^^at-^ ^-- (2/^t)'^2]
[3l
Nótese que dada la definición de la volatilidad en [3], c^t es observable con la
información disponible en el momento t-1. En consecuencia, los modelos
/'^^^)
F^ ^` t C,[;,ic,i„ ^ : t..,t;l'^r:^'1( ;
EGARCH comparten con los modeios GARCN la propiedad de ser condicionalmente Gaussianos y, por lo tanto, su estimac^ón no presenta grandes dificultades
teóricas, aunque suelen encontrarse problemas de convergencia de los algoritrnos de maximización de la verosimilitud.
AI modelizar el logaritmo de la volatilidad, no es necesario imponer restriccia
nes sobre los parárnetros para garantizar la positividad de la varianza condicional.
Los modelos EGARCH son además capaces de representar el comp^ortamiento
asimétrico de la volatilidad observado a menudo en series financieras. Finalmente, Nelson (1991) deriva las condiciones de estacionariedad de yt, que no presentan las confusiones dei modelo GARCH.
Frente a estas propiedades atractivas, los modelos EGARCH tienen el inconveniente de que es complicado derivar las propiedades estadísticas de yt; ver el
apéndice de Nelson (1991). En aplicaci^^ones empiricas, los modelos EGARCH
están proporcionando, en general, mejores ajustes de la volatilidad que los
modelos GARCH; ver, por ejemplo, Pagan y Schwert (1990) y Engle y Ng (1991)
para aplicaciones con rendimientos de activos financieros. Esta superioridad de
los mode^os EGARCH sobre los GARCH parece satisfacerse incluso cuando se
modelizan series financferas que no presentan comportamientos asimétricos; ver
Taylor (1991) para una aplicación a tipos de cambio. Higgins y Bera (1992),
analizando tipos de cambio semanales, también señalan qu^e los datos parecen
favorecer la modelización logarítmica de la varianza.
En consecuencia, aunque la evidencia empírica acumulada hasta el momento
es muy escasa, las comparaciones entre los ajustes proporcionados por modelos
EGARCI^ y por modelos GARCH parecen señalar que ajustar un modelo lineal
al logaritmo de la varianza en lugar de a la varianza misma proporciona mejores
estimaciones de volatilidad.
Los modelos EGARCH tienen una limitación importante en cuanto a su aplicación a series financieras multivariantes que es incluso más complicada que en
el caso de los modelos GARCH.
4.
MODELOS DE VOLATILIDAD ESTOCASTICA
Tanto los modelos GARCH como los modelos E^ARCH modelizan la volatilidad, 6t, como la desviación típica de los errores de predicción un período hacia
delante. Sin ernbargo, la volatilidad puede ser considerada como una variable
inobservable. Los modelos de volatilidad estocástica (SV) modelizan el logaritmo
de la v©latilidad como un proceso estocástico lineal, normalmente un proceso
autorregresivo; para una detallada revisión de los modelos SV ver Taylor (1991).
^,c )ME ^`^t:^k1i,:^i^
^!
En el modelo SV estacionario más sencillo, el logaritrno de la volatilidad se
modeliza como un proceso AR (1). Por lo tanto, el proceso SV-AR ( 1) viene dado
por (1) con cst definida como
log cs? = y+^ l09 6i ,+ r^t
[4]
donde r^i - NID (0, 6ñ) y(^ ^< 1.
Los modelos SV son aproximaciones en tiempo discreto de I©s modelos en
tiempo continuo habitualmente utilizados en la literatura financiera en, por ejemplo, los modelos de valoración de opciones; ver Taylor ( 1991). Esta caracteristica
también la tienen los modelos EGARCH, pero Dassios ( 1992) señala que la
aproximación de 1os modelos SV es mejor que la de los modelos EGARCH.
Además, los modelos SV, al modelizar explícitamente la volatilidad como un
componente inobservable, permiten que noticias inesperadas en el período t
puedan afectar a la volatilidad a través de rlt.
Las principales ventajas de los rnodelos SV sobre los modelos GARCH y
EGARCH son: i) su generalización at caso multivariante es mucho más sencilla;
ver Harvey et al. (1992). ii) Las propiedades de yt se pueden obtener fácilmente,
ya que se pueden utilizar los resultados clásicas en el análisis de series temporales. Por ejemplo, las restricciones necesarias para asegurar que yt es un
proceso estacionario, tanto en sentido amplio como en sentido estricto, son las
restricciones estándar para garantizar la estacionariedad de log 6t . Además, el
momento de cuarto orden de yt existe siempre si log c^t es un proceso estacionario.
Sin embargo, los modelos SV no son condicionalmente Gaussianos, por lo que
su estimación no es, ^en principio, tan sencilla como en los modelos GARCH y
EGARCH. Habitualmente la estimación de modelos SV se ha realizado mediante
variantes del Método Generalizado de Momentos (GMM). Nelson (1988) y Harvey
et al. (1992) propusieron independientemente un método de Quasi Máxima Verosimilitud (QML) cuyas propiedades han sido analizadas por Ruiz (1992). Ruiz
compara dichas propiedades con las del método GMM, concluyendo que, para
los casos de interés cuando se analizan series financieras, el método QML es
más eficiente que el rnétodo GMM.
Los modelos SV han sido escasarnente analizados hasta el momento, por lo
que presentan el incanveniente de que muchas de las extensiones de los modelos basados en ARCH (como, por ejemplo, ARCH-M}, todavía no han sido
suficientemente investigadas para los modelos SV. Sin embargo, se está realizando extensiva investigación en este sentido.
^'^?
5.
^
,'.,i.
CONCLUSIONES
EI artículo de Novales y Gracia-Díez presenta un tema interesante y de mucha
utilidad para aquellos analistas de series temporales financieras que modelicen
la volatilidad mediante modelos GARCH. Sin embargo, las más recientes investigaciones en el análisis de series financieras parecen indicar que los modelos
que modelizan el logaritmo de la volatilidad proporcionan mejores ajustes que
aquellos que modelizan directamente la volatilidad, como es el caso de los
modelos GARCH.
Entre los modelos que especifican una forma funcional para el logaritmo de la
volatilidad, podemos destacar los modelos GARCH exponenciales (EGARCH) y
los modelOS de volatilidad estocástica (SV). Estos últimos modelos están siendo
actualrnente objeto de intensiva investigación y los resultados obtenidos hasta el
momento parecen indicar que ésta puede ser una línea de investigación sobre
la modelización de la volatilidad fructífera en el futuro.
REFERENCIAS
BERA, A. K. y HIGGINS, M. L. (1993). «A Survey of ARCH Models: Properties,
Estirnation and testing», próxima publicación en Journal of Econamic Surveys.
BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroskedasticity» . Journal of Econometrics, 31, 307-327.
BOLLERSLEV, T., CHOU, R. Y. y KRONER, K. F. (1992). «ARCH Modeling in Finance»,
Journal of Econometrics, 52, 5-59.
DAss^os, A. (1992). «Asymptotic Approximations to Stochastic Variance Models»,
manuscrito sin publicar, Departamento de Estadística, London School of Economics, Londres.
ENGLE, R. (1982). «Autoregressive Conditional Heteroskedasticity with Estimates
of the U.K. Inflation», Econometrica, 50, 987-1008.
ENGLE, R. F. y NG., V. K. (1991). «IVleasuring and testing the Impact of News on
Volatility», manuscrito sin publicar.
HARVEY, A. C., Ruiz, E. y SHEPHARD, N. G. (1992). «Multivariate Stochastic Variance
Models». Financial Markets Group Discussion Paper, London School of Econom ics, Lond res.
HIGGINS, M. L. y BERA, A. K. (1992). «A Class of Nonlinear ARCH Models»,
International Economic Review, 33, 137-158.
^ )^.^Ef^ f AR^t.)^;
%.i
NELSON, D. B. (1988). «The Time Series Behaviour of Stockk Market Volatility and
Returns», Tesis Doctoral, Massachusetts Institute of Technology.
NELSON, D. B. (1981). «Conditional Heteroskedasticity in Asset Returns: A New
Approach», Econometrica, Vol. 59, n.° 2, 347-370.
PAGAN, A. R. y SCHWERT, G. W. (1990). «Alternative Models for Conditional Stock
Volatility», Journa! of Econometrics, 45, 267-290.
Ru^z, E. (1992). «Quasi-Maximum Likelihood Estimation of Stochastic Variance
Models», Econometrics Discussion Paper Series, London School of Ecanomics, Londres.
TAYLOR, S. J. (1986). «Modelling Financial Time Series», John Wiley, Chichester,
Reino Unido.
TAYLOR, S. J. (1991). «Modelling Stochastic Volatility», manuscrito sin publicar,
Universidad de Lancaster, Departamento de Contabilidad y Finanzas.
i^
^
';^^i)f`,CI' A E. tF'^1r^^'! ^^{.
ENRiQUE SENTANA
Centro de Estud^os Monetar^os y F^nanc^eros
Este interesante trabajo de Aifanso Novales y Mercedes Gracia-Díez hace
honor a su nombre, y, a mi entender, no pretende ser un panorama exhaustivo
de la plétora de investigaciones teóricas y aplicadas sobre modelos ARCH. EI
lector interesado en una lista exhaustiva de referencias puede consultar también
Bera y Higgins (1992), Bollerslev, Chou y Kroner (1992) y Nijman y Palm (1991).
De hecho, a este ritmo, icasi se podría escribir una panorámica de panorámicas
sobre los modelos ARCH! En base a estas consideraciones, mi intención es
simplemente señalar cinco aspectos de las modelos ARCH que considero relativamente infrainvestigados y a los que he prestado interés recientemente.
a)
NO NEGATIVIDAD DE LOS COEFICIENTES Y CONTRASTES
DE UNA COLA
Para que un modelo ARCH sea realrnente el proceso generador de las observaciones, es necesario que las varianzas condicionadas asociadas sean no
negativas. Dada la forma funcional, ello, evidentemente, impone restricciones
sobre los coeficientes. Por ejemplo, en un ARCH (q) en el que el soporte de !a
distribución condicional es infinito, los parámetros a^ (j=1,...,q) han de ser no
negativos [cf. ecuación (3)]. Sin embargo, en el caso de un GARCH ( p,q), las
restricciones de positividad son más complicadas. Ta! y como Drost y Nijman
(1992) y Nelson y Cao ( 1992) han señalado, lo más adecuado es imponer dichas
restricciones sobre los coeficientes de la forma ARCH (^) implícita en el
GARCH ( p,q). Expandiendo dichos coeficientes en términos de los parámetros
originales, estos autores demuestran que las condiciones impuestas por Bollerslev (1986) [cf. ecuación ( 28)] san excesivamente restrictivas. Por ejemplo, en un
proceso GARCH ( 1,2), bastaría con que aco > 0, a^,[3^ >_ 0 y[3^a^ + a2 >_ 0, de
modo que a2 puede ser negativo. Nótese, sin embargo, que para el modelo más
comúnmente estimado, el GARCH ( 1,1), las restricciones habituales siguen siendo válidas.
Para el caso de los ARCH (q) la existencia de condiciones de no negatividad
sobre los coeficientes no fue aprovechada por Engle en su contraste de los
multiplicadores de Lagrange (cf. sección 4.2), ya que dicho contraste es de dos
colas. Este hecho es importante porque la potencia puede incrementarse sustancialmente si se tiene en cuenta la naturaleza unilateral de la hipótesis alternativa.
Demos y Sentana (1991) y Lee y King (1991) han sugerido recientemente
versiones de una cola para este contraste. Para el caso de alternativas ARCH (1),
^;^ ^MFr^T^aF^^.r,^,
ambos contrastes coinciden, siendo equivalentes al t-ratio asociado con la primera autocorrelación de x?, pero con un valor crítico de una cola.
b)
FORMA FUNCIONAL Y ASIMETRIAS EN VOLATILIDAD
Aunque sin duda la forma funcional originalmente propuesta por Engle (1982),
y generalizada por Bollerslev (1986) es la más común en la literatura aplicada,
la modelización de la varianza condicional en términos de residuos pasados al
cuadrado presenta ciertas limitaciones. Por ejempla, no permite capturar el efecto
asimétrico dinámico ampliamente documentando para series financieras, y generalmente conocido como «leverage effect», en el que la volatilidad aumenta rrás
tras una perturbación negativa que tras una positiva de igual magnitud. Para suplir
esta deficiencia, otras formas funcionales más generales han sido propuestas.
Una de las más populares es el Ilamado GARCH exponencial (EGARCH) de
Nelson (1991), que rnodeliza el logaritmo de la varianza condicional, y permite el
efecto diferenciado de shocks positivos y negativos al incluir tanto el valor absoluto de los retardos como su nivel. No obstante, el EGARCH es un modelo de
heteroscedasticidad multiplicativa que no anida el ARCH de Engle. Posteriormente se han propuesto alternativas anidadas que permiten efectos asimétricos. La
más simple es el Ilamado QARCH (o ARCH cuadrático) que completa el polinomio cuadrático mediante términos lineales y productos cruzados de retardos. EI
caso más simple es el QARCH {1 } en el que 6t = 6+ a^ xt ^+ y^^ xt_^ [véase Engle
(1990) y Sentana (1991)]. AI no abandonarse la forma funcional cuadrática, es
sencillo hallar condiciones sobre los coeficientes que garantizan la positividad
d e 6t .
c)
DEPENDENCIA TEMPORAL Y DISTRIBUCION INCONDICIONAL
Los modelos ARCH y GARCH implican autocorrelación para los cuadrados de
las observaciones. En particular, los modelos GARCH implican especificaciones
ARMA [cf. ecuación (29)]. Dos características de esta dependencia temporal
merecen ser recalcadas. En primer lugar, la magnitud de la varianza incondicional
de la varianza condicional. Como dicha varianza está directamente relacionada
con el cuarto momento incondicional de x, en vista de la expresión en la pág. 29
del texto es fácil comprobar para un GARCH ( 1,1) que la varianza condicional
cambiaría sustancialmente en el tiempo si a es grande y^3 pequeña, mientras
que con R grande y a pequeña se obtendría un proceso muy suave.
En segundo lugar, también es interesante analizar la persistencia del proceso
de varianzas condicionales. En este sentido, quisiera señalar que aunque la suma
de los coeficientes ARCH y GARCH es la medida de persistencia generalmente
j^ i
F
LA L), ^,1^ ^ r A k^^^, ^^^ ^^^, ^i
empleada, no es necesariamente la mejor, puesto que únicamente nos proporciona la tasa a la que decae el efecto de los shocks. A mi juicio, es mejor
considerar el proceso ARMA asociado con los cuadrados y utilizar medidas
tradicionales de persistencía, tales como el retardo med^o. Así, para el caso de
un GARCH (1,1), obtendríamos a(1-^i)-' [1-(a+^3^]^^, que depende no sólo de
(a+^i), sino también de a y^i separadamente.
No obstante, es de destacar que cuando se estiman modelos GARCH para
series temporales financieras es bastante común observar que la suma de los
parámetros es muy próxima a la unidad, en especial si la frecuencia de observación es alta. Esta regufaridad empírica 11evó a Engle y Bollerslev a proponer
los modefos GARCH integrados, o IGARCH. Aunque dichos procesos se asemejen a los procesos ARIMA, existen algunas diferencias significativas. En primer
lugar, Nelson (1990) demostró que en cualquier proceso GARCH (y en particular
IGARCH) con constante igual a cero es implausible porque su varianza condicionai, y por tanto él mismo, converge a cero con rapidez. Por tanto, los IGARCH
empíricamente relevantes son aquellos que contienen deriva. Otro rasgo distintivo es que pese a tener varianza infinita, los procesos IGARCH con deriva son
estrictamente estacionarios [véase Nelson (1990) y Bougerol y Picard (1992)].
Por último, también se cumple que los estimadores pseudo-máximo verosímiles
de los parámetros del modelo tienen una distribución asintoticamente normal
incluso cuando existen raíces unidad en la varianza [Lumsdaine (1991)).
Otra cuestión distinta, pero sin duda relevante, es si el proceso IGARCH es
plausible desde un punto de vista económico. Nótese que la integración implica
que cuaiquier shock en la volatilidad de un activo es permanente y no existe
reversión a la media, y que nuestras previsiones sobre la volatilidad futura siguen
una tendencia lineal debido a la deriva, aunque ésta es generalmente pequeña.
Estos hechos pudieran parecer contraintuitivos, aunque es necesario recordar
que los modelos con distribuciones incondicionales estables que se usan para
series financieras generan varianzas incondicionales infinitas. En este sentido, el
modela 1GARCH presenta una ventaja notable sobre las distribuciones estables
desde el punto de vista de la teoría financiera, pues permite un análisis mediavaríanza condicional incluso cuando ello na es posible incondicionalmente [véase
King, Sentana y Wadhwani (1990)].
Existen al menos dos explicaciones sobre la aparente existencia de integración
en varianza. En primer lugar, puede deberse a la alta frecuencia de las observaciones [Nelson (1992)]. La intuición es aquí la misma que para procesos autorregresivos en media. A medida que un proceso estacionario generado en tiempo
continuo mediante una ecuación diferencial estocástica de primer orden es muestreado a mayores y mayores frecuencias, los parámetros autorregresivos del
AR (1) en tiempo discreto que aparentemente siguen las observaciones tienden
a la unidad [véase p.ej. Priestley (1981)]. Evidencia a favor de esta explicación
C;i ;^^1E N TARP( a`^
Tl
es el hecho de que las series financieras muestreadas a frecuencias bajas
tienden hacia la homoscedasticidad condicional, lo cual no debería abservarse
si realmente contuvieran una raíZ unidad.
La segunda explicación, que también ha sido tomada prestada de la literatura
sobre media condicional, es que la aparente integración en varianza puede ser
el resultado de cambios estructurales [véase Lamoureux y Lastrapes {1990)J. AI
mismo tiempo, es cierto que los procesos GARCH presentan agruparnientos de
volatilidad, lo que puede dar la impresión de que existe cambio estructural en la
varianza sin que lo haya. Del mismo modo que ocurre en la media, ambas
explicaciones pueden ser dificiles de distinguir.
d}
APLICACIONES FINANCIERAS
EI éxito de los modelos ARCH se debe en gran medida a su adecuación tanto
desde el punto de vista teórico como empírico a las aplicaciones financieras. No
obstante, es de destacar que múltiples cuestiones financieras como la valoración
de activos, la selección de cartera o la evaluación de la gestión de fondos de
inversión no pueden ser analizadas satisfactoriamente desde un punto de vista
univariante síno que requieren un enfoque multivariante. Por ejemplo, el momento
condicional de interés desde un punto de vista de teoría financieras a!o CAPM
es la covarianza con e! mercado. Estrictamente, pues, los modelos univariantes
ARCH-M sólo se adecuarian al estudio de la prima de riesgo agregada.
EI mayor problema de los modelos rnultivariantes es su dimensionalidad. Con
N series, hay N varianzas y N(N-1)/2 covarianzas condicionales que modelizar.
Incluso para valores de N moderadamente pequeño, el problema es insoslayable
sin restricciones. Ello explica que las aplicaciones univariantes de modelos ARCH
sean las más extendidas. Sin embargo, empiezan a aparecer parametrízaciones
multivariantes parsimoniosas que son computacionalmente factibles. Dada la
larga tradición del uso de modelos de índices o factores en finanzas, no es quizá
sorprendente que uno de los enfoques más populares sea los rnodelos factoriales
condicionalmente heterocedásticos [véase por ejemplo, Dieáold y Nerlove (1989),
Engle, Ng y Rothschild (1990), y King, Sentana y Wadhawani (1990)]. Dichos
modelos se basan en que la hipótesis bastante plausible de que una parte
importante de la volatilidad de diversos activos financieros es común.
e)
MODELOS ARCH COMO MEDIDAS DE VOLATILIDAD
La varianza condicional estimada a partir de un rnodelo ARCH univariante nos
da una medida de la volatilidad del activo financiero de que se trate. Es importante
destacar que no es ciertamente la única que se ha sugerido, ni necesariamente
/`'^
C^^r Í ^^.'w.}í':':a ; Il_
^^ C"^ h::r,^{^^^1 ll
la mejor. Para poder discutir este tema en profundidad, sin embargo, es necesario
definir qué es volatilidad. A mi juicio, la definición más precisa es la Que se
encuentra en un reciente trabajo de Andersen (1992), quien identifica volatilidad
con la varianza condicional de un activo. EI problema es condicional en qué.
Desde el punto de vista financiero, es natural suponer que el conjunto de información relevante es el que disponen los participantes en los mercados. En
cambio, el estudioso sólo cuenta con un subconjunto muy limitado de dicha
información, tanto porque la frecuencia de observación de sus datos es sustancialmente menor que el cuasi-continuo que observan los agentes, como por
considerar sirnultáneamente un número de variables pequeño, normalmente sólo
la serie en cuestión. Ello implica que aunque conociéramos los parámetros que
caracterizan la varianza condicional a nuestro conjunto de información, ésta
seguiría siendo una estimación de la volatilidad subyacente.
En parte relacionado con lo anterior, está el hecho de que a diferencia de los
modelos ARIMA, los modefos ARCH entendidos como especificaciones de la
distribución condicional de una serie temporal, no constituyen una clase cerrada
a su agregación temporal o contemporánea. Es decir, que si por ejemplo los
datos de rentabilidades del mercado de divisas se generan minuto a minuto para
todas las divisas simultáneamente can una distribución condicional multivariante
ARCH, la distribución condicional de los datos de la peseta-dólar diarios no será
la de un proceso univariante ARCH. Este problema se puede resolver reinterpretando los modelos ARCH como ARMA para los cuadrados de las diversas series,
en cuyo caso sí que están cerrados respecto a la agregación ternporal y contemporánea [véase Drost y Nijman (1992) y Nijman y Sentana (1993)]. Las propiedades de los estimadores pseudo-máximo verosímiles en tal caso aún no son
bien conocidas.
BIBLIOGRAFIA ADICIONAL
ANDERSEN, T. G. (1992). «Volatility». Kellog Graduate School of Management
Working Paper 144, Northwestern University.
BERA, A. K. y H^GG^NS, M. L. (1992). «A Survey of ARCH Models: Properties,
Estimation and Testing», manuscrito, University of Illinois at Urbana-Champaign.
BOLLERSLEV, T., CHOU, R. Y. y KRONER, K. F. (1992). «ARCH Modeling in Finance:
A Review of the Theory and Empirical Evidence», Journal of Econametrics, 52,
5-59.
B^UGEROL, P. y PICARD, N. (1992). «Stationarity of GARCH processes and of some
nonnegative time series», Journal of Econometrics, 52, 115-127.
r.^_^nnE^ r^^ 1^F,^zi^^^-^
79
DEMOS A. y SENTANA, E. (1991). «Testing for GARCN effects: A one-sided approach», manuscrito, London School of Economics.
DIEBOLD, F. X. y NERLovE, M. (1989). «The dynamics of exchange rate volatility: A
multivariate latent factor ARCH model», Journal of Applied Economectrres, 4,
1-21.
DROST, F. C. y NIJMAN, Th. E. (1990). «Temporal Aggregation of GARCH Processes», de próxima aparición en Econometrica.
ENGLE, R. F. (1990). «Discussion: Stock market volatility and the crash of 87»,
Review of Financial Studies, 3, 103-106.
ENGLE, R. F. , NG, V. y ROTHSCHILD., M. (1990). «Asset pricing with a Factor-ARCH
covariance structure: Empirical estimates for treasury bills», Journal of Econometrics, 45, 213-237.
«Volality and links between
national stock markerts», NBER Working Paper 3357.
Í'C{NG, M. A., SENTANA, E. y WADH1l'VANI, S. B. (1990) .
LAMOUREUX, G. C, y LASTRAPES, W. D. (1990). «Persistence in variance, structural
change and the GARCH model», Journal of Business and Economic Statistics,
8, 225-234.
LEE, J. H. y K^NG, M. L. (1991). «A locally most mean powerful based score test
for ARCH and GARCH regression disturbances», Monash University Department of Economics Working Paper 9/91.
LUMSDAINE, R. L. (1991). «Asymptotic Properties of the quasi-rnaximum likelihood
estimator in GARCH (1,1) and IGARCH (1,1) models», rnanuscrito, Princenton
University.
NELSON, D. B. (1990). «Stationarity and Persistence in the GARCH { 1,1) Model»,
Econometric Theory, 6, 318-334.
NELSON, D. B. (1991). «Conditional heteroskedasticity in asset returns: A new
approach», Econometrica, 59, 347-370.
NELSON, D. B. (1992). «Filtering and forecastíng with misspecified ARCH models:
Getting the right variance with the wrong model», Journal of Econometrics, 52,
61-90.
NELSON, D. B. y CAO, C. Q. (1992). «Inequality constraints in the univariate GARCH
model», Journal af Business and Economic Statistics, 10, 229-235.
NIJMAN, Th. E. y PALM, F. C. (1991). «Recent Developrnents in Modeling Volatility
in Financial Data», Center Discussion Paper 9168, Tilburg University.
N^^MAN, Th. E. y SErvTANA, E. (1993). «Marginalization and contemporaneous
aggregation in multivariate GARCH processes» , Center Discussion Paper
9312, Tilburg University.
PR^EST^EY, M. B. (1981). «Spectral Analysis and Time Series» Academic Press,
Londres.
SENTANA, E. (1991). «Quadratic ARCH Models: A potential re-interpretation of
ARCH Models», LSE FMG Discussion Paper 122.
i) ^^,^ E_ ^^^J 1 r, k ^^:_^ ^.^^
^Í
F. JAVIER TRIVEZ
Departamento de Análisis Econámico
Facuitad de Ciencias Económicas
Universidad de Zaragoza
Los modelos econométricos que consideran conjuntamente la modelización de
las medias y las varianzas condicionales constituyen actualmente uno de los
temas de investigación más fructíferos en el análisis de series temporales económicas. Por ello, resulta muy oportuna la elección por parte de la revista
Estadística Española del artículo invitado «Guía para 1a estimación de modelos
ARCH ». Mis felicítaciones, por tanto, a la dirección de la revista, y mi agradecimiento por su invitación a participar en la discusión de tan importante tema.
Los profesores Alfonso Novales y A/lercedes Gracia-Díez presentan una revisión de los modelos de heteroscedasticidad condicional autorregresiva, prestando especial atención a su estimación de máxima verosimilitud (MV).
Su principal contribución consiste en deducir las expresiones analíticas del
vector gradiente y de la matriz hessiana con el fin de facilitar la programación del
algoritrno de «scoring» para la estimación MV de los parámetros de distintos
modelos con estructura de heteroscedasticidad condicional. En este sentido, se
efectúa una revisión de diferentes modelizaciones de la presencia de heteroscedasticidad condicional, comenzando por la formulación ARCH enunciada en el
traba^ o pionero de Engle {1982), y continuando con la generalización de dicho
modelo el modelo GARCH propuesto por Bollerslev (1986), así como con el
denominado modelo ARCH en media o modelo ARCH-M de Engle, Lilien y
Robins (1987).
EI trabajo está expuesto con la claridad y el rigor que caracteriza a los autores,
y supone una estupenda introducción al estudio de los modelos tipo ARCH.
Mi comentario se va a centrar en posibles extensiones del traba ^ o, teniendo en
cuenta que recientemente se ha producido una extensa literatura sobre modelos
ARCH, una buena revisión de la misma puede verse en Bollerslev, Chou y Kroner
(1992), que ha incidido fundamentalmente en dos cuestiones: la formulación de
nuevas modelizaciones de la varianza condicional y el desarrollo de rnétodos de
estimación alternativos al de máxima verosimilitud.
SOBRE NUEVAS MODELIZACIONES DE LA VARIANZA CONDICIONAL
Dentro de la amplia literatura referida a nuevas modelizaciones de la varianza
condicional, cabe destacar dos enfoques no considerados en el articulo de
Novales y Gracia-Díez, y para los que sería interesante derivar {as expresiones
pertinentes que facilitaran la programación del método de estimación máximo
verosímil; por un lado, el modelo GARCH exponencial, y, por otro, la aproximación multivariante.
a)
EI modelo EGARCH
Una limitación importante del modelo GARCH escrito en (28) viene dada por el
hecho de que, como consecuencia de las restricciones que se imponen en los
parámetros, la estructura GARCH sólo permite modelizar relaciones de magnitud y
no de signo (positivo o negativo) entre la varianza (ht ) y^,t. En ocasiones, sin
embargo, resulta conveniente contrastar relaciones de signo y no sólo de magnitud.
Por ejemplo, para analizar si tal y como señala Black (1976) existen correlaciones
negativas entre los rendimientos presentes de las acciones y la volatilidad futura.
Con el fin de superar esta limitación, Nelson (1991) ha propuesto el modelo
GARCH exponencial o modelo EGARCH, en el que la varianza condicional se
define como
q
P
In hx = bo +^ ó^ [$^ zc-^ + Y(IZc-^I - E IZc-^I ) +^ E^; I n h i;
^ ^
[1J
donde: Zt = ^t/ht
En (1) no se necesita ningún tipo de restricción paramétrica para evitar varianzas negativas. Por tanto, a partir de [1 ] si se cumple que b;^; ^ 0, podemos concluir
que la varianza tiende a aumentar (disminuir) cuando ^t_; es negativa (positiva),
pudiendo contrastar, en consecuencia, relaciones de signo entre la varianza y
las innovaciones.
b)
ARCH multivariante
E! artículo de Novales y Gracia-Díez se centra en modelos univariantes. En
ocasiones, sin embargo, puede ser conveniente plantear modelos multivariantes.
Denotando ahora mediante ^,t un vector N x 1 de innovaciones, podemos
escribir:
^t = Zt H t^^^
[2]
donde zt es un vector de N variables aleatorias que se distribuyen idéntica e
independientemente con vector de esperanzas nulo y matriz de varianzas y
covarianzas igual a la matriz identidad; y siendo Ht una matriz variable en el
tiempo definida positiva, cuadrada de orden N.
^:^ a r^^ ^ r^^ t ^^F^ i^^ ;^ ^-;
A partir de (2), suponiendo normalidad, se obtiene:
^'t I S^t-^ ^ N(G, Ht)
C3]
Todas las parametrizaciones univariantes consideradas en el art+culo de Novales y Gracia-Díez pueden plantearse en un contexto multivariante. Por ejemplo,
el modelo GARCH (p,q) multivariante vendría definido por [3] y:
4
p
vech (Ht) = c + ^ A; vech (Et_; ^'t_;) + ^ B; vech (Ht_;)
^ __. ^
^ -_ ^
[^l
donde vech (.) denota un vector columna formado por los efementos de la diagonal principal y los inferiores a ella, de la matriz simétrica Ht, c es un vector de
orden 1/2 N(N+1) x 1 y A;, i= 1, .. ., q y B;, i= 1, ..., p son matrices cuadradas de
orden 1/2 N(N+1).
Un probíema asociado con la expresión [4] es que el número de parámetros a
estimar si no se impone ningún tipo de restricción es muy elevado. Entre las
soluciones adoptadas, cabe citar el considerar las matrices A; y B; como diagonales. Esta solución es la que adoptan Bollerslev, Engle y Wooldridge ( 1988),
quienes consideran además un modelo GARCH-M multivariante, definiendo en
conjunción con [3] y [4):
Yt=a+^9(Ht)+^t
donde yt es un vector de variables aleatorias de orden N x 1 y a es un vector
columna de N constantes. Además suponen: g(Ht) = Ht c^_^, siendo c^_^ un vector
de ponderaciones.
Para estimar este modelo aplican el algoritmo de Berndt, Hall, Hall y Hausman
(1974) a la maximización de la función lograrítmica de verosirnilitud, que vendrá
dada por:
donde:
It =- T In(2^) - ^ In IHt(^)I ^ ^^t (^)' Hi 1(^) ^c (H)
2
2
2
estando definido el vector de parámetros 6 como:
8' _ [a', ^3', c', vec (A^ )', . . . , vec (Aq)', vec ( B ^ )', . . . , vec ( B p)']
y siendo ^t = yt - a- ^iHt c^__^ .
,^i (,
r,°, 4
f, ^. ^
SOBRE METODOS DE ESTIMACI^N
Los madelos tipo ARCH han sido estimados habitualmente mediante el procedimiento de máxirna verosimilitud, dada la simplicidad relativa del mismo, así
como las buenas propiedades que dichos estimadores cumplen bajo condiciones
^deales. Así, cuando la hipótesis de normalidad condicional en correcta, resulta
evidente que los mejores estimadores son los MV ya que, bajo ciertas condiciones de regularidad, son asintóticamente eficientes.
Como señalan, sin embargo, Engle y González-Rivera (1991) y Bollerslev y
Wooldridge (1992), el supuesto de normalidad condicional puede ser muy restrictivo. En concreto, en las series financieras, que configuran la base ínformativa
más frecuentemente utilizada en las aplicaciones de los modelos tipo ARCH,
existe suficiente evidencia para rechazar el supuesto de normalidad condicional.
Véanse, por ejemplo, Ios trabajos de Singleton y Wingender (1986), French,
Schwert y Stambaugh (1987) y Badrinath y Chatterjee (1988). Por este motivo,
en diversos trabajos se ha estudiado la robustez de los estimadores MV.
Bollerslev y Wooldridge (1992) aplican el procedimiento cuasimáximo verosímil
(CMV) con el fin de examinar el comportamiento de estos estimadores en una
clase general de modelos dinámicos, cuando se maximiza el logaritmo de la
función de verosimilitud normal, pero se incumple el supuesto de normalidad,
obteníendo que en este caso, y siempre que se dé una especificación correcta
de los dos primeros momentos, los estimadores MV aplicados a modelos GARCH
son cvnsistentes aunque la verdadera función de densidad no sea la normal.
Engle y González-Rivera (1991) cuantifican la pérdida de eficiencia que conlieva la estimación MV cuando se supone erróneamente la normalidad. Para ello,
definen la eficiencia relativa de la estimación CMV de un parámetro 6 como el
cociente entre la varianza asintótica de este estimador cuando se conoce la
hipótesis de normalidad y cuando se supone equivocadamente, esto es:
Var ( ^ MV)
ERf^ = Var ^
(
[5]
CMV)
Considerando dos posibles distribuciones alternativas, la gamma y la t de
Student, obtienen una cuantificación del ratio (5), concluyendo que aunque la
pérdida de eficiencia al estimar bajo el supuesto de normalidad siendo la verdadera distribución la t de Student no es muy elevada, cuando la verdadera distribución es la gamma la pérdida de eficiencia puede Ilegar a ser muy importante
(en concreto, Ilegan a obtener valores del ratio iguales a 0,21).
Esta es la razón por la que Engle y González-Rivera (1991) proponen un
método de estimación semiparamétrico desarrollado por Tapia y Thompson
^"^"E ^+ T!"^^?^' )`^
(1978), que según demuestran mediante un estudio de Monte-Carlo, mejora la
eficiencia de los estimadores CMV.
Mark (1988) encuentra que el método de momentos generalizados (GMM) de
Hansen (1982) es robusto, si bien, como señalan, estos estimadores tienen la
desventaja de no ser, en general, asintóticamente eficientes. Este método de
estimación ha sido aplicado también, entre otros, por Bodurtha y Mark (1991),
quienes apuntan como desventaja del GMM el que disminuye las posibilidades
de mala especificación, debido a que al aplicar este método no es necesario el
parametrizar y estimar muchas características de los modelos que tan sólo tienen
un interés incidental.
Otras estrategias de estimación utilizadas en la literatura, véase Pagan y
Schwert (1991), han sido los no paramétricos, tales como los métodos Kernel y
de la Forma de Fourier Flexible.
Todos estos trabajos, si bien no deben conducir a un rechazo del método de
estimación MV, sí ponen de manifiesto la necesidad de seguir estudiando la
problemática de la estimación de los modelos tipo ARCH. En esta línea, un
estudio comparativo de las propiedades y del comportamiento en muestras pequeñas de los diferentes métodos de estimación propuestos en la literatura sería
de gran utilidad.
REFERENCIAS BIBLIOGRAFICAS
BADRINATH, S. G. y CHATTERJEE, S. (1988). «On Measuring Skewness and Elongation in Common Stock Return Distributions: The Case of the Market Index»,
Journal of Business, 61, 451-472.
. «Estimation and
Inference in Nonlinear Structural Models», Annals of Economic and Social
Measurement, 4, 653-665.
BERNDT, E. K., HALL, B. H., HALL, R. E. y HAUSMAN, J. A. (1974)
BLACK, F. (1976). «Studies of Stock Price Volatility Changes». En Proceedings of
the Business and Economic Statistics Section American Statistical Association,
177-181.
BODURTHA, J. M. y MARK, N. C. (1991). «Testing the CAPM with Time Varying Risks
and Returns», Journal of Finance, 46, 1485-1505.
BOLLERSLEV, T. (1986). «Generalized Autoregressive Conditional Heteroskedasticity», Journal of Econometrics, 31, 307-327.
BOLLERSLEV, T., CHOU, R. Y. y KRONER, K. F. (1992). «ARCH Modeling in Finance.
A Review of the Theory and Empirical Evidence», Journa/ of Econometrics, 52,
5- 59 .
^i f.:>
^ '_
^ ^ ^•, ^ c , ^r
BOLLERSLEV, T., ENGLE, R. F. y W^OLDRIDGE, J. M. (1988). aA Cap'rtal Asset pricing
Modei with Time Varying Covariances», Journal of Pofitical Economy, 96,
11fi-131.
BOLLERSLEV, T. y WOOLDRIDGE, J. M. (1992). «C^uasi Maximum Likelihood Estimation
and Inference in Dynamic Models with Time Varying Covariances», Econometric Reviews, 11, 143-172.
ENGLE, R. F. (1982). «Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K. Inflation», Econometrica, 50, 987-1007.
ENGLE, R. F. y GONZÁLEZ-RIVERA, G. (1991). «Semiparametric ARCH Models»,
Journal of Business and Economic Statistics, 9, 345-359.
ENGLE, R. F., L^L^EN, D. M. y RoB^NS, R. P. (1987). «Estimating Time Varying Risk
Premia in the Term Structure: The ARCH-M Model», Econometrica, 55, 391407.
FRENCH, K. R., SCHWERT, G. W. y STAMBAUGH, R. F. (1987). «Expected Stock
Returns and Volatility», Journal of Financial Economícs, 19, 3-29.
HANSEN, L. P. (1982). «Large Sample Properties of Generalized Method of Moments Estimators», Econometrica, 50, 1029-1054.
MARCK, N. (1988). «Time Varying Betas and Risk Premia in the Pricing of Forward
Foreign Exchange Contracts», Journal of Financial Economics, 22, 335-354.
NELSON, D. B. (1991). «Conditional Heteroskedasticity in Asset Returns: A New
Approach», Econometrica, 59, 347-370.
PAGAN, A. R. y SCHWERT, G. W. (1990). «Alternative Models for Conditional Stock
Volatility», Journal of Econametrics, 45, 267-290.
SINGLETON, J. C. y WINGENDER, J. (1986). «Skewness Persistence in Common Stock
Returns», Journal of Financial and Quantitative Analysis, 21, 335-341.
TAP^A, R. A. y THOMPSON, J. R. (1978). «Nonparametric Probability density Estimation», Baltimore: Johns Hopkins University Press.
ESTADISTICA ESPAÑOLA
Vol. 35, Núm. 132, 1993, págs. 87 a 89
CO NTESTACION
ALFO^ NSO NOVALES
MERCEDES GRACIA-DIEz
No podemos sino comenzar agradeciendo a Estadística Española la invitación
que en su día nos hizo a publicar este artículo acompañado de comentarios. En
ellos, los diversos autores ponen de manifiesto el interés que existe actualmente
por la rnodelización de esquemas de varianza carnbiante en el tiempo, concentrándose en las líneas específicas de extensión de los modelos ARCH-GARCH
que consideran de mayor interés.
Nuestro interés al escribir el artículo fue, como su nombre indica, el poner a
disposición del lector una breve síntesis intraductoria a la modelización ARCH,
así como profundizar en cuestiones descriptivas concernientes a la programación
de los algoritmos numéricos para su estimación por máxima verosimilitud. Los
comentarios presentados por los distintos autores invitados por Estadística Española son, por tanto, un complemento muy adecuado, así como conveniente,
para quien quiera tener una visión rnás completa de este tipo de modelizaciones.
Los profesores E. Ruiz, I. Peña y E. Sentana se concentran en el interés que
suponen las diversas generalizaciones a los modelos ARCH que actualmente se
están proponiendo en la literatura especializada. Entre los muchos citados, las
representaciones GARCH exponencial (EGARCH) y ARCH cuadrática (QARCH),
así como la representación de volatilidad estocástica en que E. Ruiz se halla
actualmente trabajando, parecen especialmente interesantes. E. Sentana también expone otras consideraciones importantes basadas en investigaciones más
recientes. Las condiciones menos restrictivas sobre la no negatividad de coeficientes en los modelos GARCH, las diferencias entre los procesos IGARCH y los
modelos ARIMA, la necesidad en muchos casos de Ilevar a cabo una modelización multivariante y las consideraciones realizadas por este autor sobre la relación entre varianza condicional y volatilidad, son aspectos que deben tenerse en
cuenta a la hora de utilizar este tipo de modelos.
fif^
^^ ^,'.'•[;^i^.. ^,,
f
Los profesores J. Trívez y T. Pérez Amaral prestan especial atención en sus
comentarios a las consecuencías de posibles errores de especificación en modelos ARCH. J. Trívez se centra en la posible pérdida de eficiencia (y quizá
cansistencia) ante un incorrecto supuesto de Normalidad, aspecto sin duda
merecedor de un mayor anáiisis. Nuestras expresiones se basan en el supuesto
inicial de Normalidad, pero podrían extenderse sin ninguna dificultad a otro tipo
de distribuciones. T. Pérez enfatiza la importancia de ilevar a cabo los contrastes
de especificación adecuados para poder justificar plenamente los resuftados de
la estimación máximo-verosímil de este tipo de modelos. Tanto la propia existencia de estructura ARCH, como los aspectos distribucionales y la correcta especificación del vector de variables explicativas, pueden y deben ser objeto de
contraste.
Los profesores J. del Hoyo y A. Martín Arroyo por un lado, y A. García Ferrer
y A. de Juan por otro, proponen una reflexión metodológica sobre un aspecto
que consideramos crucial y que ha recibido alguna atención en la literatura, si
bien no tada la que por su importancia merece. A. García Ferrer y A. de Juan
sugieren la consideración de que las estructuras ARCH no sean, en algunos
casos, sino mero reflejo de otras características del rnodelo. En algunos casos,
la existencia de un alto número de valores atípicos de magnitud importante,
puede conducir a!a creencia de que existe una estructura ARCH; en otros casos,
como ya se ha mostrado en la literatura, variables como el volumen de negociación, no incorporadas al modelo, pueden sugerir la existencia de estructuras
ARCH que desaparecen si las variables mencionadas se explicitan.
EI tema de los posibles valores atípicos sugiere la necesidad de examinar
rigurosamente los residuos de una estimación inicial con varianza constante,
antes de proceder a una especificación ARCH-GARCH. Estos modelos se basan
en conceptualizaciones en que la varianza de una serie varía temporalmente,
pero con cierta suavidad, y no para aquellos casos en que los cambíos en la
varianza se deben únicamente a valores extremos aislados.
Especial interés tiene la propuesta de !os profesores J. del Hoyo y A. Martín,
que sugieren que la modelización de una varianza cambiante en el tiempo no es
sino una manifestación más de los cambios estructurales asociados a toda
relación entre variables económicas. Las estructuras económicas no son inmutables, sino todo lo contrario; sus variaciones son, seguramente, muy suaves,
pero debe considerarse seriamente la ganancia en eficiencia ( en sentido genérico) que supondría la rnodelización correcta de tal aspecto. Como manifiestan
estos autores, existe equivalencia analítica entre modelos ARCH y modelos de
coeficientes cambiantes lo que, nuevamente, aporta más ambigi^edad a este
tema. Su propuesta de utilizar el filtro de Kalman para la estimación de modelos
ARCH-GARCH merece ser objeto de detallado estudio.
,^^1i r, r,•,Fr,, ^,-,
^it^
Nuestro agradecimiento a todos estos autores, tanto por acceder a completar
nuestro trabajo, como por habernos proporcionado a nosotros mismos una panarámica más global de ia clase de modelos aqui analiZados. De nuevo, al
Consejo de Redacción de Estadística Española, nuestro agradecimiento por el
tratamiento dado a nuestro artículo.
Descargar