TEMA 3 MODELOS UNIVARIANTES LINEALES Motivación El proceso de construcción de un modelo univariante ARIMA se basa en un procedimiento iterativo en el que el conocimiento de las propiedades teóricas de los diferentes procesos así como la observación e interpretación de la series son importantes. La teoría económica no juega un papel relevante en la especificación de estos modelos. Sin embargo, las conclusiones que se extraen de estos modelos pueden ser útiles para pensar en términos económicos. Por ejemplo, la especificación de modelos ARIMA puede dar respuesta a este tipo de preguntas: ¿Existe una tasa de inflación de equilibrio en una determinada economía? ¿Cuáles son las características del ciclo económico? ¿De qué forma podemos proyectar las ventas futuras de una determinada empresa? Estructura del tema 3.1. La metodología Box-Jenkins. 3.2. Especificación inicial 3.2.1. Contrastes de raíces unitarias. a) Contraste Dickey-Fuller. b) Contraste de raíces estacionales. 3.2.2. Análisis de correlogramas 3.3. Estimación. 3.4. Valoración de modelos 3.4.1. Contrastes de hipótesis sobre los coeficientes. 3.4.2. Análisis de residuos 3.4.3. Contrastes respecto a modelos alternativos. Importante Cuando se trabaja con datos reales debe tenerse en cuenta que ningún modelo es verdadero. Pero algunos son útiles. Esto significa que el modelo que finalmente seleccionemos debe cumplir ciertas propiedades estadísticas para que sea correcto pero al mismo tiempo antes debe compararse con diferentes modelos posibles. Esta comparación debe hacerse de forma que tenga sentido. Nunca proponer un modelo en el que no creemos. 3.1. La metodología Box-Jenkins Pasos en la construcción del modelo 1. Determinar la transformación estacionaria de la serie. 2. Analizar el correlograma para determinar el modelo apropiado para la transformación estacionaria de la serie. 3. Estimar los parámetros del modelo. 4. Diagnóstico del modelo para comprobar que el modelo está bien especificado. 5. Basado en el paso 4 proponer y estimar estructuras alternativas que puedan compararse con la especificación inicial. 6. Una vez escogida la especificación óptima utilizar el modelo para extraer conclusiones económicas o para predecir. 3.2. Especificación inicial Serie del Indice de Producción Industrial (IPI) en España 120 110 100 90 80 70 60 50 40 30 1975 1980 1985 1990 1995 IPI 2000 2005 2010 ¿Qué observamos? ¿Tendencia? ¿Estacionalidad? ¿Heterogeneidad en la varianza? ¿ Crisis económica? ¿Qué características se observan en esta serie? 1. Con respecto a la tendencia se observa crecimiento sistemático aunque con muchas rupturas. - Crecimiento mas o menos continuado de la produccion industrial durante todo el periodo de analisis... - Excepto por la importante crisis que se inicia desde finales de 2007 a la actualidad. 2. Se observa que las fluctuaciones del IPI se incrementan con el nivel de la serie. 3. Estacionalidad muy marcada. ¿Qué transformación debe realizarse en primer lugar? Parece lógico tomar la transformación logarítmica por dos razones Para eliminar la heterocedasticidad condicional de la serie. Para liberarnos de la arbitraria unidad de medida de los números índices de forma que al tomar primeras diferencias la serie pueda ser interpretada como tasas de crecimiento. La transformación logarítmica rara vez hace daño, incluso aunque no se observe heterocedasticidad condicional. Sólo no tomamos transformación logarítmica cuando la serie esté ya expresada en términos porcentuales: tipos de interés, tasa de desocupación, etc. Pero, ojo!!! La transformación logarítmica no elimina las propiedades tendenciales de la serie. Serie del IPI en logaritmos naturales 4.8 4.6 4.4 4.2 4.0 3.8 3.6 1975 1980 1985 1990 1995 LIPI 2000 2005 2010 Correlogramas ¿Qué conclusión extraemos de todo esto? La serie muestra crecimiento sistemático durante el periodo de análisis. El lento decrecimiento del correlograma nos indica que la serie es no estacionaria y necesita al menos una diferencia regular. Ademas, se observa la presencia de una estacionalidad que por su lento decaimiento hace pensar que sea no estacionaria. Tendencia Es claramente estocástica y así ocurre en la práctica totalidad de las series económicas. Si la tendencia fuera determinista, ésta debería ser eliminada tras regresar la serie con una constante y un término de tendencia. Si la tendencia fuera determinista, los residuos de esa regresión deberían ser estacionarios. .3 .2 .1 .0 -.1 -.2 -.3 -.4 -.5 -.6 1975 1980 1985 1990 1995 RESID 2000 2005 2010 Los residuos no parecen estacionarios ya que su retardos estacionales muestran un decrecimiento muy lento… En la proxima seccion veremos como contrastar por estacionariedad de manera formal Otros ejemplos Tasa de desempleo en España (serie desestacionalizada). IBEX35 Tasa de desempleo 22 20 18 16 14 12 10 8 6 92 94 96 98 00 02 04 DESEMPLEO 06 08 10 Correlograma tasa de desempleo Tasa de desempleo La serie no muestra crecimiento sistematico, pero tampoco parece tener una media constante. El lento decrecimiento del correlograma tambien deja entrever que se trata de una serie no estacionaria. En este caso, no se requiere la transformacion logaritmica de la serie puesto que la variable esta expresada en tasas. IBEX35 16000 14000 12000 10000 8000 6000 4000 2000 94 96 98 00 02 04 IBEX35 06 08 10 IBEX35 Parece que la serie crece en el tiempo aunque sujeta a importantes cambios estructurales. No parece que tenga un comportamiento estacional. Puede resultar conveniente tomar logaritmos de la serie para interpretar sus primeras diferencias como rentabilidades bursatiles. IBEX 35 en logaritmos 10.0 9.6 9.2 8.8 8.4 8.0 7.6 94 96 98 00 02 04 LIBEX35 06 08 10 Correlograma del logaritmo del IBEX 35 Test de raíces unitarias Un contraste más formal sobre la necesidad de tomar primeras diferencias de las series son los contrastes de raíces unitarias. De entre ellos, el más popular es el contraste DickeyFuller. Supongamos una serie generada por un proceso AR(1) 𝑦𝑡 = 𝑐 + 𝜙𝑦𝑡−1 + 𝑎𝑡 El test DK está diseñado para contrastar la siguiente hipótesis 𝐻0 : 𝜙 = 1 La serie no es estacionaria 𝐻1 : 𝜙 < 1 La serie es estacionaria Bajo la nula tenemos un paseo aleatorio con deriva que explica procesos con crecimiento sistemático. - Incluimos una constante en el modelo ya que comparamos con la alternativa de estacionariedad para lo que la media debe ser constante y no necesariamente cero. - Es un contraste unilateral. Por razones numéricas, el contraste se basa en la estimación MCO de la Siguiente ecuación ∆𝑦𝑡 = 𝑐 + (𝜙 − 1)𝑦𝑡−1 + 𝑎𝑡 ∆𝑦𝑡 = 𝑐 + 𝜙 ∗ 𝑦𝑡−1 + 𝑎𝑡 Las hipótesis son ahora 𝐻0 : 𝜙 ∗ = 0 𝐻1 : 𝜙 ∗ < 0 El estadístico t se obtiene de la forma habitual. Sin embargo, su distribución asintótica bajo la hipótesis nula debe obtenerse numéricamente al no seguir una distribución standard. Contraste DF El contraste debe ser completado incluyendo suficientes retardos. Elementos deterministas tales como tendencia, dummies estacionales, etc. Pero, los valores críticos de este contraste pueden ser alterados con la inclusión de elementos deterministas. En el caso de raices estacionales, el contraste DF puede detectar la presencia de no estacionariedad si se incluyen sufientes retardos. Existen tests especificos para contrastar la presencia de estacionalidad no estacionaria, pero no seran objeto de analisis en este curso. Debemos guiarnos por la informacion que proporciona la inspeccion de graficos y correlogramas asi como tests DF standard. La selección del modelo se realiza utilizando algún criterio de información a) Suma de cuadrados residual corregida por los grados de libertad: Sc 2 T T k T at / T 2 t 1 1 T 2 at / T 1 v t 1 donde: v k / T. v es un parámetro de penalización. b) AIC (Criterio de información de Akaike) T A exp( 2v) at 2 / T t 1 c) SIC (Criterio de información de Scharz) S T T (v) a t 1 2 t /T Test DF para el IPI en logaritmos Test DF para los residuos de un modelo de tendencia determinista para el logaritmo del IPI Tanto el análisis gráfico, como los correlogramas , como los contrastes de raíces unitarias sugieren que la serie no es estacionaria. La inspeccion del gráfico y el correlograma indican que existe estacionalidad de caracter no estacionario. El hecho de que los residuos del modelo con tendencia determinista no sean estacionarios es una clara indicacion de que el modelo que genera la serie no tiene tendencia determinista. En las otras dos series ocurre igual aunque no se mostraran los contrastes por un proposito de brevedad. Serie log IPI en diferencias anuales .2 .1 .0 -.1 -.2 -.3 -.4 1975 1980 1985 1990 1995 D12LIPI 2000 2005 2010 Serie log IPI en diferencias anuales Serie log IPI en diferencias anuales Serie de desempleo (niveles) Serie de desempleo (primeras diferencias) Desempleo La serie de desempleo en niveles no es estacionaria. Tras tomar una diferencia, la serie es estacionaria si consideramos un nivel de significacion del 5% pero seguiria sin ser estacionaria si considerasemos un nivel de significacion del 1%. Que hacer??? En general en mucho mas arriesgado considerar como estacionaria una serie que no es estacionaria que considerar como no estacionaria una serie que es estacionaria. Si una serie es estacionaria y la sobrediferenciamos Pequena perdida de eficiencia en la estimacion. La varianza de los errores de prediccion son mayores Si estimamos un modelo para una serie no estacionaria El modelo no es robusto y no puede adaptarse a valores futuros. El error de prediccion crece con el horizonte temporal y las varianzas estan subestimadas. Por esto, en caso de duda preferimos sobrediferenciar. Sin embargo, en nuestro caso particular, no parece logico suponer que el crecimiento de la tasa de desempleo no es estable. El hecho de que exista un cambio estructural tan fuerte producto de la crisis economica afecta a la potencia del test. Logaritmo del IBEX35 Logaritmo del IBEX35 (primeras diferencias) IBEX35 El indice bursatil IBEX35 no es estacionario. Pero, la rentabilidad mensual del IBEX35 si es estacionaria de acuerdo al test DF. Test de raíces estacionales ¿Qué hacer cuando la serie tiene estacionalidad? El test Dickey-Fuller habitual puede considerarse para contrastar la presencia de raíces unitarias en series con estacionalidad siempre y cuando incluyamos un número de retardos suficiente en la especificación del test. Sin embargo, en este tipo de series nuestra preocupación no es tanto si debemos tomar una diferencia regular sino saber si la estacionalidad es estocástica y por lo tanto debemos tomar una diferencia estacional para transformarla en estacionaria. Necesitamos por lo tanto otro tipo de test que de respuesta a esta pregunta. Test de raíces estacionales Una posible estrategia se basa en una regresión del tipo: ∆𝑠 𝑥𝑡 = 𝑐 + 𝜙𝑥𝑡−𝑠 + 𝑅𝑒𝑡𝑎𝑟𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 + 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡𝑎𝑠 + 𝐸𝑟𝑟𝑜𝑟 donde la hipótesis nula es ahora que la serie requiere una raíz estacional para transformarse en estacionaria 𝐻0 : 𝜙 = 0 mientras la alternativa es que la serie es ya estacionaria sin necesidad de transformarla 𝐻1 : 𝜙 < 0 Ojo! Este contraste no lo realiza Eviews automáticamente por lo que deberíamos plantear nosotros mismos la regresión. Los valores críticos no son los habituales y no coinciden con los del contraste Dickey-Fuller. Existe un problema adicional: muchas series estacionales requieren dos diferencias, una regular y una estacional, para transformarse en estacionarias. Necesitamos por lo tanto un contraste más general. Test de raíces estacionales Por lo tanto tenemos que un contraste sobre la presencia de una raíz unitaria regular para la serie 𝑥𝑡 estaría basado en la regresión ∆𝑥𝑡 = 𝑐 + 𝜙𝑥𝑡−1 + 𝑅𝑒𝑡𝑎𝑟𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 + 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡𝑎𝑠 + 𝐸𝑟𝑟𝑜𝑟 (1) donde la hipótesis nula implica que la serie necesita al menos una diferencia regular para transformarse en estacionaria 𝐻0 : 𝜙 = 0 Por otro lado el contraste para la existencia de una raíz unitaria estacional estaría basado en la regresión ∆𝑠 𝑥𝑡 = 𝑐 + 𝜙𝑥𝑡−𝑠 + 𝑅𝑒𝑡𝑎𝑟𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 + 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡𝑎𝑠 + 𝐸𝑟𝑟𝑜𝑟 (2) donde la hipótesis nula implica que la serie necesita al menos una diferencia estacional para transformarse en estacionaria. 𝐻0 : 𝜙 = 0 Test de raíces estacionales Combinando los contrastes (1) y (2) es posible construir una regresión que permita contrastar la presencia de una raíz regular, una raíz regular y una estacional o ambas. En concreto la regresión auxiliar sería la siguiente: ∆∆𝑠 𝑥𝑡 = 𝑐 + 𝛽1 ∆𝑠 𝑥𝑡−1 + 𝛽2 ∆𝑥𝑡−𝑠 + 𝐸𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡𝑎𝑠 + 𝑅𝑒𝑡𝑎𝑟𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 + 𝐸𝑟𝑟𝑜𝑟 donde en los elementos deterministas deberían incluirse dummies estacionales para considerar en la regresión la posibilidad de estacionalidad determinista. Test de raíces estacionales La primera hipótesis a contrastar sería que la serie necesita dos diferencias: una regular y una estacional para convertirse en estacionaria. Esto implica la siguiente hipótesis nula: 𝐻0 : 𝛽1 = 𝛽2 = 0 Esto puede contrastarse mediante un estadístico F cuyo valor puede obtenerse de Eviews. Sin embargo, dicho estadístico no sigue la distribución habitual y necesitamos los valores críticos del contraste. Test de raíces estacionales Si esta hipótesis es rechazada existen dos posibilidades a considerar 1) Que la serie requiera solamente una diferencia regular. Esto equivaldría a contrastar la hipótesis nula: 𝐻0 : 𝛽1 = 0 𝑦 𝛽2 < 0 2) Que la serie requiera solamente una diferencia estacional. Esto equivaldría a contrastar: 𝐻0 : 𝛽2 = 0 𝑦 𝛽1 < 0 Estos dos contrastes se realizarían utilizando los valores de los estadísticos t asociados a la estimación de 𝛽1 y 𝛽2 que, de nuevo, no siguen distribuciones standard y sus valores deben ser tabulados. Test de raíces estacionales Los valores críticos de este test dependen del tipo de frecuencia, mensual o trimestral, de la serie que consideramos. El siguiente ejemplo realiza este contraste para el logaritmo de la serie del ipc mensual en España. Test de raíces estacionales L_IPC 4.70 4.65 4.60 4.55 4.50 4.45 4.40 4.35 4.30 02 03 04 05 06 07 08 09 10 11 12 13 Test de raíces estacionales Test de raíces estacionales Los valores críticos del estadístico F para β1= β2 =0 son 18,34 y 22,93 al 5% y 1% de significación respectivamente. Los valores críticos del estadístico t para β1= 0 son - 2,10 y -2,78 al 5% y 1% de significación respectivamente. Los valores críticos del estadístico t para β2= 0 son - 5,67 y -6,37 al 5% y 1% de significación respectivamente. Test de raíces estacionales Empezamos contrastando conjuntamente β1= β2 =0 Test de raíces estacionales El valor del estadístico F es 61.03 que es superior a los valores críticos mencionados: 18,34 y 22,93. Por lo tanto, rechazamos la hipótesis nula de que la serie necesita una diferencia regular y una estacional para transformarse en estacionaria. Test de raíces estacionales Siguiente hipótesis: ¿Necesita la serie sólo una diferencia regular? El t-estadístico asociado a β1= 0 es 1,72 que no supera los valores críticos y por lo tanto no podemos rechazar la hipótesis de que la serie necesita una diferencia regular. ¿Necesita la serie sólo una diferencia estacional? El t-estadístico asociado a β2= 0 es -10,82 que claramente supera los valores críticos y por lo tanto podemos rechazar la hipótesis de que la serie necesita una diferencia estacional. Test de raíces estacionales Conclusión: La serie ipc se puede transformar en estacionaria con una única diferencia regular. Se puede asumir que la estacionalidad de la serie es determinista y puede ser capturada mediante variables dummies estacionales. 3.2.2. Análisis de correlogramas El decrecimiento con estructura del correlograma sugiere que el DGP es un modelo AR(p) con un orden p suficientemente alto para capturar el comportamiento estacional de la serie. Sin embargo, incluso si la serie no mostrara este decrecimiento con estructura se podria aproximar mediante un modelo AR(p) con tal de que fuese estacionario (representacion dual) Se puede comenzar proponiendo un AR(p) general y luego ir eliminando recursivamente parametros no significativos. De forma similar, puede proceder de acuerdo a algun criterio de informacion. Hemos convertido a la serie log de IPI en estacionaria tras una diferencia anual. Aun asi, existe un importante cambio estructural que representa la ultima crisis economica y que deberia ser tratado por medio de intervenciones. Esto es algo que no vamos a hacer dado que las implicaciones y el uso del analisis de intervencion se sale del objetivo del curso. Una vez convertida la serie en estacionaria determinamos el orden autoregresivo haciendo uso del criterio de Schwarz. Numero de retardos Valor del criterio de Schwarz 1 -3.056164 2 -3.277687 3 -3.429341 4 -3.413678 De acuerdo a la tabla anterior el numero de retardos optimos es igual a 3. La estimacion del modelo se muestra a continuacion. El termino constante no resulta significativo por lo que puede eliminarse de la regresion. No incluir termino constante en un modelo para las diferencias anuales del logaritmo del IPI implica asumir que la tasa de crecimiento media de esta serie es del 0%. Este resultado se debe al fuerte efecto de la crisis economica en nuestros datos por lo que el modelo estimado debe actualizarse periodicamente con la llegada de nueva informacion par a ver como sus diferentes caracteristicas van cambiando. En la practica, los analistas economicos utilizan modelos no lineales que permiten que la serie tenga una dinamica diferente en periodos de crisis y expansion. Estos modelos son algo mas complejos y no se cubriran en este curso Desempleo e IBEX35 Actuando de forma similar para el desempleo nacional y el IBEX35 Para el IBEX35 ningun retardo temporal es significativo. Esto resulta logico dado que el arbitraje impide que se puede utilizar la informacion pasada de un activo financiero para predecir su rentabilidad. Existen modelizaciones econometricas particulares para series financieras que pueden estudiarse en otros cursos de la carrera. 3.3. Estimación Los modelos AR pueden estimarse por máxima verosimilitud asumiendo una distribución concreta para la serie de interés. Aunque las observaciones no son mutuamente independientes, la verosimilitud puede obtenerse. Si consideramos que los valores iniciales son fijos entonces la máxima verosimilitud coincide con el estimador MCO. Esto es lo que hacen la mayoría de los softwares econométricos de series temporales: pcgive, E-views, RATS, CATS, etc. Si no suponemos que los datos iniciales son constantes, el problema de maximización es no lineal y requiere algoritmos de optimización para llegar al optimo. En general, MV condicional es un procedimiento simple y bastante adecuado si la información que proporcionan los valores iniciales no es excesivamente valiosa. 3.4. Validación del modelo 3.4.1. Contrastes sobre los parámetros del modelo. 3.4.2. Análisis de los residuos 3.4.3. Comparación con otros modelos alternativos. * En función de algún criterio de información. * En función de su desempeño en predicción. .16 .12 .08 .04 .00 -.04 -.08 -.12 -.16 -.20 1975 1980 1985 1990 1995 RESID 2000 2005 2010 El correlograma de los residuos muestra estructura estacional. Se prueba con un modelo alternativo incluyendo un coeficiente AR(12) A modo de ilustracion se pueden incluir intervenciones iterativamente para mejorar la especificacion. IBEX35 .2 .1 .0 -.1 -.2 -.3 94 96 98 00 02 04 DLIBEX35 06 08 10 1) Contrastes sobre los coeficientes: i) 1. Aplique contrastes t a cada uno de los parámetros ii) (si el estadístico t es menor que cero no rechace la hipótesis iii) nula y simplifique el modelo eliminando ese parámetro). 2. Mire las raíces del polinomio AR(p) si alguna está próxima a la unidad se podría fijar a 1. 3. Mire las raíces del polinomio AR(p) para ver si el sistema se puede simplificar. 1) Contrastes sobre las innovaciones estimadas: i) Si el modelo es correcto los residuos deberían ser ruido blanco. ii) Si las innovaciones no son ruido blanco, se debe modificar el modelo original en el sentido indicado por los resultados de los contrastes. iii) Contrastes de media cero en las innovaciones. Si el modelo no incluye una constante, la media de las innovaciones estimadas puede ser significativamente distinta de cero, indicando que es preciso modificar la especificación. H 0 : 0. t ( ˆ ) media desviación típica ˆ / T Se rechaza i) H0 si el estadístico t es mayor que 2 en valor absoluto. Contraste de ausencia de autocorrelación entre las innovaciones estimadas. Si las innovaciones estimadas son ruido blanco, entonces sus autocorrelaciones no deben ser significativamente distintas de cero. H 0 : a (k ) 0. Contraste Ljung-Box ( Qs 2 ) H 0 : a (1), a (2),..., a ( s 2) 0. Qs 2 s2 2 Si se rechaza la hipótesis de ausencia de correlación tenemos 2 opciones: A) Escoger una de las dudas razonables que quedaron anotadas en la especificación inicial. B) Formular un modelo para los residuos e insertarlo en la especificación inicial. 1) Contrastes respecto a modelos alternativos: Incluso aunque el modelo inicial haya pasado todos los contrastes sobre los resultados de la estimación, este modelo puede ser insatisfactorio ya que se basa sólo en una alternativa de las potenciales especificaciones. Estime todos los modelos alternativos y escoja el que minimice algún criterio de información. Si no se tienen dudas sobre el modelo inicial pruebe diferentes alternativas, sustituya p por p+1, q por q+1. Valores estas alternativas con algún criterio de información.