ANALISIS ESTOCASTICO DE SERIES TEMPORALES. BIBLIOGRAFIA: 1º ) PEÑA SANCHEZ DE RIVERA, DANIEL (1992). "Modelos y Métodos. Modelos lineales y series temporales" V.2 ; Ed. Alianza Universidad. Madrid. CAPITULO 15 2º ) FERRAN ARANAZ, MAGDALENA (1996), " SPSS para Windows. Programación y análisis estadístico" ; Ed. McGraw Hill. Madrid. CAPITULO 20 INTRODUCCION El enfoque clásico del análisis de series temporales, basado en la descomposición, tiene a su favor el carácter intuitivo de la argumentación original y la sencillez relativa de las técnicas e instrumentos que requiere. Desde una perspectiva estocástica, una serie temporal observada se considera como realización (o muestra) de cierto proceso teórico, integrado por variables aleatorias referidas a momentos o periodos de tiempo. Y(t) = { . . .Yt - 2 , Yt - 1 , Yt , Yt +1, Yt +2 .... } y(t) = { ... yt - 2 , yt - 1 , yt , yt +1, yt +2 ..... } El análisis estocástico de la serie temporal consiste en realizar una inferencia estadística sobre las propiedades del proceso teórico a partir de la información contenida en la serie observada. Por tanto, hay un elevado grado de paralelismo entre el análisis estocástico de series temporales y el análisis estadístico general. El análisis estocástico da origen, además, a los métodos de series temporales que se utilizan con mayor frecuencia en la práctica profesional. El camino inferencial que conduce desde las observaciones de una serie temporal al proceso teórico (muestra - población) sigue el procedimiento conocido, aunque presenta algunas particularidades. Tras el análisis inicial y la descripción de los datos, en que intervienen las técnicas habituales en estadística y algunas específicas de series temporales, el objetivo del análisis se centra en la construcción un modelo que reproduzca adecuadamente las propiedades del proceso que se supone ha originado los datos. Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo PROCESOS ESTOCASTICOS Un proceso estocástico es un conjunto de variables aleatorias que representan una misma magnitud (responden a la misma definición) en distintos momentos del tiempo. En general suponemos que el proceso es lineal, es decir, que cada variable puede ser obtenida como combinación lineal de las que la preceden. Una muestra de n datos será una muestra de un vector de n variables aleatorias ordenadas en el tiempo ( z1 .. zt .. zn ). Se denomina proceso estocastico al conjunto de estas variables { zt } donde t = 1......n Conocer el proceso teórico implica: conocer la función de distribución conjunta del vector de variables aunque, bajo normalidad, bastar con su vector de medias y su matriz de varianzascovarianzas. Funcion de medias t = E [zt ] Funcion de Varianzas t = Var [zt ] Funcion de autocovarianzas Cov ( t , t +j) = E [( zt - t ) ( zt+j - t+j ] Funcion de autocorrelacion (t, t+j) = Cov ( t , t +j) / t t+j Estos elementos pueden ser inferidos a partir de las observaciones pero solo cuando se cumple una serie de condiciones. Las condiciones que deben verificarse para que la inferencia a partir de una única realización sea posible son dos (no las definimos formalmente, solo las principales implicaciones): Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo Estacionariedad. ( Proceso Estacionario) Implica que las variables integrantes del proceso tienen media y varianza constantes y finitas, y que la covarianza entre pares de ellas solo depende de su separación temporal. t = E [zt ] = Cte t = Var [zt ] = Cte Cov ( t , t +k) = Cov ( t , t - k) = k k = k / o Donde o = 2 Ergodicidad. Implica que la covarianza entre pares de variables del proceso tiende a reducirse cuanto mayor es su separación temporal. AUTOCORRELACION Cuando el proceso es estacionario y ergódico, la media y la varianza constantes reflejan sus características estáticas (nivel y variabilidad). Las características dinámicas, la manera en que cada variable se ve afectada por las variables previas, aparecen recogidas por las covarianzas que solo dependen de la separación temporal. El valor de la correlación para sucesivos valores del retardo k proporciona la llamada función de autocorrelación. La función de autocorrelación expresa las características dinámicas del proceso, porque recoge la influencia del pasado en el presente (k=1,2,3...). As¡, un proceso en el cual cada variable dependa sólo de la anterior tendrá nulos todos los coeficientes de autocorrelación excepto el primero. Si cada variable depende de las dos previas, entonces la autocorrelación será no nula para los ordenes uno y dos, y nula para órdenes superiores. En otras palabras, la función de autocorrelación refleja la memoria del proceso: el número de periodos durante los cuales una variable continua teniendo influencia en la evolución del proceso. La autocorrelación, tanto total como parcial, puede ser estimada a partir de las covarianzas de los datos. La autocorrelación estimada sirve para inferir los ordenes de retardos que son significativos en el estudio de una serie temporal, es decir, los Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo ordenes de retardos implicados en el proceso teórico que subyace a los datos. El modelo que se elija para representar el proceso deber incluir, precisamente, los órdenes de retardo correspondientes a coeficientes de autocorrelación significativos. FUNCION DE AUTOCORRELACION SIMPLE (FAS). (Correlograma) La representación de los coeficientes de autocorrelación en función del retardo. FUNCION DE AUTOCORRELACION PARCIAL (FAP). (Correlograma) La representación de los coeficientes de autocorrelación parcial en función del retardo. XCES 1,0 ,5 ACF 0,0 Límites confidencial es -,5 -1,0 Coeficiente 1 3 2 5 4 7 6 9 8 11 13 15 10 12 14 16 Nº de retardos MODELOS ARIMA ( AR I MA) Los procesos lineales estacionarios y ergódicos pueden ser representados mediante un modelo de la clase ARIMA. Las siglas corresponden a autorregresivos, integrados y de media móvil. Antes de examinarlos, definimos unos tipos especiales de proceso: ruido blanco ( at ), que se caracteriza por ser normalmente distribuido, tener media nula, varianza constante y no presentar autocorrelación. En estos procesos conocer los valores pasados no proporciona ninguna información sobre el futuro). El ruido blanco interviene en la formulación de cualquier modelo ARIMA. Integrados. La mayoría de los procesos que observamos no son estacionarios y su nivel medio varia con el tiempo. El Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo proceso se convertirá en estacionario al diferenciarlo. Así obtenemos como primera diferencia. Wt = zt - zt-1 Segunda diferencia ( de orden 2) Yt = Wt - Wt-1 = zt - 2z t-1 + zt-2 Será de orden d cuando al diferenciarlo d veces se obtiene un proceso estacionario Modelo autorregresivo AR (p): Expresa el valor de la serie en cada tiempo t como una combinación de variables previas más un ruido blanco: Yt = c + 1 zt-1 + 2 zt-2 + … + p zt-p + at La función de autocorrelación : p = p / o = p-1 / o = p-1 p = p Cuando P es grande , p tiende a cero con rapidez ( SEGÚN SE PUEDE VER EN UNA FAS) Modelo de media móvil MA (q): Expresa el valor de la serie en cada tiempo t como un ruido blanco contemporáneo menos una combinación de ruidos blancos previos Yt = at - 1 at-1 - 2 at-2 -….. - q at-q En ocasiones, el número de retardos implicados en las representaciones AR o MA de una serie es demasiado elevado para que resulte operativo. Por esa razón, no es infrecuente representar el valor de la serie como una combinación de arnbos tipos de modelos, lo que da origen a los modelos ARMA(p, q) Yt = c + 1 zt-1 + … + p zt-p + at - 1 at-1 ….. - q at-q Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo En muchas ocasiones, la representación ARMA(p,q) no es adecuada para una serie temporal observada pero si lo es para su incremento. En estos casos, la representación ARMA(p,q) se formula sobre !a serie diferenciada. Cuando se aplica una representación ARMA sobre los incrementos o diferencias de orden d de la serie original, entonces el modelo resultante es un ARlMA (p,d,q), donde la inicial I se refiere a "integrado" y d es el orden del incremento aplicado. LA ESTRATEGIA BOX-JENKINS Se trata de una manera de proceder al análisis de una serie temporal utilizando un modelo de la clase ARIMA. El procedimiento consta de tres fases o etapas que se aplican de manera iterativa hasta alcanzar un resultado satisfactorio Identificación: Consiste en proponer un modelo de la clase ARIMA para representar el proceso que ha generado las observaciones. Se trata de determinar Ios órdenes (p,d,q) que debe tener el modelo para representar adecuadamente el proceso que ha generado las observaciones. A efectos prácticos, podemos descomponer la identificación en dos etapas: Determinación del orden de integrabilidad ( d ) En economía es razonable admitir la Ergodicidad de las magnitudes (el pasado reciente influye más que el pasado remoto) pero, en cambio, las series temporales no suelen ser estacionarias sino que presentan cambios de nivel y variabilidad a lo largo del tiempo. Sin embargo, es posible aproximar el comportamiento de una serie a la Estacionariedad mediante transformaciones matemáticas (Box-Cox). Las transformaciones consisten, por lo general: Tomar logaritmos (para reducir los cambios en varianza) y/o diferencias (para reducir los cambios en nivel). En general, se procede de manera iterativa, observando el gráfico y la función de autocorrelación de sucesivas transformaciones de la serie hasta dar con la transformación más adecuada. Determinación del orden autorregresivo ( p ) y de media móvil.(q Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo ) Una vez la serie presenta un comportamiento aproximadamente estacionario, se puede calcular una f.a.s. y una f.a.p. estimadas a partir de los datos que sugieren los órdenes de retardos p y q correspondientes al proceso que ha generado las observaciones. En teoría, los coeficientes significativos de la f.a.s. y f.a.p. estimadas señalan cuales son los órdenes de retardos que hay que incluir en el modelo. En la práctica, hay que tomar en consideración las características conocidas de la magnitud bajo estudio a la hora de elegir los ordenes p y q del modelo que se va a estimar. No conviene que sean ordenes muy elevados (porque consumen mas observaciones a la hora de estimar). En series económicas son frecuentes los órdenes 1, 2, 4 (trimestral) y 12 (mensual). Estimación Una vez identificado a partir de las observaciones el modelo tentativo, es decir, una vez elegidos los órdenes (p. d. q) se procede a estimar los parámetros autorregresivos y de medias móviles que intervienen. No estudiaremos en detalle los métodos de estimación. Los procedimientos suelen ser iterativos y, en general, requieren la disponibilidad de observaciones anteriores al período muestral. Esta característica determina que el procedimiento completo no sea recomendable en situaciones de escasez de datos. El modelo con los parámetros estimados se denomina estructura. Validación: El modelo estimado (la estructura) debe representar adecuadamente el proceso que se supone ha generado las observaciones. Una estructura adecuada ser aquella que verifique, al menos, las siguientes condiciones: Admisibilidad: el modelo estimado es coherente con el conocimiento previo del fenómeno y no quebranta restricciones definicionales de la magnitud objeto de estudio Parametrización: el número de parámetros estimados debe ser lo más reducido posible Coherencia con los datos: La estructura presenta un buen ajuste a las observaciones, los residuos son pequeños y aleatorios (ruido blanco) Estabilidad estructural: La estructura representa adecuadamente la evolución de la serie tanto en su conjunto como en distintos subperiodos. Estos requisitos son comunes a todo tipo de modelos econométricos. En el caso de los modelos ARIMA hay dos cuestiones que revisten especial importancia: Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo Cumplimiento de las condiciones de estacionariedad Todo el procedimiento se basa en la hipótesis de que el proceso estocástico es estacionario. Un modelo estimado ser inaceptable si implica la no estacionariedad del proceso aleatorio. Las condiciones de estacionariedad (invertibilidad) dependen de las raíces de los polinomios de retardos y son diferentes según el orden del modelo. Cuando las raíces de los polinomios de retardos de la estructura se aproximan a la unidad, hay que volver a la fase inicial de transformaciones para aproximar todavía más el comportamiento de los datos a la estacionariedad. Comportamiento de los residuos El residuo de cualquier modelización econométrica aceptable debe ser pequeño y errático. En series temporales es importante, además, cornprobar que la evolución de los residuos no presente regularidades, que no muestre ningún tipo de esquema temporal. De lo contrario, el modelo estimado no sería aceptable por estar incompleto, al no haber captado ese esquema. La comprobación se realiza a través de la identificación de la propia serie de residuos: si la f.a.s. o la f.a.p. de los residuos presentan algún coeficiente significativo, cabe pensar que los residuos están autocorrelacionados y, por tanto, que el modelo estimado no es aceptable. La estrategia es iterativa: cuando el modelo tentativo estimado no produce buenos resultados (no supera la evaluación), hay que volver al principio, a la fase de identificación y empezar de nuevo hasta alcanzar una modelización aceptable. Una vez aceptada una estructura, podremos utilizarla para la predicción. Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo