ANALISIS ESTOCASTICO DE SERIES TEMPORALES

Anuncio
ANALISIS ESTOCASTICO DE SERIES TEMPORALES.
BIBLIOGRAFIA:
1º ) PEÑA SANCHEZ DE RIVERA, DANIEL (1992). "Modelos y Métodos.
Modelos lineales y series temporales" V.2 ; Ed. Alianza Universidad. Madrid.
CAPITULO 15
2º ) FERRAN ARANAZ, MAGDALENA (1996), " SPSS para Windows.
Programación y análisis estadístico" ; Ed. McGraw Hill. Madrid. CAPITULO 20
INTRODUCCION
El enfoque clásico del análisis de series temporales, basado en la
descomposición, tiene a su favor el carácter intuitivo de la argumentación original y
la sencillez relativa de las técnicas e instrumentos que requiere.
Desde una perspectiva estocástica, una serie temporal observada se
considera como realización (o muestra) de cierto proceso teórico, integrado por
variables aleatorias referidas a momentos o periodos de tiempo.
Y(t) = { . . .Yt - 2 , Yt - 1 , Yt , Yt +1, Yt +2 .... }
y(t) = { ... yt - 2 , yt - 1 , yt , yt +1, yt +2 ..... }
El análisis estocástico de la serie temporal consiste en realizar una inferencia
estadística sobre las propiedades del proceso teórico a partir de la información
contenida en la serie observada. Por tanto, hay un elevado grado de paralelismo
entre el análisis estocástico de series temporales y el análisis estadístico general.
El análisis estocástico da origen, además, a los métodos de series
temporales que se utilizan con mayor frecuencia en la práctica profesional.
El camino inferencial que conduce desde las observaciones de una serie temporal
al proceso teórico (muestra - población) sigue el procedimiento conocido, aunque
presenta algunas particularidades.
Tras el análisis inicial y la descripción de los datos, en que intervienen las técnicas
habituales en estadística y algunas específicas de series temporales, el objetivo
del análisis se centra en la construcción un modelo que reproduzca adecuadamente
las propiedades del proceso que se supone ha originado los datos.
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
PROCESOS ESTOCASTICOS
Un proceso estocástico es un conjunto de variables aleatorias que representan una
misma magnitud (responden a la misma definición) en distintos momentos del
tiempo. En general suponemos que el proceso es lineal, es decir, que cada variable
puede ser obtenida como combinación lineal de las que la preceden.
Una muestra de n datos será una muestra de un vector de n variables
aleatorias ordenadas en el tiempo ( z1 .. zt .. zn ). Se denomina proceso estocastico
al conjunto de estas variables { zt } donde t = 1......n
Conocer el proceso teórico implica:
conocer la función de distribución conjunta del vector de variables aunque,
bajo normalidad, bastar con su vector de medias y su matriz de varianzascovarianzas.

Funcion de medias
t = E [zt ]

Funcion de Varianzas
t = Var [zt ]

Funcion de autocovarianzas
Cov ( t , t +j) = E [( zt - t ) ( zt+j - t+j ]

Funcion de autocorrelacion
(t, t+j) = Cov ( t , t +j) / t t+j
Estos elementos pueden ser inferidos a partir de las observaciones pero solo
cuando se cumple una serie de condiciones.
Las condiciones que deben verificarse para que la inferencia a partir de una única
realización sea posible son dos (no las definimos formalmente, solo las principales
implicaciones):
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
Estacionariedad. ( Proceso Estacionario)

Implica que las variables integrantes del proceso tienen
media y varianza constantes y finitas, y que la
covarianza entre pares de ellas solo depende de su
separación temporal.
t = E [zt ] = Cte
t = Var [zt ] = Cte
Cov ( t , t +k) = Cov ( t , t - k) = k
k = k / o Donde o = 2
Ergodicidad.

Implica que la covarianza entre pares de variables del
proceso tiende a reducirse cuanto mayor es su
separación temporal.
AUTOCORRELACION
Cuando el proceso es estacionario y ergódico, la media y la varianza constantes
reflejan sus características estáticas (nivel y variabilidad). Las características
dinámicas, la manera en que cada variable se ve afectada por las variables previas,
aparecen recogidas por las covarianzas que solo dependen de la separación
temporal.
El valor de la correlación para sucesivos valores del retardo k proporciona
la llamada función de autocorrelación. La función de autocorrelación expresa las
características dinámicas del proceso, porque recoge la influencia del pasado en el
presente (k=1,2,3...). As¡, un proceso en el cual cada variable dependa sólo de la
anterior tendrá nulos todos los coeficientes de autocorrelación excepto el primero.
Si cada variable depende de las dos previas, entonces la autocorrelación será no
nula para los ordenes uno y dos, y nula para órdenes superiores. En otras palabras,
la función de autocorrelación refleja la memoria del proceso: el número de periodos
durante los cuales una variable continua teniendo influencia en la evolución del
proceso.
La autocorrelación, tanto total como parcial, puede ser estimada a partir de las
covarianzas de los datos. La autocorrelación estimada sirve para inferir los ordenes
de retardos que son significativos en el estudio de una serie temporal, es decir, los
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
ordenes de retardos implicados en el proceso teórico que subyace a los datos. El
modelo que se elija para representar el proceso deber incluir, precisamente, los
órdenes de retardo correspondientes a coeficientes de autocorrelación
significativos.
FUNCION DE AUTOCORRELACION SIMPLE (FAS). (Correlograma) La
representación de los coeficientes de autocorrelación en función del
retardo.
FUNCION DE AUTOCORRELACION PARCIAL (FAP). (Correlograma) La
representación de los coeficientes de autocorrelación parcial en función del
retardo.
XCES
1,0
,5
ACF
0,0
Límites confidencial
es
-,5
-1,0
Coeficiente
1
3
2
5
4
7
6
9
8
11 13 15
10 12 14 16
Nº de retardos
MODELOS ARIMA ( AR I MA)
Los procesos lineales estacionarios y ergódicos pueden ser representados
mediante un modelo de la clase ARIMA. Las siglas corresponden a autorregresivos,
integrados y de media móvil.
Antes de examinarlos, definimos unos tipos especiales de proceso:
 ruido blanco ( at ), que se caracteriza por ser normalmente
distribuido, tener media nula, varianza constante y no presentar
autocorrelación. En estos procesos conocer los valores
pasados no proporciona ninguna información sobre el futuro).
El ruido blanco interviene en la formulación de cualquier modelo
ARIMA.

Integrados. La mayoría de los procesos que observamos no
son estacionarios y su nivel medio varia con el tiempo. El
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
proceso se convertirá en estacionario al diferenciarlo. Así
obtenemos como primera diferencia.
Wt = zt - zt-1
Segunda diferencia ( de orden 2)
Yt = Wt - Wt-1 = zt - 2z t-1 + zt-2
Será de orden d cuando al diferenciarlo d veces se obtiene
un proceso estacionario
Modelo autorregresivo AR (p):
Expresa el valor de la serie en cada tiempo t como una combinación de variables
previas más un ruido blanco:
Yt = c + 1 zt-1 + 2 zt-2 + … + p zt-p + at
La función de autocorrelación :
p = p / o =  p-1 / o =  p-1  p = p
Cuando P es grande , p tiende a cero con rapidez ( SEGÚN SE PUEDE VER EN UNA
FAS)
Modelo de media móvil MA (q):
Expresa el valor de la serie en cada tiempo t como un ruido blanco contemporáneo
menos una combinación de ruidos blancos previos
Yt = at - 1 at-1 - 2 at-2 -….. - q at-q
En ocasiones, el número de retardos implicados en las representaciones AR o MA
de una serie es demasiado elevado para que resulte operativo. Por esa razón, no
es infrecuente representar el valor de la serie como una combinación de arnbos
tipos de modelos, lo que da origen a los modelos ARMA(p, q)
Yt = c + 1 zt-1 + … + p zt-p + at - 1 at-1 ….. - q at-q
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
En muchas ocasiones, la representación ARMA(p,q) no es adecuada para una serie
temporal observada pero si lo es para su incremento. En estos casos, la
representación ARMA(p,q) se formula sobre !a serie diferenciada. Cuando se aplica
una representación ARMA sobre los incrementos o diferencias de orden d de la
serie original, entonces el modelo resultante es un ARlMA (p,d,q), donde la inicial I
se refiere a "integrado" y d es el orden del incremento aplicado.
LA ESTRATEGIA BOX-JENKINS
Se trata de una manera de proceder al análisis de una serie temporal utilizando un
modelo de la clase ARIMA. El procedimiento consta de tres fases o etapas que se
aplican de manera iterativa hasta alcanzar un resultado satisfactorio
Identificación:
Consiste en proponer un modelo de la clase ARIMA para representar el proceso
que ha generado las observaciones. Se trata de determinar Ios órdenes (p,d,q) que
debe tener el modelo para representar adecuadamente el proceso que ha generado
las observaciones. A efectos prácticos, podemos descomponer la identificación en
dos etapas:

Determinación del orden de integrabilidad ( d
)
En economía es razonable admitir la Ergodicidad de las magnitudes (el
pasado reciente influye más que el pasado remoto) pero, en cambio, las series
temporales no suelen ser estacionarias sino que presentan cambios de nivel y
variabilidad a lo largo del tiempo.
Sin embargo, es posible aproximar el comportamiento de una serie a la
Estacionariedad mediante transformaciones matemáticas (Box-Cox). Las
transformaciones consisten, por lo general:
Tomar logaritmos (para reducir los cambios en varianza) y/o diferencias
(para reducir los cambios en nivel).
En general, se procede de manera iterativa, observando el gráfico y la función de
autocorrelación de sucesivas transformaciones de la serie hasta dar con la
transformación más adecuada.

Determinación del orden autorregresivo ( p ) y de media móvil.(q
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
)
Una vez la serie presenta un comportamiento aproximadamente estacionario, se
puede calcular una f.a.s. y una f.a.p. estimadas a partir de los datos que sugieren
los órdenes de retardos p y q correspondientes al proceso que ha generado las
observaciones. En teoría, los coeficientes significativos de la f.a.s. y f.a.p. estimadas
señalan cuales son los órdenes de retardos que hay que incluir en el modelo. En la
práctica, hay que tomar en consideración las características conocidas de la
magnitud bajo estudio a la hora de elegir los ordenes p y q del modelo que se va a
estimar. No conviene que sean ordenes muy elevados (porque consumen mas
observaciones a la hora de estimar). En series económicas son frecuentes los
órdenes 1, 2, 4 (trimestral) y 12 (mensual).
Estimación
Una vez identificado a partir de las observaciones el modelo tentativo, es decir, una
vez elegidos los órdenes (p. d. q) se procede a estimar los parámetros
autorregresivos y de medias móviles que intervienen. No estudiaremos en detalle
los métodos de estimación. Los procedimientos suelen ser iterativos y, en general,
requieren la disponibilidad de observaciones anteriores al período muestral. Esta
característica determina que el procedimiento completo no sea recomendable en
situaciones de escasez de datos. El modelo con los parámetros estimados se
denomina estructura.
Validación:
El modelo estimado (la estructura) debe representar adecuadamente el proceso que
se supone ha generado las observaciones. Una estructura adecuada ser aquella
que verifique, al menos, las siguientes condiciones:




Admisibilidad: el modelo estimado es coherente con el
conocimiento previo del fenómeno y no quebranta restricciones
definicionales de la magnitud objeto de estudio
Parametrización: el número de parámetros estimados debe ser
lo más reducido posible
Coherencia con los datos: La estructura presenta un buen
ajuste a las observaciones, los residuos son pequeños y
aleatorios (ruido blanco)
Estabilidad
estructural:
La
estructura
representa
adecuadamente la evolución de la serie tanto en su conjunto
como en distintos subperiodos.
Estos requisitos son comunes a todo tipo de modelos econométricos. En el caso de
los modelos ARIMA hay dos cuestiones que revisten especial importancia:
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
Cumplimiento de las condiciones de estacionariedad
Todo el procedimiento se basa en la hipótesis de que el proceso estocástico es
estacionario. Un modelo estimado ser inaceptable si implica la no estacionariedad
del proceso aleatorio. Las condiciones de estacionariedad (invertibilidad) dependen
de las raíces de los polinomios de retardos y son diferentes según el orden del
modelo. Cuando las raíces de los polinomios de retardos de la estructura se
aproximan a la unidad, hay que volver a la fase inicial de transformaciones para
aproximar todavía más el comportamiento de los datos a la estacionariedad.
Comportamiento de los residuos
El residuo de cualquier modelización econométrica aceptable debe ser pequeño y
errático. En series temporales es importante, además, cornprobar que la evolución
de los residuos no presente regularidades, que no muestre ningún tipo de esquema
temporal. De lo contrario, el modelo estimado no sería aceptable por estar
incompleto, al no haber captado ese esquema. La comprobación se realiza a través
de la identificación de la propia serie de residuos: si la f.a.s. o la f.a.p. de los
residuos presentan algún coeficiente significativo, cabe pensar que los residuos
están autocorrelacionados y, por tanto, que el modelo estimado no es aceptable.
La estrategia es iterativa: cuando el modelo tentativo estimado no produce buenos
resultados (no supera la evaluación), hay que volver al principio, a la fase de
identificación y empezar de nuevo hasta alcanzar una modelización aceptable. Una
vez aceptada una estructura, podremos utilizarla para la predicción.
Análisis de Datos en Economía – Prof: Salvador Carrasco Arroyo
Descargar