Curso de Predicción Económica y Empresarial www.uam.es/predysim Edición 2004 UNIDAD 3: MODELOS ARIMA Breve “recetario” sobre los contrastes de validez Un primer grupo de contrastes que nos sirven para dar validez al modelo nos vendría dado por la utilización de medidas elementales del error. Su utilidad se limita, a nuestros efectos a la realización de comparaciones entre modelos, ya que no proporcionan medidas “absolutas” de validez. En este sentido podríamos decir que, a igualdad de otros criterios, preferiremos el modelo con menores “medidas de error”. En este grupo contamos con: 1) Suma de cuadrados de los residuos, formulado como n SCR = ∑ a t2 t =1 2) Desviación típica de la regresión, σ= n ∑a t =1 2 t /(n − k ) donde k es el número de parámetros del modelo, es decir, p+q. También contamos con el coeficiente de determinación, a diferencia de los anteriores acotado entre valores, pero de utilidad, nuevamente para la comparación entre modelos. El modelo de mayor valor explicativo (mayor R2) será preferido, a igualdad de otros criterios. Se formula como: 3) Coeficiente de determinación; S a2 Varianza de los errores R =1− 2 =1− Varianza de la variable dependiente Sy 2 Asimismo, el coeficiente de determinación ajustado por los grados de libertad vendría dado por R 2 = 1 − (1 − R 2 ) Página 1 de 3 n −1 n−k Un segundo grupo de medidas nos vendría dado por ciertos contrastes estadísticos. Estos sí nos facilitan una medida “absoluta” asociada a cierta probabilidad. Entre ellos podemos señalar: 4) Contraste t de significación de parámetros. Con este contraste pretendemos dilucidar si el estimador del parámetro que acompaña a cada variable es significativamente distinto de cero, esto es, si efectivamente la variable tiene influencia significativa en la explicación de la dependiente. El contraste se formula como: t n−k = bj S (b j ) donde bj es el estimador del parámetro poblacional y S(bj) es la varianza del estimador. Obviamente, un modelo estimado sólo será apropiado cuando los parámetros sean significativos. Pues bien, a efectos prácticos podemos considerar que tal circunstancia se produce cuando el valor del estadístico t sea superior a 2, con un nivel de confianza del 95%. 5) Contraste F de significación conjunta. Mientras que el contraste t analiza la significatividad individual de cada parámetro, el contraste F realiza un análisis conjunto, es decir, contrasta la nulidad de todos los parámetros del modelo. Se formula como ( S y2 − S a2 ) /(k − 1) F( k −1, n − k ) = S a2 /(n − k ) Los valores críticos del contraste están convenientemente tabulados. Podemos asumir que rechazamos la hipótesis nula de nulidad de todos los parámetros cuando el valor del contraste F sea mayor de 6. Lo habitual es que el estadístico F supere holgadamente esta cifra. Cuando no sea así, habrá que recurrir al valor exacto del intervalo crítico. 6) Contraste d de Durbin-Watson. Se utiliza para contrastar la hipótesis de ausencia de autocorrelación en los residuos del modelo, si bien está diseñado, más estrictamente, para procesos autorregresivos de orden 1, que son los esquemas más habituales. Se define como: n d= ∑ (a t =2 t − a t −1 ) 2 n ∑a t =1 ≈ 2(1 − ρˆ ) 2 t Página 2 de 3 En la práctica, consideramos que los residuos se aproximan lo suficiente a la hipótesis de ruido blanco, cuando el contraste d se sitúa en el entorno de 2 (entre 1,5 y 2,5). El cálculo exacto del contraste precisa de la obtención de un intervalo de confianza a partir de un límite superior y un límite inferior que varían con el número de datos y parámetros. 7) Contraste Q. Contrasta la hipótesis de ruido blanco de los residuos. Existen dos versiones, la debida a Box y Pierce en el que para n datos y m coeficientes se formula como: m Q = n∑ rk2 k =1 y la debida a Ljung-Box, y que es incorporada por el programa EViews, definida como: m Q = n(n + 2)∑ (rk2 / n − m) k =1 bien entendido que se distribuye como una χ 2 con (n-m-p) grados de libertad. En nuestras series daremos por razonables residuos con valores del estadístico Q inferiores a 50. Para mayor precisión es preciso acudir a la tabulación de los valores críticos. Por último, recogemos un tercer bloque de criterios compuesto por 8) Función logarítmica de verosimilitud. 9) Estadístico AIC (Akaike Information Criterion). 10) Estadístico SC (Schwarz Criterion). Estos dos últimos se construyen, justamente, a partir de la función logarítmica de verosimilitud y son calculados automáticamente por los programas informáticos. Todos ellos alcanzan su utilidad máxima en la comparación de modelos alternativos. En esos casos, elegiremos, a igualdad de otros criterios, aquel que presente un menor valor del mismo. Desarrollaremos con más detalle estas cuestiones en el ejercicio práctico 2. Página 3 de 3