DESESTACIONALIZACIÓN INTRODUCCIÓN Nos vamos a ocupar ahora de estudiar un fenómeno desde la perspectiva temporal, observando su evolución a través del tiempo, lo que se denomina investigación diacrónica o longitudinal, en contraposición a la sincrónica o seccional, efectuada o referida a un momento concreto del tiempo. Son muchos los fenómenos, tanto en el campo social, económico, físico, etc, que presentan interés para ser analizados diacrónicamente. Supongamos por ejemplo, la evolución de los nacimientos habidos en una nación a través de un periodo largo de tiempo, o el desarrollo de la producción de coches de una empresa, o el movimiento que refleja el volumen de agua registrado en un pantano, etc. Uno de los objetivos de estas técnicas descriptivas que veremos a continuación será desvelar la estructura o esquema de comportamiento que presentan estos fenómenos, analizando las regularidades que manifiestan a través de un periodo de tiempo suficientemente extenso, de su pasado. Esto podría permitirnos efectuar predicciones en el comportamiento futuro a corto o largo plazo. Esta es una de las cuestiones más interesantes y preocupantes a las que se enfrenta el hombre, en su necesidad de planificación y de actuaciones rápidas, de manera que la predicción se hace prácticamente indispensable en muchas cuestiones. DEFINICIÓN DE UNA SERIE TEMPORAL Una serie temporal o cronológica es en una sucesión de valores que adopta una variable (Y): en distintos instantes de tiempo: Gráficamente una serie temporal podría tener la siguiente forma: Departamento de Estadística e Investigación Operativa. Universidad de Granada. 1 DESESTACIONALIZACIÓN El espacio de tiempo comprendido entre dos observaciones consecutivas cualesquiera consideraremos que es constante, es decir, se observa el fenómeno en instantes tomados regularmente. Si para cada intervalo de tiempo (normalmente se tomarán años) existen varios instantes o periodos dentro del año (trimestres, meses, días) tendremos recogida información de la serie como aparece en la siguiente tabla: es decir, la observación yij será el valor de la variable Y en el periodo j correspondiente al año i. Por ejemplo, si estudiamos meses dentro del año p=12; si son trimestres p=4. Para el estudio de la serie emplearemos las denominadas técnicas de descomposición de la serie, cuyo análisis se basa en el pasado de la misma. Esta técnica establece y acepta previamente un esquema formal concreto para después, según ese esquema prefijado, proceder a determinar sus componentes. Notemos que aquí nos Departamento de Estadística e Investigación Operativa. Universidad de Granada. 2 DESESTACIONALIZACIÓN limitamos a observar únicamente la variable en estudio, haciendo abstracción de la influencia que puedan tener otras variables en la misma (como en el caso de la regresión). Es preciso decir, que ésta no es la única forma de estudiar las series. El estadístico tiene a su disposición otras técnicas más elaboradas y complejas (ARIMA), buscando durante el proceso, tanto el ajuste de los datos como el esquema a elegir, así como para la búsqueda de sus características concretas o parámetros. Es decir, no hay aceptado un esquema fijo de antemano, sino un abanico de posibilidades que se irán decantando teniendo en cuenta las influencias entre los valores de la serie en los distintos periodos en que se observa. Pasemos a centrarnos en la técnica que nos ocupa: la experiencia y observación de este tipo de fenómenos nos permite desglosar la serie en varias componentes, que representan formas particulares de variación. Por tanto, el estudio descriptivo, tiene como objetivo desentrañar este tipo de movimientos o variaciones y descomponer el fenómeno en estas componentes suponiendo unas relaciones dadas entre ellas, es decir, estableciendo, tal como apuntábamos anteriormente, el tipo de ajuste que suponemos origina "la trayectoria" de la serie. COMPONENTES DE INTERÉS DE UNA SERIE TEMPORAL 1. TENDENCIA Se denomina tendencia o movimiento secular a la trayectoria a largo plazo de la serie, haciendo abstracción de las fluctuaciones que se producen a intervalos más breves de tiempo. Este movimiento puede ser ascendente, descendente, estable o combinación de éstos, pero siempre ha de observarse un periodo de tiempo muy amplio para poder captar dicha componente. Gráficamente: Departamento de Estadística e Investigación Operativa. Universidad de Granada. 3 DESESTACIONALIZACIÓN Ejemplo: el gráfico anterior podría corresponder al movimiento de los salarios; estos se muestran según una línea ascendente a través del tiempo. 2. COMPONENTE ESTACIONAL Las variaciones estacionales son movimientos repetitivos que se producen sistemáticamente a lo largo de la trayectoria de la serie y generalmente representan las fluctuaciones que se registran de forma constante en periodos de tiempo por lo general, inferiores al año. El hecho de estar en un periodo concreto (mes, trimestre, etc.), año a año puede producir un comportamiento repetitivo de la variable. Gráficamente: Ejemplo: el gráfico anterior podría corresponder a la serie “consumo energético familiar”; en los periodos invernales el consumo experimentaría una fuerte subida y durante los veranos una fuerte reducción. Departamento de Estadística e Investigación Operativa. Universidad de Granada. 4 DESESTACIONALIZACIÓN ESTUDIO DE LA TENDENCIA MEDIAS MÓVILES Pretendemos obtener una trayectoria que refleje el movimiento a largo plazo de la serie eliminando o reduciendo en lo posible las fluctuaciones periódicas que van teniendo lugar en torno a la misma. Un modo de reducir la variabilidad de la serie, se obtiene mediante el cálculo de promedios que aglutinen y compensen valores altos y bajos. El método consiste pues, en ir agrupando sistemáticamente un número fijo k de valores de la serie y determinar para cada grupo su media. Nota: En este caso no es preciso utilizar la notación de los valores de la serie con doble subindicación yij, por lo que designaremos con yi los valores de la serie. Obtención de las medias móviles de orden k: Tomaremos los k primeros elementos observados en la serie y calculamos su media: y esta media y’1, la hacemos corresponder al periodo mediano (o medio) de los periodos 1,2,3,...,k (notemos que si k es impar, la mediana es el instante que está en el centro, pero si k es par, será un instante comprendido entre los dos centrales). Para obtener la segunda media móvil, consideramos los elementos: Y calculamos su media De manera análoga asignamos esta media al instante mediano correspondiente a los periodos de las observaciones que intervienen en dicha suma. Así sucesivamente se continúa el proceso hasta que intervenga en la media la última observación de la serie. Obtendremos así las n-k+1 medias móviles que representan el nuevo movimiento suavizado de la serie. Departamento de Estadística e Investigación Operativa. Universidad de Granada. 5 DESESTACIONALIZACIÓN donde de forma general: Aclaraciones: - Notemos que las medias obtenidas por un movimiento de orden k, par, no estarán asignadas a los instantes registrados en la serie original. Por consiguiente, en este caso es preciso centralizar la serie de medias móviles efectuando un nuevo movimiento de orden dos (cálculo de medias móviles con k=2) sobre los valores y' de las medias móviles de orden k. - Es evidente que cuanto mayor sea k más suavizadas serán las series obtenidas, es decir, reflejarán menos fluctuaciones, pero también perderemos más información, ya que si k es par, perdemos en total k observaciones; y si k es impar, perdemos en total k-1 observaciones. - Hay que señalar también que este método, aunque fácil de calcular, es poco manejable si lo comparamos con las ventajas de una ecuación o función matemática. Ejemplo: Los siguientes datos corresponden al número de accidentes de tráfico durante 10 meses registrados en una determinada zona considerada como conflictiva: Si representamos la serie Departamento de Estadística e Investigación Operativa. Universidad de Granada. 6 DESESTACIONALIZACIÓN vemos que su tendencia es ascendente; vamos a obtenerla mediante medias móviles de orden 3. Tomemos por tanto, los tres primeros valores de la serie y calculemos su media: Quitemos ahora el primer valor y añadamos el cuarto: Quitando el segundo valor y añadiendo el quinto: Repitiendo esta operación aparecen todas las medias móviles de orden 3. Asignaremos cada una de ellas al periodo mediano correspondiente: Observe que como k es impar, hemos perdido k-1 observaciones (3-1=2). Representemos la nueva serie de medias móviles: De forma similar a la obtención de las medias móviles de orden 3, calculemos las de orden 4. Son las siguientes: 20.5, 23, 27.25, 35.5, 42.75, 46.5, 48.25 Departamento de Estadística e Investigación Operativa. Universidad de Granada. 7 DESESTACIONALIZACIÓN que corresponderán a los periodos medianos: 2.5, 3.5, 4.5, ... , 12.5 Nota: 2.5=Me(1,2,3,4); 3.5=Me(2,3,4,5), etc. Volvemos a tomar en las medias móviles de orden 4, medias móviles de orden 2, ya que es preciso centrar la serie para que los valores obtenidos vengan referidos también a los periodos originales: Nota: 3=Me(2.5,3.5); 4=Me(3.5,4.5), etc. Hemos perdido k=4 observaciones. Si representemos estas medias móviles, vemos que la serie se suaviza aún más: serie original y tendencia (por medias móviles de orden 4) ESTUDIO DE LA COMPONENTE ESTACIONAL Pretendemos ahora, estimar la variación de la variable en cada periodo estacional, para que nos indique el incremento que ha experimentado un periodo estacional dado, tomando como base un valor medio referido a todo el año. En ocasiones nos interesará conocer las variaciones estacionales, y eliminarlas del comportamiento global de la serie, para poder observar mejor el movimiento de ésta.(Desestacionalización). Departamento de Estadística e Investigación Operativa. Universidad de Granada. 8 DESESTACIONALIZACIÓN Veremos el método de las medias móviles (hay muchos más) distinguiendo también según el esquema adoptado: multiplicativo o aditivo. Método de las medias móviles/Esquema Multiplicativo Suponemos que el esquema es multiplicativo, es decir: En primer lugar se ha de determinar un movimiento de medias móviles de orden p igual al número de periodos observados por año para eliminar de las observaciones originales las fluctuaciones estacionales. Por ejemplo, si estudiamos una serie, considerando los meses del año, entonces p=12. Los nuevos valores así obtenidos reflejarán fundamentalmente las variaciones cíclicas y de tendencia. Designaremos con y' estos nuevos valores para distinguirlos de los originales y. Podríamos entonces expresar el esquema: y dividiendo esta ecuación por Y' y despejando la componente estacional, queda: La componente estacional viene reflejada fundamentalmente por los cocientes y/y' más unos cocientes residuales que reflejan fundamentalmente las variaciones irregulares. Por último determinaremos la media para cada periodo estacional, con lo cual obtendremos un valor representativo de cada uno de ellos, a la vez que al promediar eliminamos las variaciones irregulares bajo el supuesto de que dichos valores se complementarán y anularán, en términos generales. Los valores obtenidos serán las componentes estacionales. En definitiva: i. Partimos de una serie de valores yij donde j es el periodo observado e i el año. ii. Obtenemos medias móviles de orden p (nº de periodos dentro del año) y’ij iii. Realizamos el cociente Departamento de Estadística e Investigación Operativa. Universidad de Granada. 9 DESESTACIONALIZACIÓN iv. Obtenemos cada componente estacional (media para cada periodo estacional): Nota: Si suponemos que el total de años observados es n, notemos que al tomar movimiento de medias móviles de orden p (nº observaciones por año), habremos perdido información referente a las primeras y últimas observaciones, por lo que sólo utilizaremos n-1 valores para obtener las medias. Normalización de los índices estacionales: Conviene rectificar o normalizar esos índices obtenidos, si se comprueba que la suma de todos ellos difiere de p. Designando a los índices ya normalizados por E.*j, para que se verifique esto: de donde, despejando el índice normalizado: siendo M la media de todos los índices estacionales. Ejemplo: En la siguiente tabla se recoge el número de individuos (en miles) que han acudido durante los años 1996-1999 a una estación de invierno: Departamento de Estadística e Investigación Operativa. Universidad de Granada. 10 DESESTACIONALIZACIÓN Representemos la serie: Vemos que existe componente estacional; por ejemplo, en los primeros trimestres del año, el aumento de individuos en la estación aumenta considerablemente. Veamos cuál es el aumento o disminución por trimestres. Hallamos medias móviles de orden 4 (nº de periodos). Recuerde que para centrar la serie hemos de efectuar seguidamente otro movimiento de orden 2, ya que el primer número de orden es par y por consiguiente hemos perdido 4 observaciones. Los resultados son: Departamento de Estadística e Investigación Operativa. Universidad de Granada. 11 DESESTACIONALIZACIÓN Realizamos ahora los cocientes entre las observaciones originales entre las observaciones correspondientes a la tendencia y eliminamos las variaciones irregulares promediando: Observando las medias trimestrales vemos que en los dos primeros trimestres la afluencia a la estación de invierno es mayor a la media anual. La suma de estas medias o índices estacionales debería ser igual a 4 (nº de periodos); en este caso la suma es 4.0069, por lo que es necesario normalizarlas para obtener los índices estacionales definitivos. Para ello, dividimos todos ellos por su media: resultando los índices estacionales definitivos: Por lo tanto, en el 1er trimestre el número de individuos aumenta un 64.9% respecto a la media anual, en el 2º un 25.9%, en el 3º disminuye un 56.7% y en el 4º también disminuye un 34.1% respecto a la media anual. Departamento de Estadística e Investigación Operativa. Universidad de Granada. 12