Pronósticos II Un matemático, como un pintor o un poeta, es un fabricante de modelos. Si sus modelos son más duraderos que los de estos últimos, es debido a que están hechos de ideas. Los modelos del matemático, como los del pintor o los del poeta deben ser hermosos. La belleza es la primera prueba; no hay lugar permanente en el mundo para unas matemáticas feas. Godfrey Harold Hardy (1877-1947) Matemático británico. MÉTODOS DE DESCOMPOSICIÓN Los métodos visto con anterioridad están basados en la idea de que existe un patrón implícito en una serie de datos, tal patrón se puede aislar de lo aleatorio si se suavizan (promedian) los valores de los datos. El efecto de este suavizamiento consiste en eliminar lo aleatorio, de tal manera que el patrón se pueda proyectar el futuro y se utilice para pronosticar. Los métodos de suavizamiento no permiten identificar los componentes individuales del patrón básico. Sin embargo, el patrón global puede descomponerse en subpatrones que identifiquen separadamente cada componente de la serie de tiempo. Los métodos de descomposición identifican tres componentes distintos del patrón básico subyacente que caracterizan a las series económicas y empresariales. Estos son los factores TENDENCIA, CÍCLO y ESTACIONALIDAD. El factor TENDENCIAL, que representa el comportamiento de largo plazo de los datos, puede aumentar, disminuir o permanecer sin cambio. El factor CÍCLICO representa las altas y bajas causadas por las condiciones económicas o específicas de la industria. La diferencia entre ESTACIONALIDAD y ciclicidad consiste en que la estacionalidad se repite a sí misma a intervalos fijos como un año, un mes o una semana, en tanto que los factores cíclicos tienen una duración mayor que varía de un ciclo a otro. La descomposición supone que los datos están conformados así: DATOS = PATRON + ERROR Y que el PATRÓN se compone de TENDENCIA, CICLO y ESTACIONALIDAD PATRON = TENDENCIA, CICLO Y ESTACIONALIDAD Además de los componentes del patrón, también se supone que está presente un ELEMENTO DE ERROR o aleatoriedad. Este error es la diferencia entre el efecto combinado de los tres subpatrones de la serie y los datos reales. Existen varios enfoques para descomponer una serie de tiempo, todos los cuales tienen como objetivo aislar cada componente de la serie tan exactamente como sea posible. El concepto básico de dicha separación es empírico y consiste en remover primero la Norma Hernández Hernández 43 Pronósticos II estacionalidad, luego la tendencia y finalmente el ciclo. Se supone que cualquier residuo es aleatorio, el cual, aunque no puede predecirse, puede ser identificado. La representación matemática general del enfoque de la descomposición es: Yt = f ( St , Tt , Ct , Rt ) 2. (a) En donde: Yt St Tt Ct Rt = = = = = el valor de la serie de tiempo (datos reales) en el periodo t componente estacional (o índice) en el periodo t componente tendencial en el periodo t componente cíclico en el periodo t componente aleatorio (o error) en el periodo t La relación funcional específica usada para relacionar estos cuatro subpatrones para adoptar una gran variedad de formas. Las más directas son la aditiva (sumando los cuatro elementos) o la multiplicativa (multiplicando los cuatro elementos), esta última es la que más se usa. Prácticamente, todas las series en los campos económico y empresarial están compuestas de estacionalidad y ciclicidad, las cuales son proporcionales a la tendencia; de aquí que el modelo multiplicativo sea el apropiado. La representación matemática específica es: Yt = S t × Tt × Ct × Rt … (b) Para ejemplificar el método usaremos la serie de tiempo de la SESION 10. Como habíamos visto, la gráfica de estos datos muestra cierta tendencia, estacionalidad considerable y posiblemente otro tipo de fluctuaciones (aleatoriedad). Al emplear este método, los datos se expresan como Y=TxCxSxR donde Y representa los valores reales, el propósito de la descomposición es identificar T, C y S (lo que sobra será R) al analizar los datos originales de Y. Suponga que los primero cuatro trimestres (es decir, los cuatro trimestres) se suman y se calcula su promedio: Y1 + Y2 + Y3 + Y4 = = 3,017.60 + 3,043.54 + 2,094.35 + 2,809.84 10,965.33/4 = 2,741.33 Norma Hernández Hernández 44 Pronósticos II El valor 2,741.33 es el promedio de todo un año y, por definición, no tiene estacionalidad (la estacionalidad se refiere a subperiodos trimestrales de un año es este caso). Aún más, el valor 2,741.33 tiene poco o ningún error o aleatoriedad; así, al sumar valores lo estocástico se cancela a sí mismo en gran medida, ya que se combinan tanto las fluctuaciones positivas como las negativas. Por lo tanto, sumar tantos valores de Y como lo largo de la estacionalidad (cuatro trimestres en un año, 0 12 meses cuando la estacionalidad es mensual) lo permita, propicia un conjunto de valores que no incluye estacionalidad pero sí una cantidad mínima de aleatoriedad. O sea, sólo incluye tendencia y ciclo (T x C). Si se suman del segundo al quinto trimestre y se calcula su media el resultado es: Y2+ Y3 + Y4 + Y5 = = 3,043.54 + 2,094.35 + 2,809.84 + 3,274.80 11,222.53/4 = 2,805.63 Como antes, 2,805.63 es la media de cuatro trimestres por lo tanto no incluye estacionalidad y tiene poca o nula aleatoriedad pero si contiene tendencia y ciclo. Se puede continuar el mismo proceso, eliminando Y2 e incluyendo Y6 (la media es 2,835.57), eliminando Y3 e incluyendo Y7, y así sucesivamente. Hacerlo así para todos los datos produce una serie de promedios móviles (llamados móviles porque se elimina un valor y se incluye en otro) desde el principio hasta el final de los datos de la tabla Estos valores de promedio móvil son relativamente suaves (ya que no incluyen estacionalidad, pero si un poco de error) y proporcionan un cuadro mucho más preciso de cómo se comportan las ventas del producto con respecto a la tendencia y el ciclo. Por lo que podemos decir que: MA = T × C …. (c) En donde MA es el promedio móvil desde el principio hasta el final de los datos. El valor de tal promedio móvil cubre un conjunto completo de estaciones. Estos datos los reflejaremos en una tabla que considere: Trimestre t Observación Yt Promedio Móvil TxC (1) (2) (3) Los siguientes elementos a considerar son: Estacionalidad y aleatoriedad Norma Hernández Hernández 45 Pronósticos II La columna (3) de la tabla anterior muestra T x C y la columna (2) los datos originales, es decir, muestra T x C x S x R. Si los valores de la columna (2) se dividen entre los de la columna (3), los resultados son las razones que contemplaremos en una columna (4), de acuerdo con la ecuación: Y T ×C ×S × R = =S×R MA T ×C …. (d) Trimestre t Observación Yt Promedio Móvil TxC Razón S x R x 100 (1) (2) (3) (4) Como conjunto de valores de datos, estas razones sólo contienen estacionalidad y error (por convención estos valores se han multiplicado por 100). Estas razones contienen información requerida para identificar la estacionalidad. Si el valor de una de estas razones sobrepasa 100, esto implica que el valor real de Y es mayor que el promedio móvil T x C. Sin embargo, puesto que Y incluye estacionalidad y aleatoriedad, y T x C NO, la estacionalidad y aleatoriedad son más altas para este trimestre que en promedio. Si la razón es menor que 100, sucede lo contrario, la estacionalidad y aleatoriedad son menores que el promedio. Aleatoriedad. La ecuación Y T ×C ×S × R =S×R = MA T ×C proporciona información importante acerca de los datos. No obstante, ya que el error o la aleatoriedad es algo que no se puede explicar o controlar, es útil eliminar la aleatoriedad de esta ecuación con el fin de aislar la estacionalidad. Esto se puede hacer si se recuerda que la aleatoriedad se refiere a fluctuaciones al azar, ausencia de un patrón o variaciones totalmente sin explicación. Como tal, los valores aleatorios, por definición, fluctúan alrededor de 0 y tiene un promedio o una media de 0. Por lo tanto, si se suman varios valores aleatorios, el resultado será un valor de 0, o cercano a 0. Norma Hernández Hernández 46 Pronósticos II Estacionalidad. Si reorganizamos la columna con las razones de esta manera: Año Primero Trimestre Segundo Tercero Cuarto 1 2 3 4 5 6 7 8 9 10 11 12 S S1 S2 S3 S4 Es decir, organizadas de acuerdo con los trimestres (estaciones) y años. Así, la segunda columna da los valores de todos los primeros trimestres, y si sucesivamente. Y obtenemos el promedio de todos los primeros, segundos, terceros y cuartos trimestres (y los agregamos en el renglón S). Al promediar todos los valores del mismo trimestre de todos los años se elimina la aleatoriedad, que por definición fluctúa alrededor de 0. Así estos promedios solamente representan estacionalidad. En términos algebraicos esto equivale a: S × R = S 2. (e) en donde la sobrebarra denota promedio. Ajuste de los índices estacionales para promediar 100. Sumar los cuatro factores estacionales de los promedios de la tabla NO da un valor de 400. Se necesita un ajuste sencillo para hacerlos que tengan un valor promedio de 100. Si se divide 400 entre la suma 410.75, el resultado es el factor 0.974 se obtienen valores de 112.83, 109.48, 75.60 y 102.09. El total de estos cuatro índices estacionales es ahora exactamente igual a 400. Esto hace que su significado e interpretación sean más claros. Por ejemplo, el factor estacional 112.83 significa que el primer trimestre (enero, febrero y marzo) es 11.28% más alto que el promedio del año y 75.60 significa que el tercer trimestre (julio, agosto y septiembre) está 24.4% abajo del promedio anual. Norma Hernández Hernández 47 Pronósticos II Año Trimestre Segundo Tercero Primero Cuarto 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 S Total Factor S ajustado Total Separación del ciclo y la tendencia La ecuación (c) expresa el valor del ciclo de tendencia de una serie de datos. Aunque no es suficiente en la mayoría de los casos, a veces es deseable separar la tendencia del ciclo. Esto se pude hacer al particularizar un tipo específico de tendencia que describa mejor los datos. Por ejemplo, la tendencia podría ser lineal o de alguna otra forma. Con los datos de la de la serie original ajuste a una función lineal (una línea recta) que describa la tendencia adecuadamente. Los parámetros de a y b de esta recta de tendencia lineal se pueden estimar empleando regresión simple. En este caso, el valor observado es la variable dependiente Y y el trimestre es la variable independiente X. Los valores de a y b, es decir, los coeficientes de la ecuación para la recta puede calcularse como: b= n * ∑ x 2 − (∑ x ) 2 ∑ y ∑ x − ∑ x ∑ xy a= n * ∑ x − (∑ x) 2 n * ∑ xy − ∑ x∑ y 2 Y Norma Hernández Hernández 48 2 Pronósticos II O bien con la fórmula: b= n∑ xy − ∑ x∑ y a= ∑ y −b ∑x n ∑ x 2 − (∑ x ) 2 n n se obtiene: a = 2,735.85 b = 38.96 Por lo tanto, la ecuación para la recta queda como: Tt = a + bt = 2,735 + 38.9t en donde a es un término constante y b es la tendencia (la cantidad que las ventas aumenta cada trimestre). Para el trimestre 10 (es decir, el segundo trimestre de 1979) el valor de la tendencia lineal es: T10 = 2,735 + 38.9(10) = 3,125.45 Para los trimestres 20, 30 y 40 los valores de la tendencia correspondientes son: T20 = 2,735 + 38.9(20) = 3,515.05 T30 = 2,735 + 38.9(30) = 3,904.65 T40 = 2,735 + 38.9(40) = 4,294.25 Si la ecuación (c) se divide entre la tendencia T, el resultado es un conjunto de valores para el ciclo C: MA T × C = =C T T Así, el ciclo para los periodos 10, 20, 30 y 40 se puede calcular al dividir los promedios móviles de la tabla: Norma Hernández Hernández 49 Pronósticos II Trimestre t Observación Yt Promedio Móvil TxC (1) (2) (3) entre los valores de tendencia correspondientes y multiplicarlos por 100 para hacer que fluctúen alrededor de 100: C10 = 2,907.41 / 3,125.45 = 93.02 C20 = 3,413.19 / 3,515.05 = 97.10 C30 = 3,848.03 / 3,904.65 = 98.55 C40 = 4,237.77 / 4,294.25 = 98.68 Y agregamos estos elementos en nuestra tabla original: Año Trimestre t Observación Yt Promedio Móvil TxC Razón S x R x 100 (1) (2) (3) (4) S Ajustado Tendencia T Ciclo C Pronóstico S XTXC En el caso de los índices estacionales, los factores cíclicos fluctúan alrededor de 100. Si el valor cíclico está abajo de 100, indica que el nivel de la actividad económica se ese trimestre se halla abajo del promedio de todos los años. Un valor arriba de 100 indica lo contrario. En síntesis, el método de descomposición proporciona un medio para aislar los diversos componentes de una serie de tiempo mediante las siguientes ecuaciones: Ecuación Aísla: MA = T × C la tendencia y el ciclo Tt = a + bt la tendencia MA T × C = =C T T el ciclo Y T ×C × S × R = = S×R MA T ×C la estacionalidad y la aleatoriedad S×R =S la estacionalidad Los métodos de descomposición no son tan fáciles, sino sumamente intuitivos. Norma Hernández Hernández 50 Pronósticos II Preparación de pronósticos basados en el método de descomposición para el análisis de una serie de tiempo Con el mismo ejemplo que hemos estado utilizando, es posible preparar pronósticos basados en los factores del índice estacional, tendencial, cíclico que han sido identificados. Para ejemplificar cómo se hace esto, considere el cálculo de un pronóstico para el trimestre de 49. Primero debe recordarse que la relación básica supuesta fue que: Y = S ×T ×C × R Al preparar el pronóstico, no puede proyectarse el último término, la aleatoriedad (R), por lo tanto la relación Y = S ×T × C Para el trimestre 49, el pronóstico de tendencia es: T49 = 2,735 + 38.9(49) = 4,644.694 El factor estacional para el trimestre 49 es de: 102.09, finalmente se estima el factor cíclico. De esta forma el pronóstico deseado es: Y49 = S49 x T49 x C9 = (112.83/100) x (4,644.69) x (96.49/100) = 5,056.47 Norma Hernández Hernández 51