Series de tiempo: Caracterización empírica y selección de técnicas

Anuncio
Series de tiempo: Caracterización empírica y selección de
técnicas de pronóstico basada en Redes Neuronales Artificiales
Ma. Guadalupe Villarreal Marroquín, Mauricio Cabrera Ríos*
División de Posgrado en Ingeniería de Sistemas, FIME-UANL
{lupita@yalma.fime.uanl.mx, mauricio@yalma.fime.uanl.mx}
*Autor Responsable
Resumen
En este trabajo se propone un método para ayudar a las personas con poco entrenamiento estadístico a elaborar un
pronóstico de series de tiempo caracterizando primero su serie y posteriormente, en base a esta caracterización,
seleccionando la técnica más adecuada de pronóstico. El método utiliza redes neuronales artificiales para realizar la
selección. Se puso especial cuidado en que tanto los métodos estadísticos como las redes neuronales artificiales utilizadas
pudieran ser instauradas en MS Excel, por lo que los requerimientos de paquetería computacional son modestos. El método
propuesto se basa parcialmente en las ideas presentadas por (Gupta et al., 2000) en el terreno del secuenciamiento de tareas
en plantas de manufactura.
Palabras claves
Redes Neuronales Artificiales, Métodos de Pronóstico, Series de Tiempo, Caracterización de Series de Tiempo
1. Introducción
Nuestra vida cotidiana está llena de decisiones. Las decisiones que tomamos a diario dependen en gran medida tanto de la
información que tenemos a la mano como de la que podemos proyectar a futuro. El área de pronósticos trata precisamente
de generar información estimada sobre el comportamiento de un fenómeno observable a futuro. En muchos casos, esta área
se basa en el comportamiento histórico de tal fenómeno organizado en una serie de tiempo. Es razonable esperar que una
toma de decisiones más acertada resulte de mejores pronósticos.
A pesar de que una gran cantidad de personas elaboran pronósticos diariamente, existen tres problemas que se pueden hallar
de manera común en esta práctica: (1) no contar con el entrenamiento estadístico necesario, (2) no contar con paquetería
computacional especializada, o (3) no tener tiempo suficiente para hallar el método más adecuado.
Estos tres problemas motivaron los estudios que se incluyen en este trabajo. El primer estudio consistió en una exploración
de métodos tradicionales de pronósticos por medio de MS Excel. Este primer estudio proveyó una base de conocimiento
para el segundo, el cual demuestra un método basado en redes neuronales artificiales (RNAs) para seleccionar la mejor
técnica de pronóstico de entre aquellas utilizadas en el primer estudio a partir de una serie de tiempo arbitraria. El método
propuesto incluye también una sencilla caracterización de series de tiempo.
Este trabajo resulta entonces en un método que no depende de software estadístico especializado y que permite caracterizar
y seleccionar la técnica más adecuada de pronósticos de una manera repetible. Tanto las técnicas de pronóstico como las
RNAs utilizadas son convenientemente instaurables en MS Excel. Un impacto probable es que, a través de la aplicación de
este método, las personas que generen pronósticos lo hagan consistentemente mejor y más rápido. En consecuencia, sería
posible tomar mejores decisiones en las aplicaciones pertinentes aún en casos de contar con un entrenamiento estadístico
modesto.
1
2. Método propuesto
La Figura 1 presenta un diagrama de flujo con el método propuesto. En este método, la parte de selección se basa en las
ideas presentadas en (Gupta, et al., 2000) en el terreno de secuenciamiento de tareas en plantas de manufactura. El objetivo
del método en este trabajo es determinar la mejor técnica de pronóstico de entre varias conocidas a partir de una serie de
tiempo caracterizada por dos parámetros sencillos de obtener.
Normalizar los datos a la escala [ −1,1]
Caracterizar la serie de tiempo
Someter a la red neuronal artificial
Establecer un orden entre los métodos y
determinar el mejor
Figura 1. Método propuesto para la selección de la mejor técnica de pronóstico entre varias conocidas.
El método propuesto se apoya en la capacidad de predicción de las RNAs al utilizar una de ellas para predecir el desempeño
de varias técnicas de pronóstico cuantificado por el error cuadrado medio o MSE. La capacidad predictiva de las RNAs ha
sido estudiada y matemáticamente demostrada para funciones analíticas en (Hornik et al., 1989) y la factibilidad de usar el
MSE como medida de desempeño en pronóstico se encuentra documentada en (Hillier y Lieberman, 2001).
Los pasos del método, partiendo de que se tiene una serie de tiempo, son como sigue:
1.
Normalizar los datos a la escala [-1,1]: los datos de la serie de tiempo se normalizan para que caigan en un rango
de [-1,1] con el objetivo de eliminar efectos de dimensionalidad.
2.
Caracterizar la serie de tiempo: se determinan dos parámetros que caracterizan la serie: el número de períodos de
la serie de tiempo (t) y el grado del primer polinomio (n) que se ajuste a los datos de la serie con un coeficiente de
determinación, R ≥ 80% .
2
Los dos parámetros que se necesitan para esta caracterización son fácilmente obtenibles. El parámetro t resulta de
un conteo directo de datos y el parámetro n de una prueba secuencial de aproximación ejecutable en MS Excel.
Ambos se pueden obtener a partir de una gráfica de dispersión de Datos vs. Período (Figura 2). Para encontrar n,
basta usar la opción de ajustar una línea de tendencia de tipo polinomial a los datos y presentar en pantalla tanto el
valor de R2 como la expresión polinomial. El objetivo es determinar el orden del polinomio de manera creciente a
fin de detectar el primero con el que se obtenga un R 2 ≥ 80% (ver Figura 2). Como se podrá observar, no se
necesita entrenamiento estadístico para lograr esta caracterización. Es importante señalar que esta caracterización
es original, por lo que los resultados de este estudio sirven además para probar qué tan adecuada resulta. En el
caso de estudio que se presenta posteriormente se ofrecen resultados para su evaluación.
2
n
1.50
y = -0.0079x 3 + 0.1499x 2 - 0.6164x + 0.0467
R2 = 0.8959
1.00
observación
0.50
0.00
1
2
3
4
5
6
7
8
9
10
11
12
t
-0.50
-1.00
-1.50
pe ríodo
Serie de tiempo
Ajuste polinomial
Figura 2. Observación vs. Período y Ajuste de una línea de tendencia de tipo polinomial a los datos.
3.
Someter a la red neuronal artificial: se utiliza una red neuronal artificial previamente entrenada, donde se usan
como entradas t y n y como salida la predicción del error cuadrado medio para cada uno de los métodos de
pronóstico.
Una RNA, en el contexto del método propuesto, es esencialmente un modelo matemático no lineal que contiene
parámetros conocidos como “pesos”. Mientras más pesos tenga una RNA, mayor no linealidad se podrá representar
con ella. Para encontrar estos pesos se utilizan algoritmos de optimización que minimizan una función de errores
cuadrados de aproximación. En el área de redes neuronales, varios de estos algoritmos de optimización se
clasifican bajo el nombre de “algoritmos de retropropagación”. Por otro lado, encontrar un conjunto de pesos que
permitan una aproximación adecuada a datos conocidos se le denomina “entrenamiento”.
La RNA que se propone en esta etapa se representa como se muestra en la Figura 3. Esta RNA cuenta con 3 capas:
una capa de entrada que recoge los valores de t y n, una capa oculta que procesa esta información, y una capa de
salida por la que se obtiene el MSE predicho para un método de pronóstico en particular.
Capa de entrada
n
t
1
vij
Capa oculta
...
1
wj
Capa de salida
MSE
Figura 3. RNA con tres capas, entrenada por retropropagación del error
3
En la Figura 3,
vi , j es un peso de la conexión que llega a la j-ésima neurona de la capa oculta procedente de la
i-ésima neurona de la capa de entrada y w j es el peso de la conexión que llega a la neurona de salida procedente de
la j-ésima neurona de la capa oculta. Estos pesos son utilizados para ponderar las salidas generadas por las
neuronas, y representan la memoria de la RNA. Los pesos que se aplican a las conexiones provenientes de
neuronas que vemos con valor constante de uno se denominan sesgos.
4.
Establecer un orden entre los métodos y escoger el mejor: por último, se ordenan los métodos de acuerdo a su
MSE predicho y se escoge el mejor, donde éste será el que tenga el MSE más pequeño.
El método resultante en el punto 4 es el que se debe utilizar entonces para generar los pronósticos. Como se dijo
anteriormente, todos los métodos de pronóstico que se utilizaron en este trabajo fueron codificados en MS Excel y se
encuentran disponibles por parte de los autores. La creación de las RNAs que se utiliza para la selección en este método se
describe a continuación.
3. Obtención de las RNAs a utilizar en el método propuesto
Las RNAs que se requieren para el método de selección propuesto deben ser capaces de predecir el desempeño de cada
método de pronóstico. Como se ha explicado previamente, para construir una RNA se requiere de una fase de
entrenamiento. Adicionalmente, para corroborar que el modelo tenga una capacidad predictiva adecuada también se utiliza
una fase de validación.
Para poder construir las RNAs necesarias se generaron 54 series de tiempo para entrenamiento. Cada una de las series de
tiempo fue preprocesada, de acuerdo con el método propuesto, para que los datos cayeran en el intervalo de [-1,1]. Las
series utilizadas en entrenamiento tuvieron como parámetros t∈{12, 36,60} períodos y aproximación polinomial dada por
n ∈{1, 2, 3, 4, 5, 6}, lo cual resulta en un total de 3 x 6 = 18 combinaciones de t y n. Para cada una de estas combinaciones
se generaron 3 réplicas por medio de una perturbación aditiva aleatoria, de ahí que haya un total de 54 series de tiempo.
Para validación se utilizaron además 22 series; 12 de ellas resultan de todas las posibles combinaciones de series de tiempo
con t∈{24,48} y aproximación polinomial de n∈{1, 2, 3, 4, 5, 6}; 8 de las restantes comprenden series publicadas
(Makridakis y Wheelwright, 1998) y dos más provienen de una compañía de telecomunicaciones que incluyen series de
tiempo de t∈[12,70] períodos y aproximación polinomial n∈[1,6].
Se consideraron 8 métodos de pronóstico tradicionales que se codificaron completamente en MS Excel: (1) método ingenuo,
(2) promedio, (3) promedios móviles, (4) suavizado exponencial simple, (5) ARIMA (0, 1,1), (6) regresión lineal, (7)
suavizado exponencial doble y (8) ARIMA (0, 2, 2) [3, 4].
Se entrenaron y validaron RNAs con dos y tres neuronas en la capa oculta en una etapa inicial, con resultados prometedores
pero con una tendencia de disminución del error de validación al aumentar el número de neuronas en la capa oculta. Por esta
razón en una segunda etapa se construyeron RNAs con cuatro hasta siete neuronas en la capa oculta. En esta capa es vital
determinar un número adecuado de neuronas puesto que un número excesivo de ellas provoca una flexibilidad excesiva del
modelo, que a su vez puede traducirse en una pérdida de capacidad de predicción. A este fenómeno se le denomina
sobreentrenamiento.
El entrenamiento de la RNA se pudo abordar con el optimizador incluido en MS Excel (Excel Solver). Dado que este
optimizador es de tipo local para un problema no lineal como el que se presenta al tratar de minimizar la suma de errores
cuadrados o SSE, se cuidó de inicializar los pesos en diferentes valores para aumentar la probabilidad de tener una solución
satisfactoria. Los pesos se inicializaron nueve veces. Las primeras cinco, todos los pesos tomaban el mismo valor del
siguiente conjunto {−1, −0.5, 0, 0.5,1} , las otras cuarto veces, se inicializaron con valores aleatorios entre -1 y 1. Al final
se mantuvieron los pesos que resultaron en el menor SSE de validación independiente del error de entrenamiento, pues es
precisamente la capacidad de predicción lo que debemos preservar en este caso.
El error de validación se utilizó entonces como criterio para determinar el número de neuronas en la capa oculta, ésto es
para seleccionar en nuestro caso entre dos y tres neuronas en la etapa inicial y de ente dos a siete en la segunda (donde las
4
primeras dos son la misma de la primera etapa). Por supuesto a menor error de validación corresponde una mejor capacidad
de predicción. La Tabla 1 muestra los errores de validación obtenidos para cada RNA tratada en la primera etapa (dos y tres
neuronas en la capa oculta).
Método de pronóstico
Ingenuo
Promedio
Promedio móvil
ARIMA(0,1,1)
Suavizado exponencial simple
Regresión lineal
ARIMA(0,2,2)
Suavizado exponencial doble
SSE(dos neuronas)
0.950
2.965
0.260
0.680
0.924
2.552
1.409
1.501
SSE(tres neuronas)
0.954
3.028
0.223
0.948
0.954
1.881
1.210
1.245
Tabla 1. Suma de errores cuadrados (SSE) de validación para RNAs con dos y tres neuronas en la capa oculta.
En la Tabla 1 se puede ver que una red no domina totalmente a la otra, por lo cual se recurrió a una prueba de hipótesis para
dos medias donde nuestra hipótesis nula ( h0 : µ1 = µ 2 ) es que no hay una diferencia significativa entre el desempeño de
las redes, contra la alternativa de que sí hay, con un nivel de significancia de
un valor de
α = 0.01 . El estadístico de prueba resulta con
t14 = 0.244 , el cual se debe comparar con un valor de tablas de t0.005,14 = 2.947 . Dado que t14 < t0.005,14 ,
no se puede rechazar la hipótesis nula, por lo que concluimos que en el 99% de nuestros casos no hay una diferencia
significativa en utilizar una red con dos o tres neuronas en la capa oculta. Considerando este resultado se decidió en una
primera etapa utilizar las redes de dos neuronas en la capa oculta, ya que son modelos más simples que los de tres neuronas
ocultas. En una segunda etapa como ya se menciono se decidió utilizar RNAs con cuatro hasta siete neuronas en la capa
oculta para reducir el error de validación, sin embargo al mismo tiempo también se comparan con las RNAs de la primera
etapa. La Tabla 2 muestra los errores de validación obtenidos para las RNAs con dos hasta siete neuronas en la capa oculta.
Método
de pronóstico
Ingenuo
Promedio
Promedio móvil
ARIMA(0,1,1)
Suavizado
exponencial simple
Regresión lineal
ARIMA(0,2,2)
Suavizado
exponencial doble
SSE
(2neuronas)
0.950
2.965
0.260
0.680
SSE
(3neuronas)
0.954
3.028
0.223
0.948
SSE
(4neuronas)
0.949
3.017
0.288
0.964
SSE
(5neuronas)
0.929
3.448
0.294
0.326
SSE
(6neuronas)
0.855
2.961
0.216
0.282
SSE
(7neuronas)
0.854
3.028
0.232
0.413
0.924
0.954
0.866
1.055
1.086
1.045
2.552
1.409
1.881
1.210
0.874
0.704
1.764
1.505
0.884
1.092
1.373
1.073
1.501
1.245
0.882
1.111
1.180
2.228
Tabla 2. Suma de errores cuadrados (SSE) de validación para RNAs con dos hasta siete neuronas en la capa oculta.
En la Tabla 2 se pueden observar los errores de validación para cada red, donde al igual que en la primera etapa ninguna
supera a otra en todos los métodos, pero dado que la red para cada uno de los métodos tradicionales de pronóstico es
independiente entonces decidimos aquí elegir redes diferentes para cada uno, por lo cual en la Tabla 2 se puede observar en
negritas la RNA con menor SSE por método. Esto último quiere decir que para el método Ingenuo se utilizará la RNA con
siete neuronas en la capa oculta; para los métodos de Promedio, Promedio Móvil y ARIMA(0,1,1) se utilizará la RNA con
seis neuronas en la capa oculta; y para el caso de Suavizado Exponencial Simple, Regresión Lineal, ARIMA(0,2,2) y
Suavizado Exponencial Doble se utilizará la RNA con cuatro neuronas en la capa oculta.
Las RNAs seleccionadas se pueden ahora utilizar para predecir el MSE de los ocho métodos de pronóstico para series de
tiempo caracterizadas por una combinación específica de n y t.
5
4. Resultados de la aplicación del método propuesto
Para demostrar la utilización de las RNAs obtenidas anteriormente en el contexto del método propuesto se utilizaron las
series de validación. Cabe aclarar que los datos de validación no se encuentran memorizados en la RNA, por lo que se
preserva la objetividad de la evaluación.
La Tabla 3 muestra el MSE real para 22 series de tiempo con combinaciones de n y t particulares, la Tabla 4 el MSE
predicho por las RNAs seleccionada para cada método de pronóstico en la etapa inicial, la Tabla 5 para cada método de la
segunda etapa, esto para una serie de tiempo con características particulares.
SERIE
n
1
2
3
4
5
6
1
2
3
4
5
6
1
2
5
1
1
1
4
2
1
4
t
24
24
24
24
24
24
48
48
48
48
48
48
24
24
24
24
24
24
48
48
67
67
Ingenuo Promedio
0.05
0.39
0.09
0.27
0.22
0.48
0.20
0.43
0.14
0.34
0.16
0.36
0.07
0.27
0.09
0.27
0.13
0.30
0.10
0.26
0.10
0.27
0.11
0.23
0.01
0.44
0.02
0.39
0.41
0.08
0.13
0.32
0.09
0.53
0.08
0.38
0.41
0.01
0.01
0.40
0.40
0.01
0.03
0.30
MÉTODO DE PRÓNOSTICO
Suavizado
Promedio ARIMA exponencial Regresión
simple
móvil
(0,1,1)
lineal
0.10
0.05
0.05
0.04
0.11
0.08
0.08
0.06
0.18
0.16
0.17
0.11
0.18
0.14
0.14
0.10
0.15
0.11
0.11
0.07
0.13
0.13
0.13
0.08
0.07
0.05
0.05
0.05
0.08
0.07
0.07
0.06
0.10
0.09
0.09
0.07
0.09
0.07
0.07
0.06
0.09
0.07
0.07
0.07
0.06
0.07
0.07
0.05
0.09
0.01
0.01
0.01
0.15
0.01
0.02
0.10
0.29
0.20
0.08
0.08
0.13
0.10
0.13
0.06
0.15
0.08
0.09
0.06
0.12
0.07
0.08
0.05
0.14
0.12
0.01
0.01
0.12
0.01
0.33
0.00
0.04
0.05
0.01
0.01
0.07
0.07
0.03
0.03
ARIMA
(0,2,2)
0.03
0.07
0.12
0.13
0.09
0.14
0.05
0.05
0.08
0.07
0.09
0.07
0.00
0.00
0.09
0.07
0.07
0.05
0.01
0.00
0.01
0.03
Suavizado
exponencial
doble
0.04
0.08
0.17
0.13
0.11
0.12
0.05
0.06
0.08
0.08
0.08
0.07
0.00
0.00
0.08
0.17
0.25
0.08
0.01
0.00
0.01
0.03
ARIMA
(0,2,2)
0.06
0.07
0.07
0.08
0.08
0.09
0.06
0.07
Suavizado
exponencial
doble
0.07
0.07
0.08
0.08
0.09
0.10
0.05
0.06
Tabla 3. MSE real de series de tiempo para validación
SERIE
n
1
2
3
4
5
6
1
2
t
24
24
24
24
24
24
48
48
Ingenuo Promedio
0.09
0.43
0.09
0.42
0.11
0.40
0.15
0.38
0.19
0.35
0.21
0.32
0.08
0.26
0.08
0.26
MÉTODO DE PRÓNOSTICO
Suavizado
Promedio ARIMA exponencial Regresión
simple
móvil
(0,1,1)
lineal
0.15
0.10
0.09
0.04
0.15
0.10
0.15
0.06
0.15
0.11
0.16
0.07
0.15
0.12
0.16
0.08
0.15
0.12
0.16
0.11
0.15
0.13
0.15
0.12
0.08
0.07
0.06
0.04
0.08
0.07
0.08
0.06
6
3
4
5
6
1
4
48
48
48
48
67
67
0.08
0.08
0.08
0.09
0.09
0.09
0.26
0.26
0.26
0.26
0.26
0.26
0.08
0.08
0.08
0.08
0.07
0.07
0.07
0.07
0.07
0.07
0.06
0.06
0.09
0.09
0.08
0.08
0.05
0.07
0.06
0.06
0.06
0.06
0.04
0.06
0.07
0.08
0.08
0.09
0.06
0.07
0.06
0.07
0.07
0.08
0.05
0.06
Tabla 4. MSE predicho por las RNAs con dos neuronas en la capa oculta para cada serie de tiempo utilizada para
validación
SERIE
n
1
2
3
4
5
6
1
2
3
4
5
6
1
4
t
24
24
24
24
24
24
48
48
48
48
48
48
67
67
Ingenuo Promedio
0.09
0.44
0.09
0.42
0.11
0.41
0.15
0.39
0.17
0.36
0.20
0.33
0.08
0.26
0.08
0.26
0.08
0.26
0.08
0.25
0.08
0.25
0.08
0.25
0.08
0.26
0.08
0.26
MÉTODO DE PRÓNOSTICO
Suavizado
Promedio ARIMA exponencial Regresión
móvil
(0,1,1)
simple
lineal
0.13
0.06
0.09
0.05
0.17
0.10
0.15
0.07
0.18
0.12
0.16
0.09
0.18
0.13
0.16
0.09
0.17
0.13
0.15
0.09
0.16
0.12
0.15
0.08
0.07
0.07
0.06
0.04
0.08
0.07
0.08
0.06
0.08
0.07
0.09
0.06
0.08
0.07
0.09
0.06
0.08
0.07
0.09
0.06
0.08
0.07
0.09
0.06
0.07
0.07
0.05
0.05
0.07
0.07
0.07
0.06
ARIMA
(0,2,2)
0.06
0.08
0.10
0.10
0.10
0.10
0.07
0.07
0.07
0.08
0.08
0.08
0.07
0.08
Suavizado
exponencial
doble
0.06
0.11
0.11
0.10
0.10
0.10
0.06
0.06
0.06
0.06
0.06
0.06
0.06
0.06
Tabla 5. MSE predicho por las RNAs seleccionadas para cada método de pronóstico tradicional (ver Tabla 2) para cada
serie de tiempo utilizada para validación
En la Tabla 3 observamos el MSE obtenido de evaluar cada una de las series de tiempo usando cada método de pronóstico.
En las Tablas 4 y 5 podemos observar el MSE predicho por las RNAs seleccionadas en la primera y segunda etapa para
cada serie de tiempo utilizada para validación. Si observamos a detalle las Tablas 3, 4 y 5 vemos que algunas series de
tiempo tienen el mismo MSE para diferentes métodos, esto se debe a que algunos métodos son casos particulares de otros.
Así sucede, por ejemplo, con el método de promedio y el método de promedios móviles. Adicionalmente, los MSE reales de
ambos métodos presentan patrones similares. Cuando el MSE predicho es el mismo en una serie en particular para
diferentes métodos se considera a éstos en el mismo lugar de preferencia. Por ejemplo en la Tabla 4 para la serie con n=4 y
t=67 el modelo ARIMA(0.1.1), el método de Regresión Lineal y Suavizado Exponencial Doble tienen el mismo MSE y
ocupan ambos el primer lugar de preferencia. Queda entonces a criterio del usuario elegir uno si es necesario.
De los resultados de las Tablas 3 y 4 se extrajo la información presentada en la Tabla 6 y de las Tablas 3 y 5 se extrajo la
información presentada en la Tabla 7, que es un conteo de las veces en las que el mejor método de los ocho considerados
(basados en el MSE) se encontró entre los tres mejores predichos por la RNA. Esta información sirvió para determinar
estadísticamente qué tan buena fue la capacidad de predicción de las RNAs utilizadas en ambas etapas.
Real
Predichos
por la RNA
1
1
2
14
16
7
3
Otro
Total
12
7
49
Tabla 6. Número de métodos predichos por las RNAs de la primer etapa vs. Real
Real
Predichos
por la RNA
1
1
2
3
Otro
Total
17
15
10
7
49
Tabla 7. Número de métodos predichos por las RNAs de la segunda etapa vs. Real
De las Tablas 6 y 7 podemos concluir que en 42 de 49 casos, las RNAs predijeron la mejor técnica real de pronóstico dentro
de las primeras tres mejores, para las dos etapas del estudio. Sin embargo, las RNAs estudiadas en la segunda etapa
mostraron un mejor desempeño pues predijeron en 17 casos el primer método real, mientras que las RNAs de la primera
etapa lo hicieron en 14 casos. Con esta información podemos obtener un intervalo de confianza de 95% para proporciones
(θ), donde 0.751 < θ < 0.962, por lo tanto para el 95% de todos los casos podemos asegurar que del 75% al 96% de éstos,
las RNAs predecirán la mejor técnica real dentro de las primeras 3.
Se hace notar que en las Tablas 6 y 7 se toman 49 casos, siendo solamente 22 las series utilizadas para validar. La razón
obedece a lo explicado anteriormente, esto es que si el MSE real se repite 3 veces en el mejor lugar, se considera como tres
series en las cuales éste es primero.
5. Conclusiones y Trabajo a futuro
En este trabajo se propuso un método para seleccionar la mejor técnica de pronóstico tradicional para series de tiempo de
entre varias conocidas. Además se propuso una caracterización de series de tiempo cuyos resultados preliminares resultan
prometedores por su precisión y simpleza. Se describió también la construcción de las RNAs que se deben utilizar con el
método propuesto. Los resultados de validación permiten concluir que las RNAs predijeron satisfactoriamente la mejor
técnica dentro de las tres mejores técnicas en términos del MSE. Esta conclusión se corroboró con un buen nivel de
confianza obteniendo una prueba de hipótesis para proporciones, donde ésta comprende las series en las cuales su mejor
MSE real coincide con uno de los mejores tres MSE predichos por la RNA. Además se pudo observar que para una serie de
tiempo con características particulares puede haber más de un método de pronóstico con el mismo MSE tanto en los casos
reales como los predichos, lo que nos habla de que las RNAs utilizadas tienen buena capacidad de aproximación.
Tanto contar con un método fácil de implementar en MS Excel como con una caracterización precisa y simple de una serie
de tiempo son contribuciones de este trabajo que tienen importantes implicaciones de carácter práctico, pues con la
instauración del método propuesto se pueden esquivar los tres problemas identificados inicialmente con la generación de
pronósticos: (1) falta de entrenamiento estadístico, (2) falta de paquetería computacional adecuada y (3) falta de tiempo para
encontrar la mejor técnica.
Como una de las extensiones de este trabajo se tratará de ampliar el entrenamiento de las RNAs para abarcar un mayor
número de neuronas en la capa oculta de las redes utilizadas para probar la metodología propuesta. Con esto se pretende
verificar si se puede mejorar aún más la precisión al aumentar el número de neuronas en la capa oculta. Se pretende además
probar si el ordenamiento de los métodos depende del tamaño y la precisión de las RNAs o bien si el ordenamiento es en
realidad robusto ante variaciones de precisión. Un comportamiento robusto del ordenamiento podría llevarnos a economizar
8
el número de parámetros (pesos) que se utilizan en las RNAs, y por tanto, llevar a instauraciones computacionales más
eficientes.
Posteriormente, se planea también investigar la factibilidad de incorporar parámetros adicionales a la caracterización
propuesta a fin de mejorarla.
Referencias
Gupta J.N.D., Sexton R.S., and Tunc E.A., “Selecting Scheduling Heuristics Using Neural Networks”, Journal on
Computing, Vol. 12, No.2, Spring 2000, pp.150-162.
Hillier F.S. and Lieberman G.J., Introduction to Operations Research, 7th Edition, McGraw Hill, 2001, pp. 1009-1052
Hornik K., Stinchcombe M. and White H., “Multilayer feedforward networks are universal approximatiors”, Neuronal
Networks, Vol.2, No.5, 1989, pp.359-366.
Makridakis S., Wheelwright S.C., and Hyndman R.J., Forecasting Methods and Applications, 3rd Edition, John Wiley
&Sons, Inc., 1998, pp.42-45, 373.
9
Descargar