PREDICCIÓN METEOROLÓGICA Inteligencia en Redes de Comunicaciones Pablo Galarza Heredero Miguel Ángel Fuente Rodríguez DATOS DE ENTRADA Preprocesado de los datos – Selección de los atributos – Selección de los instantes de referencia [i] [i-1] [i-2] [i-48] [i-50] [i-96] [i-98] [i-17520] [i+2] Ahora ½ hora 1 hora 1 día 1 día 1 hora 2 días 2 días 1 hora 1 año + 1 Dia – Creación de la matriz mediante un programa en C, el uso del comando “cut” de Linux y el uso de editores de texto. DATOS DE ENTRADA Necesidad de muestrear por el gran tamaño del archivo Uso de un script de bash que automatice el proceso Selección de 1 registro de cada 14. Total: unos 10000 registros. Introducción de cabeceras para Weka. PREDICCIÓN A 1 HORA Mejor resultado obtenido con el algoritmo M5P Resultado: Correlation coefficient Mean absolute error Root mean squared error Relative absolute error Root relative squared error Total Number of Instances Ignored Class Unknown Instances 0.9906 1.5778 2.2193 11.7764 % 13.6802 % 2849 279 PREDICCIÓN A 24 HORAS Mejor resultado obtenido con el algoritmo Bagging, en conjunción con REPTree Resultado: Correlation coefficient Mean absolute error Root mean squared error Relative absolute error Root relative squared error Total Number of Instances Ignored Class Unknown Instances 0.9456 3.9174 5.1752 29.7004 % 32.534 % 2824 305 PREDICCIÓN DE CONDICIONES Mejor resultado obtenido con el algoritmo DecisionTable Resultado: Correctly Classified Instances Incorrectly Classified Instances Kappa statistic Mean absolute error Root mean squared error Relative absolute error Root relative squared error Total Number of Instances Ignored Class Unknown Instances 1715 1179 59.2605 40.7395 0.1818 0.1108 0.2385 91.3018 96.3945 2894 227 % % % % CONCLUSIONES Resultados poco satisfactorios para las predicciones a 24 horas. Necesidad de incluir otros parámetros, como los valores medios mensuales. Mayor efectividad en los algoritmos de árboles, por tiempo y prestaciones.