Una comparación entre modelos estadísticos y de Machine Learning para la predicción de series de tiempo multivariadas
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2023Metadata
Show full item recordSummary
La predicción de series de tiempo es un área clásica de estudio en estadística y un campo en crecimiento del Aprendizaje Automático (o Machine Learning en inglés). El presente trabajo pretende comparar el desempeño para predecir un paso adelante en series de tiempo multivariadas entre los modelos estadísticos clásicos —Vector Autorregresivo (VAR) y Modelo de Corrección de Errores Vectoriales (VECM)— y los modelos de Machine Learning —Perceptrón Multicapa (MLP), Long Short Term Memory (LSTM) y Gated Recurrent Unit (GRU). Como una alternativa a ambos tipos de modelos se consideró la combinación de pronósticos de varios modelos estadísticos y de Machine Learning para mejorar las predicciones. El desempeño de las predicciones se examinó mediante las métricas del error observado: Error Cuadrático Medio (ECM), Error Absoluto Medio (EAM) y la Raíz del Error Cuadrático Medio (RECM). Además, se contrastó la diferencia estadística entre las predicciones mediante una prueba Diebold-Mariano y de abarcamiento (o encompassing en inglés) multivariada. Para la construcción de los resultados empíricos se utilizaron siete series de tiempo multivariadas de diferentes ámbitos (economía, finanzas, epidemiología, meteorología, violencia y sociedad). (Texto tomado de la fuente)Abstract
Time series prediction is a classical area of study in statistics and a growing field in Machine Learning. This paper aims to compare the performance of classic statistical models — Vector Autoregressive (VAR) and Vector Error Correction Model (VECM) — with Machine Learning models — Multilayer Perceptron (MLP), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU) — for one-step-ahead prediction in multivariate time series. As an alternative to both types of models, the combination of forecasts from various statistical and Machine Learning models was considered to improve predictions. The prediction performance was examined using the following error metrics: Mean Squared Error (MSE), Mean Absolute Error (MAE), and Root Mean Squared Error (RMSE). Additionally, the statistical difference between predictions was tested using the Diebold-Mariano test and multivariate encompassing test. For the construction of empirical results, seven multivariate time series from different domains (economy, finance, epidemiology, meteorology, violence, and society) were used.Keywords
Physical description
ilustraciones, diagramas
Collections
