Probabilistic forecasting of electricity demand in Colombia
Autor
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
InglésFecha de publicación
2024-04-09Abstract
New approaches have emerged in the field of uncertainty measurement, offering ways to estimate models and their corresponding confidence levels for point predictions. Our first purpose is to compare the predictive capabilities of some models built for forecasting daily electricity demand in Colombia. Initially, we employ generalized linear models, followed by Machine Learning models such as ensemble learning models, support vector machines (SVM), and finally deep learning models. The goal is to determine which model demonstrates superior predictive accuracy in forecasting daily electricity demand in Colombia. In order to evaluate their performance, we mainly use Mean Absolute Percentage Error (MAPE) as a comprehensive measure, which allows us to evaluate their effectiveness in capturing the actual demand values. And also take into account the mean absolute error (MAE) and the root mean squared error (RMSE). Next, we turn our attention on the creation of prediction intervals to handle the uncertainty in our forecasts. We use techniques like Bootstrapping to figure out these intervals. We also incorporate conformal prediction to improve the reliability of our intervals. Our prediction intervals are evaluated primarily based on their coverage percentage. This will allow us to see how frequently our prediction intervals correspond to the actual demand from this data. Through this combination of methods, our goal is to establish a robust and user-friendly framework for forecasting daily electricity demand in Colombia. The results of this development suggest that (1) for the daily energy demand of Colombia, with the variables obtained at a daily frequency, a simple model such as a regularized model works better than an advanced and much more complex model such as a deep learning model. (2) Regarding feature selection concerns, the most important variables are the energy demand lags and demand structure variables for the Lasso model, which works as a feature selection method, due to its regularization nature. This confirms that the inclusion of lags or having an autocorrelated structure is important in this type of problem. Finally, for the forecast intervals, in which we used two methods, the first and most common was the bootstrap method and the second, whose development is more recent, is the conformal Prediction. The construction of our prediction intervals allowed us to give a 99 % confidence level to the point prediction and not just rely on the comparison between the actual and predicted values. (Tomado de la fuente)Resumen
Han surgido nuevos enfoques en el campo de la medición de la incertidumbre, que ofrecen formas de estimar modelos y sus correspondientes niveles de confianza para predicciones puntuales. Nuestro primer propósito es comparar las capacidades predictivas de algunos modelos construidos para pronosticar la demanda diaria de electricidad en Colombia. Inicialmente, empleamos modelos lineales generalizados, seguidos de modelos de Machine Learning tales como modelos de aprendizaje ensemble, máquinas de vectores soporte (SVM), y finalmente modelos de aprendizaje profundo. El objetivo es determinar qué modelo demuestra una precisión predictiva superior en el pronóstico de la demanda diaria de electricidad en Colombia. Para evaluar su desempeño se utiliza principalmente el Error Porcentual Absoluto Medio (MAPE) como medida integral, que permite evaluar su efectividad para capturar los valores reales de demanda. También tenemos en cuenta el error medio absoluto (MAE) y el error cuadrático medio (RMSE). A continuación, centramos nuestra atención en la creación de intervalos de predicción para manejar la incertidumbre de nuestras previsiones. Para calcular estos intervalos utilizamos técnicas como el Bootstrapping. También incorporamos la predicción conforme para mejorar la fiabilidad de nuestros intervalos. Nuestros intervalos de predicción se evalúan principalmente en función de su porcentaje de cobertura. Esto nos permitirá ver con qué frecuencia nuestros intervalos de predicción se corresponden con la demanda real a partir de estos datos. Mediante esta combinación de métodos, nuestro objetivo es establecer un marco robusto y fácil de usar para la predicción de la demanda diaria de electricidad en Colombia. Los resultados de este desarrollo sugieren que (1) para la demanda diaria de energía de Colombia, con las variables obtenidas a una frecuencia diaria, un modelo simple como un modelo regularizado funciona mejor que un modelo avanzado y mucho más complejo como un modelo de aprendizaje profundo. (2) En cuanto a las preocupaciones de selección de características, las variables más importantes son los rezagos de demanda de energía y las variables de estructura de demanda para el modelo Lasso, que funciona como método de selección de características, debido a su naturaleza de regularización. Esto confirma que la inclusión de retardos o tener una estructura autocorrelacionada es importante en este tipo de problemas. Por último, para los intervalos de predicción, en los que utilizamos dos métodos, el primero y más común fue el método bootstrap y el segundo, cuyo desarrollo es más reciente, es la Predicción conforme. La construcción de nuestros intervalos de predicción nos permitió dar un nivel de confianza del 99% a la predicción puntual y no basarnos únicamente en la comparación entre los valores reales y los predichos.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, gráficos
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito