Pronóstico de la precipitación acumulada en Colombia, utilizando técnicas de aprendizaje automático
Cargando...
Autores
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
Este trabajo aborda el desafío del pronóstico de precipitación en Colombia, un aspecto fundamental para sectores estratégicos como la agricultura, la gestión de recursos hídricos, la energía y la mitigación de riesgos naturales. En un país caracterizado por su alta variabilidad climática y diversidad geográfica, la predicción exacta de la precipitación representa no solo un reto académico, sino una necesidad estratégica.
En este contexto, se llevó a cabo un procesamiento automatizado de datos abiertos de precipitación acumulada, obtenidos a partir de las estaciones meteorológicas del Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM), distribuidas a lo largo del territorio colombiano. El análisis incluyó la aplicación de técnicas de descomposición de señales, como Complete Ensemble Empirical Mode Decomposition with Adaptive Noise (CEEMDAN) y Variational Mode Decomposition (VMD).
Se evaluó el desempeño de diversos algoritmos de aprendizaje automático, incluyendo modelos basados en árboles de decisión (XGBoost), redes neuronales recurrentes (LSTM, BiLSTM), arquitecturas Transformer (Lag-Llama) y métodos híbridos con descomposición de señales y máquinas de soporte vectorial (CEEMDAN-VMD-BiLSTM, SVM-BiLSTM). La evaluación se realizó mediante métricas utilizadas en predicción climática como Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Nash-Sutcliffe Efficiency (NSE) y Forecast Anomaly Correlation (AC).
Los resultados demostraron que el modelo XGBoost presentó un rendimiento superior, con el menor error cuadrático medio y el coeficiente de Nash-Sutcliffe más alto. Los modelos basados en redes neuronales recurrentes mostraron un desempeño ligeramente inferior pero consistente, mientras que las arquitecturas más complejas como Lag-Llama y CEEMDAN-VMD-BiLSTM exhibieron limitaciones significativas.
Finalmente, se diseñó una arquitectura de implementación incorporando prácticas de operaciones de aprendizaje automático (MLOps), definiendo componentes técnicos, principios y herramientas útiles para implementar los modelos en entornos productivos. Este trabajo contribuye al desarrollo científico y tecnológico en la predicción hidrometeorológica en Colombia, ofreciendo alternativas innovadoras frente a los modelos numéricos tradicionales y evaluando su viabilidad en el contexto local. (Texto tomado de la fuente).
Abstract
This work addresses the challenge of precipitation forecasting in Colombia, a fundamental aspect for strategic sectors such as agriculture, water resource management, energy, and natural disaster risk mitigation. In a country characterized by high climatic variability and geographic diversity, accurate precipitation prediction represents not only an academic challenge but also a strategic necessity.
In this context, an automated processing of open data on accumulated precipitation was carried out, obtained from the meteorological stations of the Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM), distributed throughout the Colombian territory. The analysis included the application of signal decomposition techniques such as Complete Ensemble Empirical Mode Decomposition with Adaptive Noise (CEEMDAN) and Variational Mode Decomposition (VMD).
The performance of various machine learning algorithms was evaluated, including decision tree–based models (XGBoost), recurrent neural networks (LSTM, BiLSTM), Transformer architectures (Lag-Llama), and hybrid methods combining signal decomposition and support vector machines (CEEMDAN-VMD-BiLSTM, SVM-BiLSTM). Evaluation was carried out using metrics commonly applied in climate prediction, such as Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Nash-Sutcliffe Efficiency (NSE), and Forecast Anomaly Correlation (AC).
The results showed that the XGBoost model achieved the best performance, with the lowest root mean square error and the highest Nash-Sutcliffe coefficient. Recurrent neural network–based models showed slightly lower but consistent performance, while more complex architectures such as Lag-Llama and CEEMDAN-VMD-BiLSTM exhibited significant limitations.
Finally, an implementation architecture was designed incorporating machine learning operations (MLOps) practices, defining technical components, principles, and useful tools for deploying the models in production environments. This work contributes to the scientific and technological development of hydrometeorological forecasting in Colombia, offering innovative alternatives to traditional numerical models and evaluating their feasibility in the local context.
Palabras clave propuestas
Descripción
ilustraciones, diagramas

