Atribución-NoComercial 4.0 InternacionalGonzález Salcedo, Luis OctavioBlandón López, León Darío2025-11-072025-11-072025-10-31https://repositorio.unal.edu.co/handle/unal/89113Ilustraciones, tablasSe compararon dos enfoques analíticos estadístico y neuronal artificial para estimar los caudales en la cuenca hidrográfica tropical del río Tuluá, a partir del análisis de variables hidroclimáticas registradas en estaciones de monitoreo ambiental de la CVC. Para ello, se analizaron cinco variables de entrada entre 2004 y 2022: caudal hídrico, precipitaciones, evaporación, temperatura y humedad relativa. Del análisis exploratorio de datos se detectaron anomalías en el comportamiento de dichas variables, incluyendo registros atípicos y variaciones inesperadas dentro del patrón normal de las series. La identificación de estos comportamientos irregulares justificó el uso de los coeficientes de Shapiro-Wilk, Kolmogorov-Smirnov y Mann-Kendall, lo cual permitió comprender el contexto hidroclimático que condiciona el comportamiento del caudal. Los análisis de normalidad evidenciaron que las variables no siguen una distribución normal. Asimismo, el coeficiente de Mann-Kendall permitió evaluar tendencias hidroclimáticas, especialmente en la zona plana de la cuenca, donde se observaron aumentos anómalos en la intensidad de lluvias en áreas montañosas y una tendencia creciente en temperatura y evaporación. Para completar los datos faltantes, se aplicaron correlaciones entre estaciones mediante el coeficiente de Pearson y el método de KNN (k-Nearest Neighbors), sobre un total de 6785 registros diarios. El desempeño de los modelos se evaluó mediante el coeficiente de correlación lineal R. En cuanto a los modelos predictivos, el algoritmo estadístico random forest explicó entre el 30 % y el 39 % de la variabilidad del caudal, con un valor de R=0,622. Las redes neuronales artificiales mostraron desempeños variables: el perceptrón multicapa (MLP) tipo feedforward-backpropagation alcanzó R=0,534, mientras que la red de funciones de base radial (RBF) presentó R=0,512, ambos considerados moderados. El modelo long short-term memory (LSTM) logró los mejores resultados en todas sus fases: R=0,908 (entrenamiento), R=0,8381 (prueba), R=0,7556 (validación) y R=0,908 (simulación general), lo que evidencia una alta capacidad de ajuste y excelente generalización. Se concluye que los modelos basados en redes neuronales, especialmente LSTM, ofrecen un alto potencial para la predicción de caudales en cuencas tropicales, superando al modelo estadístico random forest, el cual presenta baja precisión frente a los requerimientos de información en la cuenca hidrográfica. Futuras investigaciones podrían integrar variables relacionadas con el uso del suelo, cobertura vegetal y datos satelitales, así como aplicar modelos híbridos para fortalecer la precisión y robustez de las predicciones. Debido a su flexibilidad, escalabilidad y eficacia, este enfoque puede replicarse en otras cuencas con condiciones similares y constituye una herramienta valiosa para apoyar la gestión pública del recurso hídrico, la planificación territorial y la adaptación al cambio climático. (Texto tomado de la fuente)Two analytical approaches—statistical and artificial neural—were compared to estimate streamflow in the tropical Tuluá River basin, based on the analysis of hydroclimatic variables recorded at CVC environmental monitoring stations. Five input variables were analyzed between 2004 and 2022: streamflow, precipitation, evaporation, temperature, and relative humidity. Exploratory data analysis revealed anomalies in the behavior of these variables, including outliers and unexpected variations within the normal pattern of the series. The identification of these irregular behaviors justified the use of the Shapiro-Wilk, Kolmogorov-Smirnov, and Mann-Kendall coefficients, which allowed for an understanding of the hydroclimatic context influencing streamflow behavior. Normality analyses showed that the variables do not follow a normal distribution. Furthermore, the Mann-Kendall coefficient allowed for the evaluation of hydroclimatic trends, especially in the flatlands of the basin, where anomalous increases in rainfall intensity were observed in mountainous areas, along with a growing trend in temperature and evaporation. To complete the missing data, correlations between stations were applied using Pearson's correlation coefficient and the k-Nearest Neighbors (kNN) method, based on a total of 6,785 daily records. Model performance was evaluated using the linear correlation coefficient R. Regarding the predictive models, the random forest statistical algorithm explained between 30% and 39% of the flow variability, with an R-value of 0.622. The artificial neural networks showed variable performance: the feedforward-backpropagation multilayer perceptron (MLP) achieved R-value 0.534, while the radial basis function (RBF) network presented Rvalue 0.512, both considered moderate. The long short-term memory (LSTM) model achieved the best results in all its phases: R=0.908 (training), R=0.8381 (testing), R=0.7556 (validation), and R=0.908 (general simulation), demonstrating a high fit and excellent generalizability. It is concluded that neural network-based models, especially LSTM, offer high potential for predicting streamflow in tropical basins, surpassing the random forest statistical model, which exhibits low accuracy given the information requirements of the watershed. Future research could integrate variables related to land use, vegetation cover, and satellite data, as well as apply hybrid models to strengthen the accuracy and robustness of the predictions. Due to its flexibility, scalability, and effectiveness, this approach can be replicated in other basins with similar conditions and constitutes a valuable tool to support public water resource management, land-use planning, and climate change adaptation.xii, 118 páginas + anexosapplication/pdfspahttp://creativecommons.org/licenses/by-nc/4.0/550 - Ciencias de la tierra::551 - Geología, hidrología, meteorologíaElaboración y comparación de dos modelos predictivos para determinar caudales a través del análisis de variables hidroclimáticas de una cuenca hidrográfica tropical: caso de estudio cuenca del rio Tuluá.Trabajo de grado - MaestríaUniversidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/info:eu-repo/semantics/openAccessPredicción climáticaClimate predictionTécnicas de predicciónForecastingRecurso hídricoWater resourcesAnálisis de tendencias climáticasAprendizaje automáticoCaudalCoeficiente de Mann KendallHidrología de cuencasHidrología fluvialModelos neuronales artificialesModelo LSTMPredicción hidrológicaSeries de tiempoClimate trend analysisClimate trend analysisStreamflowMann-Kendall coefficientBasin hydrologyRiver hydrologyArtificial neural modelsLSTM modelHydrological predictionTime seriesCuenca fluvialRiver basinsDatos hidrológicosHydrological dataDevelopment and comparison of two predictive models to determine flow rates through the analysis of hydroclimatic variables in a tropical watershed: Case study of the Tuluá River basin.