Un método para la asignación de cupos de crédito de entidades del sector financiero colombiano empleando técnicas de machine learning
Archivos
Autores
Saavedra Porras, Edher Daniel
Director
Espinosa Bedoya, Albeiro
Tipo de contenido
Trabajo de grado - Maestría
Fecha de publicación
2023-12-30
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
El análisis de riesgo de crédito desempeña un papel crucial en el sector financiero, ya que evalúa variables que podrían deteriorarse en circunstancias particulares, llevando a un incumplimiento de obligaciones y, aunque la metodología CAMEL es ampliamente utilizada, esta se basa en un sistema de calificaciones simple. Evaluar la influencia de factores macro y microeconómicos en la estabilidad financiera, especialmente en un contexto de preocupaciones globales, junto con la monitorización de indicadores es crucial para mitigar incumplimientos crediticios. A agosto de 2022, la cartera morosa en el sector financiero colombiano asciende a COP 23.4 billones, por lo cual, se busca proponer un método para la asignación de cupos de crédito basado en machine learning, analizar métodos existentes, desarrollar un método basado en indicadores financieros, y validar el modelo propuesto comparándolo con otros en la literatura. El análisis de los antecedentes muestra que los métodos de machine learning superan a los estadísticos tradicionales en la estimación de riesgos crediticios, destacándose técnicas como Random Forest, Support Vector Machines, y redes neuronales. Además, se aplicaron criterios ponderados para evaluar la elección de dichos métodos, considerando la frecuencia de aplicación, resultados destacados en la literatura y opiniones de expertos. Random Forest y Árboles de Decisión obtuvieron las calificaciones más altas en el ranking debido a que se destacan su flexibilidad y capacidad para manejar diversos desafíos en diferentes aplicaciones. El análisis se basó en más de 50 indicadores financieros recopilados de la Superintendencia Financiera de Colombia, abarcando diversas entidades del sector financiero, para luego implementar un modelo de clasificación de riesgo crediticio mediante Random Forest, logrando una precisión excepcional del 99.9% en datos de prueba y 99.79% en entrenamiento. La interpretación de la importancia de las características y la matriz de confusión respaldan la robustez del modelo. Finalmente, se compararon los resultados con árboles de decisión y regresión logística, obteniendo un accuracy de 99.9% para Random Forest, 97.9% en la métrica de recall y 98.9% en F1 Score, resultados superiores a los modelos en comparación y destacando el notable rendimiento superior de Random Forest en la predicción de riesgo crediticio. Estos hallazgos respaldan su elección como una herramienta eficaz en la gestión de riesgos crediticios en el contexto colombiano. (Tomado de la fuente)
Abstract
Credit risk analysis plays a crucial role in the financial sector, as it evaluates variables that could deteriorate under specific circumstances, leading to non-compliance with obligations. Although the CAMEL methodology is widely used, it relies on a simple rating system. Evaluating the influence of macro and microeconomic factors on financial stability, especially in a context of global concerns, and monitoring indicators are crucial to mitigate credit defaults. As of August 2022, the non-performing portfolio in the Colombian financial sector amounts to COP 23.4 trillion. Therefore, we aim to propose a method for assigning credit quotas based on machine learning, analyze existing methods, develop a method based on financial indicators, and validate the proposed model by comparing it with others in the literature. The background analysis indicates that machine learning methods outperform traditional statistics in estimating credit risks. Techniques such as Random Forest, Support Vector Machines, and neural networks stand out. Weighted criteria were applied to evaluate the choice of these methods, considering the frequency of application, notable results in the literature, and expert opinions. Random Forest and Decision Trees obtained the highest scores in the ranking due to their flexibility and ability to handle various challenges in different applications. The analysis was based on more than 50 financial indicators collected from the Financial Superintendency of Colombia, encompassing various entities in the financial sector. Subsequently, a credit risk classification model was implemented using Random Forest, achieving an exceptional accuracy of 99.9% in test data and 99.79% in training. The interpretation of the importance of the features and the confusion matrix supports the robustness of the model. Finally, the results were compared with decision trees and logistic regression, yielding an accuracy of 99.9% for Random Forest, 97.9% in the recall metric, and 98.9% in F1 Score, results superior to the models in comparison, highlighting the remarkable superior performance of Random Forest in credit risk prediction. These findings support its selection as an effective tool in credit risk management in the Colombian context.
Palabras clave
Descripción Física/Lógica/Digital
Ilustraciones, gráficos, tablas