Definición de un modelo de clasificación de riesgo cardiovascular para una población de adultos mayores usando técnicas de aprendizaje de máquinas
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2020Metadata
Show full item recordSummary
Según cifras reportadas por la organización mundial de la salud (OMS), las enfermedades cardiovasculares son la principal causa de muerte en el mundo, el riesgo de padecerlas aumenta en adultos mayores y ante la presencia de factores de riesgo como la hipertensión, diabetes, obesidad y tabaquismo; en Colombia la situación es similar. Para la estimación del riesgo cardiovascular se han creado diferentes métodos que analizan el desarrollo de este tipo de enfermedades según el grado de exposición a algunos factores de riesgo, pero estos no suelen ser precisos en todas las poblaciones. El aprendizaje de máquinas ha demostrado su valor de aplicación en contextos médicos, siendo una herramienta novedosa y alternativa que apoya tareas complejas como el diagnóstico de enfermedades. En el presente trabajo se consideran tres modelos de aprendizaje de máquinas, usados en tareas de clasificación que, según la revisión de la literatura desarrollada, pueden ser óptimos en información clínica, con lo que se pretende identificar para una población colombiana de adultos mayores el riesgo asociado al padecimiento de enfermedades cardiovasculares. Para la evaluación del desempeño de los modelos propuestos se utilizan criterios de bondad de ajuste como exactitud, sensibilidad, precisión y f1-score, donde el modelo óptimo se obtiene con el algoritmo de máquina de aumento de gradiente, con un rendimiento mejor a los reportados por estudios similares referenciados.Abstract
Figures of the World Health Organization (WHO) demonstrated that cardiovascular disease (CVD) is the first cause of death worldwide. The risk of suffering is higher in older people and increases with some preview’s pathologies like hypertension, diabetes, obesity, and smoking. The tendency is equal in Colombia. To estimate cardiovascular risk, different methods have been created that analyze the development of this type of disease according to the degree of exposure to different risk factors, but these are not usually accurate in all populations. Machine learning has proven its application value in medical contexts, being a novel and alternative tool that supports complex tasks such as disease diagnosis. For the present work, three models of machine learning are considered, used in classification tasks that, according to the review of the developed literature may be optimal for clinical information with which it is intended to identify risk for a Colombian population of older adults associated with the suffering of cardiovascular diseases. For the evaluation of the performance of the proposed models, goodness of fit criteria such as accuracy, sensitivity, precision and f1-score are used, where the optimal model is obtained with the gradient boosting machine algorithm, with a better performance than those reported by similar studies referenced.Keywords
Collections
