Modelo predictivo para la ocurrencia de leishmaniasis cutánea en Colombia, a partir de variables ambientales y socioeconómicas

dc.contributor.advisorNiño Vásquez, Luis Fernando
dc.contributor.advisorGutiérrez Torres, Juan David
dc.contributor.authorSalazar Mora, José Daniel
dc.contributor.researchgroupLaboratorio de investigación en sistemas inteligentes (LISI)spa
dc.coverage.countryColombia
dc.date.accessioned2021-10-08T14:40:28Z
dc.date.available2021-10-08T14:40:28Z
dc.date.issued2021-10-07
dc.descriptionilustraciones, gráficas, tablasspa
dc.description.abstractSe crearon varios modelos predictivos para la ocurrencia de leishmaniasis cutánea en Colombia a partir de un conjunto de variables socioeconómicas y ambientales. Con este conjunto de datos (dataset) se hizo un trabajo de ciencia de datos utilizando el proceso de KDD (Knowledge Discovery in Databases), pasando por cada una de sus etapas. Particularmente, se recolectó y organizó el conjunto de datos, se elaboró una descripción y revisión de este y se hizo un análisis estadístico descriptivo. Después, se realizó el preprocesamiento de los datos, se hicieron transformaciones de estos y se implementaron técnicas de reducción de dimensionalidad. Posteriormente, se procedió a utilizar diferentes técnicas de aprendizaje de máquina, tanto para clasificación como regresión. Para clasificación se implementaron varios métodos: naive bayes, redes neuronales (perceptrón multicapa), árboles de decisión y redes bayesianas, los cuales permitieron generar un modelo predictivo de clasificación, obteniendo los mejores resultados con el algoritmo XGBoost sobre un set de datos municipal con datos reportados mensualmente. De la misma forma, se realizó un modelo de regresión a través de redes neuronales y XGBoost, obteniendo los mejores resultados con el algoritmo XGBoost, pero esta vez con un conjunto de datos departamentales con periodicidad mensual. Finalmente, se realizó un análisis de series de tiempo con algoritmos de regresión con redes neuronales y XGBoost obteniendo las mejores métricas con XGBoost para un modelo departamental con resolución temporal semanal. Con cada uno de los modelos se identificaron las variables más importantes para la predicción; todos los modelos tuvieron en cuenta al menos las siguientes: el total de la población, precipitación, temperatura, índice de vegetación mejorado (EVI por sus siglas en inglés) y mes. Además, para poder utilizar el modelo de regresión para series de tiempo, se creó una página web que recibe como entrada las variables independientes junto con sus retrasos y genera la predicción de la cantidad de casos futuros a 1, 2 y 4 semanas. (Texto tomado de la fuente).spa
dc.description.abstractSeveral predictive models were created for the occurrence of cutaneous leishmaniasis in Colombia from a set of socioeconomic and environmental variables. With this dataset, a data science work was done using the KDD process (Knowledge Discovery in Databases), going through each of its stages. In particular, the data set was collected and organized, a description and review of it was prepared, and a descriptive statistical analysis was carried out. Afterwards, the data was preprocessed, transformations were made of these and dimensionality reduction techniques were implemented. Subsequently, different machine learning techniques were used, both for classification and regression. For classification, several methods were implemented: naive bayes, neural networks (multilayer perceptron), decision trees and Bayesian networks, which allowed to generate a predictive classification model, obtaining the best results with the XGBoost algorithm on a municipal data set with data reported monthly. In the same way, a regression model was carried out through neural networks and XGBoost, obtaining the best results with the XGBoost algorithm, but this time with a departmental data set on a monthly basis. Finally, a time series analysis was performed with regression algorithms with neural networks and XGBoost, obtaining the best metrics with XGBoost for a departmental model with weekly temporal resolution. With each of the models, the most important variables for prediction were identified; all the models took into account at least the following variables: the total population, precipitation, temperature, improved vegetation index (EVI) and month. In addition, to be able to use the regression model for time series, a web page was created that receives as input the independent variables together with their delays and generates the prediction of the number of future cases at 1, 2 and 4 weeks.eng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ingeniería - Ingeniería de Sistemas y Computaciónspa
dc.description.methodsProceso KDD (Knowledge Discovery in Databases)spa
dc.description.notesIncluye anexosspa
dc.description.notesContiene componente investigativo en ciencia de datos, epidemiología, inteligencia artificial y desarrollo de software.spa
dc.description.researchareaCiencia de datos e inteligencia artificialspa
dc.format.extent117 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/80442
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.departmentDepartamento de Ingeniería de Sistemas e Industrialspa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.placeBogotá, Colombiaspa
dc.publisher.programBogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computaciónspa
dc.relation.indexedBiremespa
dc.relation.references[1] Agudelo, J. Informe de evento de leishmaniasis. Colombia, 2017. [2] Zambrano, P. Leishmaniasis. Colombia: Bogotá, Instituto Nacional de Salud 2014. [3] Sociedad colombiana de infectología. Guía 2I. Guía de atención de la leishmaniasis. Ministerio de la protección social, Colombia. [4] Medical Care Development International. Leishmaniosis: ciclo biológico. Disponible en: https://www.mcdinternational.org/trainings/malaria/spanish/dpdx/HTML/Frames/G-L/Leishmaniasis/body_Leishmaniasis_pg1#Life%20Cycle [5] Leishmaniosis: ciclo biológico de la leishmania y transmisión. 20 AV 16. Leishmaniosis. Disponible en: http://axonveterinaria.net/web_axoncomunicacion/auxiliarveterinario/20/AV_20_16-19_Leishmaniosis_ciclo_transmision.pdf [6] Hernández, A., Gutiérrez, J., Xiao, Y., Branscum, A. & Cuadros, D. Spatial epidemiology of cutaneous leishmaniasis in Colombia: socioeconomic and demographic factors associated with a growing epidemic. The royal society tropical medicine & hygiene. 2019. [7] Russell, S. & Norving, P. Artificial Intelligence A Modern Appoach. Prentice Hall, Third Edition. 2010 [8] Alberto, J. Introducción al Análisis de series temporales. Universidad Complutense de Madrid, marzo de 2007. [9] Brownlee, J. Hyperparameter Optimization With Random Search and Grid Search. Machine Learning Mastery. (2020, sep. 19). [Online]. Disponible en: https://machinelearningmastery.com/hyperparameter-optimization-with-random-search-and-grid-search/ [10] Dong, W., Huang, Y., Lehane, B. & Ma, G. XGBoost algorithm-based prediction of concrete electrical resistivity for structural health monitoring. ELSEVIER, 2020. [11] Sitiobigdata. Gentle Introduction of XGBoost Library. (2019, ene. 19). [Online]. Disponible en: https://sitiobigdata.com/2019/01/20/gentle-introduction-of-xgboost-library/#ambientales y socioeconómicas [12] Towards data science. The Ultimate Guide to AdaBoost, random forests and XGBoost. (2020, mar. 16). [Online]. Disponible en: https://towardsdatascience.com/the-ultimate-guide-to-adaboost-random-forests-and-xgboost-7f9327061c4f [13] King, R., Campbell-Lendrum, D., & Davies, C. Predicting Geographic Variation in Cutaneous Leishmaniasis, Colombia, 2004. [14] Chaves, L. & Pascual, M. Climate Cycles and Forecasts of Cutaneous Leishmaniasis, a Nonstationary Vector-Borne Disease. PLos Medicine, agosto de 2006. [15] Chaves, L. Climate and recruitment limitation of hosts: the dynamics of American cutaneous leishmaniasis seen through semi-mechanistic seasonal models. Annals of Tropical Medicine & Parasitology, diciembre de 2008. [16] Lewnard, J. A., Jirmanus, L., Júnior, N. N., Machado, P. R., Glesby, M. J., Ko, A. I. & Weinberger, D. M. Forecasting Temporal Dynamics of Cutaneous Leishmaniasis in Northeast Brazil. PLoS Neglected Tropical Diseases, 2014. [17] Sharafi, M., Ghaem, H., Tabatabaee, H. R., & Faramarzi, H. Forecasting the number of zoonotic cutaneous leishmaniasis cases in south of Fars province, Iran using seasonal ARIMA time series method. Asian Pacific Journal of Tropical Medicine, diciembre de 2016. [18] Valderrama, C., Alexander, N., Ferro, C., Cadena, H., Marín, D., Holford, T., Munstermann, L. & Ocampo, C. Environmental Risk Factors for the Incidence of American Cutaneous Leishmaniasis in a Sub-Andean Zone of Colombia (Chaparral, Tolima). Am. J. Trop. Med. Hyg., 82(2), 2010, pp. 243–250. [19] Chaves, L. F., Calzada, J. E., Valderrama, A., & Saldaña, A. Cutaneous Leishmaniasis and Sand Fly Fluctuations Are Associated with El Niño in Panamá. PLoS Neglected Tropical Diseases, octubre de 2014. [20] Pérez, M., Ocampo, C., Valderrama, C. & Alexander, N. Spatial modeling of cutaneous leishmaniasis in the Andean region of Colombia. Mem Inst Oswaldo Cruz, Rio de Janeiro, Vol. 111(7): 433-442, julio de 2016. [21] Gutiérrez, J., Martínez, R., Ramoni, J., Diaz, F., Gutiérrez, R., Ruiz, F., Botello, H., Gil, M., González, J. & Palencia, M. Environmental and socio-economic determinants associated with the occurrence of cutaneous leishmaniasis in the northeast of Colombia. Trans R Soc Trop Med Hyg 2018; 00: 1–8. [22] Yuexin, W., Nishiura, H, Yiming, Y. & M. Saitoh. Deep Learning for Epidemiological Predictions. Short Research Papers II. MI, USA, julio de 2018. [23] Zhao, N., Charland, K., Carabali, M., Nsoesie, E., Maher-Giroux, M., Rees, E., Yuan, M., Garcia C., Ramirez, G. & Zinszer, K. Machine learning and dengue forecasting: Comparing random forests and artificial neural 2 networks for predicting dengue burdens at the national sub-national scale in Colombia. BioRxiv, enero de 2020. [24] Fayyad, U. & Stolorz, P. Data mining and KDD: Promise and challenges. Future Generation Computer Systems. ELSEVIER, pp. 99-104, 1997 [25] Shafique, U., & Qaiser, H. A Comparative Study of Data Mining Process Models (KDD, CRISP-DM and SEMMA). International Journal of Innovation and Scientific Research, Vol. 12 No. 1, pp. 217-22, noviembre de 2014. [26] Maimon, O. & Rokach, L. Data Mining and Knowledge Discovery Handbook. Springer-Verretraso New York, Inc., 2nd ed., febrero 2018.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseReconocimiento 4.0 Internacionalspa
dc.rights.references[1] Agudelo, J. Informe de evento de leishmaniasis. Colombia, 2017.spa
dc.rights.references[2] Zambrano, P. Leishmaniasis. Colombia: Bogotá, Instituto Nacional de Salud 2014.spa
dc.rights.references[3] Sociedad colombiana de infectología. Guía 2I. Guía de atención de la leishmaniasis. Ministerio de la protección social, Colombia.spa
dc.rights.references[4] Medical Care Development International. Leishmaniosis: ciclo biológico. Disponible en: https://www.mcdinternational.org/trainings/malaria/spanish/dpdx/HTML/Frames/G-L/Leishmaniasis/body_Leishmaniasis_pg1#Life%20Cyclespa
dc.rights.references[5] Leishmaniosis: ciclo biológico de la leishmania y transmisión. 20 AV 16. Leishmaniosis. Disponible en: http://axonveterinaria.net/web_axoncomunicacion/auxiliarveterinario/20/AV_20_16-19_Leishmaniosis_ciclo_transmision.pdfspa
dc.rights.references[6] Hernández, A., Gutiérrez, J., Xiao, Y., Branscum, A. & Cuadros, D. Spatial epidemiology of cutaneous leishmaniasis in Colombia: socioeconomic and demographic factors associated with a growing epidemic. The royal society tropical medicine & hygiene. 2019.spa
dc.rights.references[7] Russell, S. & Norving, P. Artificial Intelligence A Modern Appoach. Prentice Hall, Third Edition. 2010spa
dc.rights.references[8] Alberto, J. Introducción al Análisis de series temporales. Universidad Complutense de Madrid, marzo de 2007.spa
dc.rights.references[9] Brownlee, J. Hyperparameter Optimization With Random Search and Grid Search. Machine Learning Mastery. (2020, sep. 19). [Online]. Disponible en: https://machinelearningmastery.com/hyperparameter-optimization-with-random-search-and-grid-search/spa
dc.rights.references[10] Dong, W., Huang, Y., Lehane, B. & Ma, G. XGBoost algorithm-based prediction of concrete electrical resistivity for structural health monitoring. ELSEVIER, 2020.spa
dc.rights.references[11] Sitiobigdata. Gentle Introduction of XGBoost Library. (2019, ene. 19). [Online]. Disponible en: https://sitiobigdata.com/2019/01/20/gentle-introduction-of-xgboost-library/#ambientales y socioeconómicasspa
dc.rights.references[12] Towards data science. The Ultimate Guide to AdaBoost, random forests and XGBoost. (2020, mar. 16). [Online]. Disponible en: https://towardsdatascience.com/the-ultimate-guide-to-adaboost-random-forests-and-xgboost-7f9327061c4fspa
dc.rights.references[13] King, R., Campbell-Lendrum, D., & Davies, C. Predicting Geographic Variation in Cutaneous Leishmaniasis, Colombia, 2004.spa
dc.rights.references[14] Chaves, L. & Pascual, M. Climate Cycles and Forecasts of Cutaneous Leishmaniasis, a Nonstationary Vector-Borne Disease. PLos Medicine, agosto de 2006.spa
dc.rights.references[15] Chaves, L. Climate and recruitment limitation of hosts: the dynamics of American cutaneous leishmaniasis seen through semi-mechanistic seasonal models. Annals of Tropical Medicine & Parasitology, diciembre de 2008.spa
dc.rights.references[16] Lewnard, J. A., Jirmanus, L., Júnior, N. N., Machado, P. R., Glesby, M. J., Ko, A. I. & Weinberger, D. M. Forecasting Temporal Dynamics of Cutaneous Leishmaniasis in Northeast Brazil. PLoS Neglected Tropical Diseases, 2014.spa
dc.rights.references[17] Sharafi, M., Ghaem, H., Tabatabaee, H. R., & Faramarzi, H. Forecasting the number of zoonotic cutaneous leishmaniasis cases in south of Fars province, Iran using seasonal ARIMA time series method. Asian Pacific Journal of Tropical Medicine, diciembre de 2016.spa
dc.rights.references[18] Valderrama, C., Alexander, N., Ferro, C., Cadena, H., Marín, D., Holford, T., Munstermann, L. & Ocampo, C. Environmental Risk Factors for the Incidence of American Cutaneous Leishmaniasis in a Sub-Andean Zone of Colombia (Chaparral, Tolima). Am. J. Trop. Med. Hyg., 82(2), 2010, pp. 243–250.spa
dc.rights.references[19] Chaves, L. F., Calzada, J. E., Valderrama, A., & Saldaña, A. Cutaneous Leishmaniasis and Sand Fly Fluctuations Are Associated with El Niño in Panamá. PLoS Neglected Tropical Diseases, octubre de 2014.spa
dc.rights.references[20] Pérez, M., Ocampo, C., Valderrama, C. & Alexander, N. Spatial modeling of cutaneous leishmaniasis in the Andean region of Colombia. Mem Inst Oswaldo Cruz, Rio de Janeiro, Vol. 111(7): 433-442, julio de 2016.spa
dc.rights.references[21] Gutiérrez, J., Martínez, R., Ramoni, J., Diaz, F., Gutiérrez, R., Ruiz, F., Botello, H., Gil, M., González, J. & Palencia, M. Environmental and socio-economic determinants associated with the occurrence of cutaneous leishmaniasis in the northeast of Colombia. Trans R Soc Trop Med Hyg 2018; 00: 1–8.spa
dc.rights.references[22] Yuexin, W., Nishiura, H, Yiming, Y. & M. Saitoh. Deep Learning for Epidemiological Predictions. Short Research Papers II. MI, USA, julio de 2018.spa
dc.rights.references[23] Zhao, N., Charland, K., Carabali, M., Nsoesie, E., Maher-Giroux, M., Rees, E., Yuan, M., Garcia C., Ramirez, G. & Zinszer, K. Machine learning and dengue forecasting: Comparing random forests and artificial neural 2 networks for predicting dengue burdens at the national sub-national scale in Colombia. BioRxiv, enero de 2020.spa
dc.rights.references[24] Fayyad, U. & Stolorz, P. Data mining and KDD: Promise and challenges. Future Generation Computer Systems. ELSEVIER, pp. 99-104, 1997spa
dc.rights.references[25] Shafique, U., & Qaiser, H. A Comparative Study of Data Mining Process Models (KDD, CRISP-DM and SEMMA). International Journal of Innovation and Scientific Research, Vol. 12 No. 1, pp. 217-22, noviembre de 2014.spa
dc.rights.references[26] Maimon, O. & Rokach, L. Data Mining and Knowledge Discovery Handbook. Springer-Verretraso New York, Inc., 2nd ed., febrero 2018.spa
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/spa
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadoresspa
dc.subject.decsLeishmaniasis, Cutaneouseng
dc.subject.decsLeishmaniasis Cutáneaspa
dc.subject.lembDigital computer simulationeng
dc.subject.lembSimulación por computadores digitalesspa
dc.subject.lembSimulation methodseng
dc.subject.lembMétodos de simulaciónspa
dc.subject.proposalModelo predictivo leishmaniasisspa
dc.subject.proposalCiencia de datosspa
dc.subject.proposalMachine learningeng
dc.subject.proposalInteligencia artificialspa
dc.subject.proposalPredictive modeleng
dc.subject.proposalLeishmaniasis cutáneaspa
dc.subject.proposalCutaneous leishmaniasiseng
dc.subject.proposalForecasting modeleng
dc.subject.proposalEpidemiologíaspa
dc.subject.proposalEpidemiologyeng
dc.subject.proposalData scienceeng
dc.subject.proposalArtificial intelligenceeng
dc.subject.proposalTime serieseng
dc.subject.proposalSeries de tiempospa
dc.titleModelo predictivo para la ocurrencia de leishmaniasis cutánea en Colombia, a partir de variables ambientales y socioeconómicasspa
dc.title.translatedPredictive model for the occurrence of cutaneous leishmaniasis in Colombia, based on environmental and socioeconomic variableseng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentEstudiantesspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentMaestrosspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1022385505.2021.pdf
Tamaño:
4.89 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería - Ingeniería de Sistemas y Computación

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.87 KB
Formato:
Item-specific license agreed upon to submission
Descripción: