Modelamiento de casos de malaria en la región de Ashanti-Ghana usando regresión logística, Machine Learning y discriminante lineal de Fisher

dc.contributor.advisorSalazar Uribe, Juan Carlos
dc.contributor.authorMosquera Renteria, Javier
dc.contributor.cvlachttps://orcid.org/0009-0004-7105-461Xspa
dc.coverage.cityAshanti, Ghana
dc.date.accessioned2024-04-24T11:54:40Z
dc.date.available2024-04-24T11:54:40Z
dc.date.issued2024-04-19
dc.descriptionilustraciones, gráficosspa
dc.description.abstractA nivel mundial, se han logrado importantes avances en la reducción de casos de malaria; sin embargo, la enfermedad sigue siendo un problema desafiante en la salud pública de Ghana. Aproximadamente, entre el 40 y el 60% de las personas son hospitalizadas debido a esta enfermedad. A pesar de ello, el examen mediante el uso del microscopio sigue siendo el mejor método en todo el mundo para determinar si un paciente tiene o no el parásito de la malaria. Este estudio buscó determinar si los parámetros hematológicos, la edad y el género de los pacientes podrían usarse para predecir la malaria mediante el uso de modelos de regresión logística, naive Bayes, análisis discriminante lineal de Fisher y K vecinos más cercanos. Con estos modelos, que forman parte del aprendizaje automático, se buscó determinar en qué medida se podría estimar la probabilidad de que un paciente tenga o no la enfermedad de la malaria. Se evaluó qué tan buenas alternativas son estos modelos para estimar la probabilidad de tener la enfermedad. Utilizando R, se determinó la capacidad predictiva de los modelos considerados, así como la elección del mejor modelo según algún criterio estadístico, mediante el uso de datos reales. En este estudio, se observó que la prevalencia de casos de malaria fue del 25.95%, siendo los niños menores de 5 años los más afectados, alcanzando el 29.98% (206 de 687), seguidos por niños entre 5 y 14 años de edad, con un 45.30% (164 de 362). El mejor modelo de los cuatro se utilizará para mejorar el diagnóstico de la malaria en pacientes; en este caso, el mejor modelo por su interpretabilidad y mayor capacidad predictiva de casos de malaria fue la regresión logística, demostrando un área bajo la curva de 81.5%. La especificidad y sensibilidad fueron del 74.6% y 79.89%, respectivamente, con un valor predictivo positivo del 39.8% y un valor predictivo negativo del 94.6%. (Tomado de la fuente)spa
dc.description.abstractGlobally, significant progress has been made in reducing malaria cases; However, the disease remains a challenging public health problem in Ghana. Approximately, between 40 and 60% of people are hospitalized due to this disease. Despite this, examination using a microscope remains the best method worldwide to determine whether or not a patient has the malaria parasite. This study sought to determine whether hematological parameters, age, and gender of patients could be used to predict malaria by using logistic regression, naïve Bayes, Fisher's linear discriminant analysis, and K-nearest neighbors models. With these models, which are part of machine learning, we sought to determine to what extent the probability of a patient having or not having malaria disease could be estimated. It was evaluated how good alternatives these models are for estimating the probability of having the disease. Using R, the predictive capacity of the considered models was determined, as well as the choice of the best model according to some statistical criterion, through the use of real data. In this study, it was observed that the prevalence of malaria cases was 25.95%, with children under 5 years of age being the most affected, reaching 29.98% (206 of 687), followed by children between 5 and 14 years of age. age, with 45.30% (164 of 362). The best model of the four will be used to improve malaria diagnosis in patients; In this case, the best model due to its interpretability and greater predictive capacity for malaria cases was logistic regression, demonstrating an area under the curve of 81.5%. The specificity and sensitivity were 74.6% and 79.89%, respectively, with a positive predictive value of 39.8% and a negative predictive value of 94.6%.eng
dc.description.curricularareaEstadística.Sede Medellínspa
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias - Estadísticaspa
dc.format.extent75 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/85962
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellínspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeMedellín, Colombiaspa
dc.publisher.programMedellín - Ciencias - Maestría en Ciencias - Estadísticaspa
dc.relation.indexedLaReferenciaspa
dc.relation.referencesAdera, T. D. (2003). Beliefs and traditional treatment of malaria in Kishe settlement area, Southwest Etiopía. 41(1):25–34.spa
dc.relation.referencesAdusei, K. A. and Owusu-Ofori, A. (2018). Prevalence of plasmodium parasitaemia in blood donors and a survey of the knowledge, attitude and practices of transfusion malaria among health workers in a hospital in Kumasi, Ghana. Plos one, 13(11):1–13.spa
dc.relation.referencesAliyu, A. and Bada, A. B. (2023). Improved Malaria Outbreak Predictive Model Using Naive Baye and Artificial Neural Network. United International Journal for Research & Technology, 4(9):1–14.spa
dc.relation.referencesAliyu, A., Yau, S., and Aliyu, F. M. (2021). Predicting Malaria Using Logistic Regression Model. Ilorin Journal of Computer Science and Information Technology, 4(2):1–6.spa
dc.relation.referencesAnabire, N. G., Aculley, B., Pobee, A., Kyei-Baafour, E., Awandare, G. A., del Pilar Quintana, M., Hviid, L., and Ofori, M. F. (2023). High burden of asymptomatic malaria and anaemia despite high adherence to malaria control measures: a cross-sectional study among pregnant women across two seasons in a malaria-endemic setting in Ghana. National Library of Medicine, 51(1):1717–1729.spa
dc.relation.referencesAnkamah, S., Nokoe, K. S., and Iddrisu, W. A. (2018). Modelling Trends of climatic Variability and Malaria in Ghana Using Vector Autoregression. Malaria Research and Treatment, 2018(1):1–12.spa
dc.relation.referencesBowerman, B. L., Connell, R. T., and Koehler, A. B. (2009). Pronósticos, series de tiempo y regresión. Cengage Learning.spa
dc.relation.referencesDevi, S. S., Samantha, E., Priyadharshini, B., and Jetlin, C. P. (2021). Malaria Detection Using Machine Learning with k Nearest Neighbor Algorithm. International Journal of Scientific Development and Research, 6(3):1–4.spa
dc.relation.referencesDíaz, L. G., Morales, M. A., and León, L. R. (2018). Análisis estadístico de datos categóricos. Universidad Nacional de Colombia, Unibiblos.spa
dc.relation.referencesHume, J. C., Barnish, G., Mangal, T., Armázio, L., Streat, E., and Bates, I. (2008). Household cost of malaria overdiagnosis in rural Mozambique. Malaria Journal, 7(1):1–8.spa
dc.relation.referencesIrmanita, R., Prasetiyowati, S. S., and Sibaroni, Y. (2021). Classification of malaria complication using cart (classification and regression tree) and naive Bayes. Jurnal RESTI, 5(1):10–16.spa
dc.relation.referencesJames, G., Witten, D., Hastie, T., and Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R. Springer.spa
dc.relation.referencesJohnson, R. A. and Wichern, D. W. (2007). Applied Multivariate Statistical Analysis. Pearson.spa
dc.relation.referencesLandier, J., Parker, D. M., Thu, A. M., Carrara, V. I., Lwin, K. M., Bonnington, C. A., Pukrittayakamee, S., GillesDelmay, and Nosten, F. H. (2016). The role of early detection and treatment in malaria elimination. Malaria Journal, 15(1):1–8.spa
dc.relation.referencesLeslie, T., Mikhail, A., Mayan, I., Anwar, M., Sayed Bakhtash, M. N., Chandler, C., Whitty, C. J. M., and Rowland, M. (2012). Overdiagnosis and mistreatment of malaria among febrile patiens at primary healthcare level in Aghanistan: Observational Study. National Library of Medicine, 345(2012):1–13.spa
dc.relation.referencesMahmoudi, N., de Julián-Ortiz, J.-V., Ciceron, L., Gálvez, J., Mazier, D., Danis, M., Derouin, F., and García-Domenech, R. (2006). Identification of new antimalarial drugs by linear discriminant analysis and topological virtual screening. Journal of Antimicrobial Chemotherapy, 57(3):489—497.spa
dc.relation.referencesMilton, J. S. (2007). Estadística para Biología y Ciencias de la Salud. McGRAW Hill.spa
dc.relation.referencesMonroy, L. G. D. and Rivera, M. A. M. (2012). Análisis estadístico de datos multivariados. Coordinación de publicaciones, Facultad de Ciencias Diagramación en Latex.spa
dc.relation.referencesMontgomery, D. C., Peck, E. A., and Vining, G. G. (2012). Introduction to Linear Regression Analysis. Wiley.spa
dc.relation.referencesNkansah, C., Bani, S. B., Mensah, K., Appiah, S. K., Boakye, F. O., Abbam, G., Daud, S., Agyare, E. M., Agbadza, P. E., Derigubah, C. A., Serwaa, D., Apodola, F. A., Quansah, Y., Issah, R., Dindiok, S. Y., and Chukwurah, F. E. (2023). Serum anti-eryhropoietin antibodies among pregnant women with plasmodium falciparum malaria and anaemia: A case control study in northeren Ghana. Plos one, 18(3):1–20.spa
dc.relation.referencesNájera, J. A., Bueno, A. G., and Díaz, A. B. (2009). Malaria. Biblioteca nacional de España.spa
dc.relation.referencesOpoku-Ansah, J., Eghan, M. J., Anderson, B., Boampong, J. N., Edziah, R., Adueming, P. O.-W., and Amuah, C. L. Y. (2019). Optical Identification of Plasmodium falciparum Malarial Byproduct for Parasite Density Estimation. Hindawi, 2019(8782567):1–14.spa
dc.relation.referencesOverleaf (2023). Overleaf: LaTeX, Evolución. El editor de LaTeX fácil de usar, online y colaborativo, Londres, Reino Unido. URL https://es.overleaf.com/.spa
dc.relation.referencesPaintsil, E. K., Omari-Sasu, A. Y., Addo, M. G., and Boateng, M. A. (2019). Analysis of haematological parameters as predictors of malaria infection using a logistic regression model: A case study of a hospital in the Ashanti region of Ghana. Malaria Research and Treatment, 2019(1):1–7.spa
dc.relation.referencesPoostchi, M., Silamut, K., Maude, R. J., Jaeger, S., and Thoma, G. (2023). Image analysis and machine learning for detecting malaria. Translational Research, 194:36–55.spa
dc.relation.referencesQadri, A. M., Raza, A., Eid, F., and Abualigah, L. (2023). A novel transfer learningbased model for diagnosing malaria from parasitized and uninfected red blood cell images. Decision Analytics Journal, 9(100352):1–11.spa
dc.relation.referencesR Core Team (2023). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.spa
dc.relation.referencesRStudio Team (2023). RStudio: Integrated Development for R. RStudio, PBC, Boston, MA. URL http://www.rstudio.com/.spa
dc.relation.referencesSach, J. and Malaney, P. (2002). The economic and social burden of malaria. National Library of Medicine, 415(6872):680–5.spa
dc.relation.referencesSajana, T. and Narasingarao, M. R. (2018). Classification of Imbalanced Malaria Disease Using Naive Bayesian Algorithm. International Journal of Engineering & Technology, 7(2.7):786–790.spa
dc.relation.referencesSeyoum, T. F., Andualem, Z., and Yalew, H. F. (2023). Insecticide-treated bed net use and associated factors among households having under-five children in east África: a multilevel binary logistic regression analysis. Malaria Journal, 22(10):1–10.spa
dc.relation.referencesStephen, A., Akomolafe, P. O., and Ogundoyin, K. I. (2021). A Model for Predicting Malaria Outbreak Using Machine Learning Technique. Scientific Annals of Computer Science, 19(1):9–15.spa
dc.relation.referencesWackerly, D. D., Mendenhall, W., and Scheaffer, R. L. (2010). Mathematical statistics with applications. Cengage Learnig.spa
dc.relation.referencesWalpole, R. E., Myers, R. H., Myers, S. L., and Ye, K. (2012). Probability and statistics for engineering and science. Pearson.spa
dc.relation.referencesZuluaga, G. C. and Trujillo, S. B. (2010). Malaria: consideración sobre su diagnóstico. Programa de Educación Médica Continúa Certificada Universidad de Antioquia, Edimedico.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/spa
dc.subject.ddc610 - Medicina y salud::616 - Enfermedadesspa
dc.subject.ddc510 - Matemáticas::519 - Probabilidades y matemáticas aplicadasspa
dc.subject.lembMalaria
dc.subject.lembAnálisis de regresión logística
dc.subject.lembAprendizaje automático (Inteligencia emocional)
dc.subject.lembEnfermedades parasitarias
dc.subject.lembAnálisis discriminante
dc.subject.lembEstadística matemática
dc.subject.lembMalaria - Diagnóstico
dc.subject.proposalRegresión logísticaspa
dc.subject.proposalMachine Learningeng
dc.subject.proposaldiscriminante de Fisherspa
dc.subject.proposalmalariaspa
dc.subject.proposalAprendizaje automáticospa
dc.subject.proposalLogistic regressioneng
dc.subject.proposalFisher discriminanteng
dc.titleModelamiento de casos de malaria en la región de Ashanti-Ghana usando regresión logística, Machine Learning y discriminante lineal de Fisherspa
dc.title.translatedModeling of malaria cases in the Ashanti-Ghana region using logistic regression, Machine Learning, and Fisher’s linear discriminanteng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1078918140.2024.pdf
Tamaño:
2.18 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ciencias Estadística

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: