Modelamiento de casos de malaria en la región de Ashanti-Ghana usando regresión logística, Machine Learning y discriminante lineal de Fisher
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2024-04-19Metadata
Show full item recordSummary
A nivel mundial, se han logrado importantes avances en la reducción de casos de malaria; sin embargo, la enfermedad sigue siendo un problema desafiante en la salud pública de Ghana. Aproximadamente, entre el 40 y el 60% de las personas son hospitalizadas debido a esta enfermedad. A pesar de ello, el examen mediante el uso del microscopio sigue siendo el mejor método en todo el mundo para determinar si un paciente tiene o no el parásito de la malaria. Este estudio buscó determinar si los parámetros hematológicos, la edad y el género de los pacientes podrían usarse para predecir la malaria mediante el uso de modelos de regresión logística, naive Bayes, análisis discriminante lineal de Fisher y K vecinos más cercanos. Con estos modelos, que forman parte del aprendizaje automático, se buscó determinar en qué medida se podría estimar la probabilidad de que un paciente tenga o no la enfermedad de la malaria. Se evaluó qué tan buenas alternativas son estos modelos para estimar la probabilidad de tener la enfermedad. Utilizando R, se determinó la capacidad predictiva de los modelos considerados, así como la elección del mejor modelo según algún criterio estadístico, mediante el uso de datos reales. En este estudio, se observó que la prevalencia de casos de malaria fue del 25.95%, siendo los niños menores de 5 años los más afectados, alcanzando el 29.98% (206 de 687), seguidos por niños entre 5 y 14 años de edad, con un 45.30% (164 de 362). El mejor modelo de los cuatro se utilizará para mejorar el diagnóstico de la malaria en pacientes; en este caso, el mejor modelo por su interpretabilidad y mayor capacidad predictiva de casos de malaria fue la regresión logística, demostrando un área bajo la curva de 81.5%. La especificidad y sensibilidad fueron del 74.6% y 79.89%, respectivamente, con un valor predictivo positivo del 39.8% y un valor predictivo negativo del 94.6%. (Tomado de la fuente)Abstract
Globally, significant progress has been made in reducing malaria cases; However, the disease remains a challenging public health problem in Ghana. Approximately, between 40 and 60% of people are hospitalized due to this disease. Despite this, examination using a microscope remains the best method worldwide to determine whether or not a patient has the malaria parasite. This study sought to determine whether hematological parameters, age, and gender of patients could be used to predict malaria by using logistic regression, naïve Bayes, Fisher's linear discriminant analysis, and K-nearest neighbors models. With these models, which are part of machine learning, we sought to determine to what extent the probability of a patient having or not having malaria disease could be estimated. It was evaluated how good alternatives these models are for estimating the probability of having the disease. Using R, the predictive capacity of the considered models was determined, as well as the choice of the best model according to some statistical criterion, through the use of real data. In this study, it was observed that the prevalence of malaria cases was 25.95%, with children under 5 years of age being the most affected, reaching 29.98% (206 of 687), followed by children between 5 and 14 years of age. age, with 45.30% (164 of 362). The best model of the four will be used to improve malaria diagnosis in patients; In this case, the best model due to its interpretability and greater predictive capacity for malaria cases was logistic regression, demonstrating an area under the curve of 81.5%. The specificity and sensitivity were 74.6% and 79.89%, respectively, with a positive predictive value of 39.8% and a negative predictive value of 94.6%.Keywords
Physical description
ilustraciones, gráficos
Collections
