Aprendizaje computacional para disminución de error en la detección y estadificación de malaria
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2024Metadata
Show full item recordSummary
El presente trabajo se centra en la aplicación de técnicas de aprendizaje computacional, específicamente k-means y YOLO, para reducir el error en la detección de malaria en imágenes de muestras cultivadas de sangre infectada con el parásito de la especie Plasmodium falciparum, obtenidas mediante el método de sangre extendida. El proceso incluye el uso de preprocesamiento de imágenes, la transformación al espacio colorimétrico CIELAB para la caracterización de las estructuras del parásito, y la generación de cuatro modelos YOLO entrenados con imágenes sRGB, CIELAB e imágenes aumentadas en función de los rangos de caracterización de los parásitos. La investigación implicó varios pasos clave: revisión de la literatura y colaboración con el Instituto Nacional de Salud para comprender las técnicas de toma de muestras y el proceso de tinción por sangre extendida, así como la recopilación y digitalización de 266 imágenes de muestras de sangre infectada con P. falciparum. Estas imágenes fueron segmentadas y organizadas en una base de datos pública en Kaggle, con un total de 3820 segmentos de glóbulos infectados etiquetados. Por medio de k-means, se caracterizaron las estructuras del P. falciparum, definiendo los rangos de cada eje CIELAB para cromatina y citoplasma, para luego crear un nuevo grupo de imágenes sRGB y CIELAB con color falso en función de los rangos calculados, denominados en esta investigación como imágenes sRGB+ y CIELAB+. Posteriormente, cuatro modelos YOLO fueron entrenados utilizando las imágenes sRGB, CIELAB, sRGB+ y CIELAB+. Los resultados mostraron un alto desempeño, con una precisión media promedio (mAP) de detección de hasta 96.2% (Box) y 96.4% (Mask) en los modelos entrenados con imágenes en sRGB. El modelo con mejor rendimiento diagnóstico fue el sRGB, con una sensibilidad del 96%, precisión del 97.4% y exactitud del 93.4%. Finalmente, respecto a la disminución del error, se compararon las métricas de rendimiento diagnóstico mínimas requeridas para los microscopistas junior con las obtenidas por los modelos, encontrando que los modelos las equiparan y superan con una sensibilidad del 90% frente al 96%, precisión del 95% frente al 98% y exactitud del 80% frente al 93% para microscopistas y modelos, respectivamente. (Texto tomado de la fuente).Abstract
The present work focuses on the application of computational learning techniques, specifically k-means and YOLO, to reduce the error in malaria detection in images of blood samples infected with the Plasmodium falciparum parasite, obtained through the thin blood smear method. The process includes the use of image preprocessing, transformation to the CIELAB color space for the characterization of the parasite's structures, and the generation of four YOLO models trained with sRGB, CIELAB, and augmented images based on the characterization ranges of the parasites. The research involved several key steps: a literature review and collaboration with the National Institute of Health to understand the sampling techniques and the thin blood smear staining process, as well as the collection and digitization of 266 images of blood samples infected with P. falciparum. These images were segmented and organized into a public database on Kaggle, with a total of 3,820 labeled segments of infected red blood cells. Through k-means, the structures of P. falciparum were characterized, defining the ranges of each CIELAB axis for chromatin and cytoplasm, and then creating a new set of sRGB and CIELAB images with false color based on the calculated ranges, referred to in this research as sRGB+ and CIELAB+ images. Subsequently, four YOLO models were trained using the sRGB, CIELAB, sRGB+, and CIELAB+ images. The results showed high performance, with an average precision (mAP) of up to 96.2% (Box) and 96.4% (Mask) in the models trained with sRGB images. The best-performing diagnostic model was sRGB, with a sensitivity of 96%, a precision of 97.4%, and an accuracy of 93.4%. Finally, regarding error reduction, the minimum diagnostic performance metrics required for junior microscopists were compared with those obtained by the models, finding that the models matched and exceeded them, with a sensitivity of 90% versus 96%, precision of 95% versus 98%, and accuracy of 80% versus 93% for microscopists and models, respectively.Keywords
Physical description
ilustraciones, diagramas, fotografías
Collections
