Automatic classification of 21 subtypes of blood cells

Cargando...
Miniatura

Document language:

Inglés

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Documentos PDF

Resumen

La evaluación citomorfológica de las células de la médula ósea desempeña un papel crucial en el diagnóstico de varios trastornos hematológicos, pero el proceso sigue siendo en gran medida manual, dependiendo de especialistas capacitados, lo que crea un cuello de botella en los flujos de trabajo clínicos. Aunque los algoritmos de aprendizaje profundo ofrecen una solución prometedora para la automatización, la mayoría de los modelos existentes se centran en un subconjunto limitado de tipos celulares asociados con enfermedades específicas y a menudo se tratan como sistemas de caja negra. Este estudio introduce una nueva representación de características diseñada, denominada "region-attention embedding", cuyo objetivo es mejorar la clasificación mediante aprendizaje profundo en 21 subtipos de células de médula ósea. La representación organiza las características citológicas en una matriz estructurada cuadrada basada en regiones pre-segmentadas de la célula: citoplasma, núcleo y célula completa, preservando así las relaciones espaciales y regionales. Cuando se integra con los modelos Xception y ResNet50, este enfoque resalta la relevancia específica de cada región en las imágenes, mejorando la interpretabilidad. El método fue evaluado en el conjunto de datos más grande disponible públicamente sobre subtipos de células de médula ósea, utilizando tres iteraciones de validación cruzada de 3 particiones en el 80% del conjunto de datos (n = 89.484) y pruebas en el 20% restante (n = 22.371). Los resultados indican que el método propuesto supera el rendimiento de los modelos existentes en conjuntos de validación comparables, alcanzando una puntuación F1 de 0,82, y demuestra un rendimiento sólido en el conjunto de prueba no visto con una puntuación F1 de 0,56. (Texto tomado de la fuente).

Abstract

Cytomorphological assessment of bone marrow cells plays a crucial role in diagnosing various hematologic disorders, but the process remains largely manual, relying on trained specialists, which creates a bottleneck in clinical workflows. While deep learning algorithms present a promising solution for automation, most existing models focus on a limited subset of cell types associated with specific diseases and are often treated as black-box systems. This study introduces a novel engineered feature representation, called region-attention embedding, aimed at improving deep learning classification across 21 bone marrow cell subtypes. The embedding organizes cytological features into a structured square matrix based on pre-segmented regions of the cell—cytoplasm, nucleus, and entire cell—thus preserving spatial and regional relationships. When integrated with the Xception and ResNet50 models, this approach highlights region-specific relevance in images, enhancing interpretability. The method was evaluated on the largest publicly available bone marrow cell subtype dataset, using three iterations of 3-fold cross-validation on 80% of the dataset (n = 89,484) and testing on a separate 20% (n = 22,371). The results indicate that the proposed method exceeds the performance of existing models on comparable validation sets, achieving an F1-score of 0.82, and demonstrates strong performance on the unseen test set with an F1-score of 0.56.

Descripción

ilustraciones, diagramas

Palabras clave

Citación