Publicación: Desarrollo de un modelo de aprendizaje automático para el diagnóstico temprano y estratificación de riesgo en leucemia linfoblástica aguda pediátrica
Portada
Citas bibliográficas
Código QR
Autores
Director
Fecha
Resumen en español
El cáncer infantil, en particular la leucemia linfoblástica aguda (LLA), evidencia una marcada inequidad en supervivencia entre países de altos y bajos ingresos, asociada a diagnósticos tardíos y limitaciones en infraestructura diagnóstica. Dadas las restricciones legales y operativas para acceder a bases de datos clínicas locales, este proyecto desarrolla un modelo de aprendizaje automático a partir de 3.256 imágenes de frotis de sangre periférica teñidas con Wright‑Giemsa del Hospital Taleghani (Irán), orientado a la identificación temprana de LLA pediátrica y la estratificación del riesgo en entornos con recursos limitados. Se aplicó un protocolo estandarizado de preprocesamiento que incluye redimensionamiento, normalización, segmentación con máscaras binarias tipo U‑Net y codificación one-hot, seguido del entrenamiento de una red neuronal convolucional con mecanismos de atención, optimizada mediante Adam y validada con partición 80‑10‑10 (entrenamiento, validación y prueba). El modelo alcanzó una exactitud del 99,69 %, alta sensibilidad y tiempos de inferencia cercanos a 0,83 segundos por imagen en hardware básico con apoyo de Google Colab, con curvas de aprendizaje estables y sin indicios de sobreajuste. Estos resultados respaldan el potencial de la CNN propuesta como herramienta complementaria para el diagnóstico temprano y la clasificación de subtipos de LLA pediátrica, particularmente en servicios de atención primaria con acceso restringido a técnicas avanzadas como la citometría de flujo.
Resumen en inglés
Childhood Cancer, particularly acute lymphoblastic leukemia (ALL), shows marked survival inequity between high and low income countries, driven by late diagnoses and limited diagnostic infrastructure. Due to legal and operational barriers to accessing local clinical databases, this study developed a machine learning model using 3,256 Wright-Giemsa stained peripheral blood smear images from Taleghani Hospital (Iran),aimed at early detection of pediatric ALL and risk stratification in resource-constrained settings. A standardized preprocessing pipeline was used, including resizing, normalization, segmentation with U-Net binary mask, and one hot encoding followed by training a convolutional neural network with attention mechanisms, optimized with Adam, validated using an 80-10-10 split, the model reached 99.69% accuracy and high sensitivity, with inference time around 0.83 seconds per image on basic hardware supported by Google colab. Learning curves were stable with no overfitting. These findings indicate the proposed CNN's potential as a complementary tool for early diagnosis and subtype classification of pediatric ALL, especially in primary care settings where advanced methods like flow cytometry are unavailable.

PDF
FLIP 
