Predicción del perfil de resistencia a partir de las secuencias del genoma de aislamientos colombianos de Acinetobacter baumannii
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2021-04Resumen
La creciente resistencia a los antibióticos y las pocas alternativas terapéuticas disponibles vuelven una urgencia la necesidad de optimizar los diagnósticos actuales que nos permitan prescripciones más rápidas y efectivas. Últimamente uno de los enfoques para predecir resistencia a partir de los datos de secuenciación de genoma consta en aplicar modelos basados en aprendizaje de máquina, los cuales han ido tomando credibilidad debido a la capacidad de realizar predicciones precisas. Además, gracias al creciente conocimiento acerca de mecanismos de resistencia asociados a A. baumannii, este patógeno nos brinda una alternativa para desarrollar estos modelos. En este trabajo se utilizaron 343 genomas, 76 colombianos del Instituto Nacional de Salud y 267 recolectados de la base de datos Biosample NCBI, para la obtención de modelos basados en aprendizaje de máquina empleando regresión lasso, random forest y gradient boosting, para predecir la concentración mínima inhibitoria de 10 antibióticos. Random forest fue el algoritmo que mostró los mejores resultados, logrando una precisión promedio dentro de +/- una dilución doble de 91% (I.C 95, 85- 97), una tasa de very major error y major error de 1,71% y 0,7%, respectivamente. Como datos de entrada para los modelos se utilizaron genes de resistencia, los cuales fueron identificados utilizando el software Resistance Gene Identifier. Estos resultados demuestran que la predicción de la susceptibilidad de A. baumannii a los antibióticos, basada en la secuencia del genoma son prometedoras como posibles herramienta de diagnóstico en la clínica. (Texto tomado de la fuente).Abstract
The increasing resistance to antibiotics and the few therapeutic choices available turns into an urgency the need to optimize the current diagnoses that allow faster and more efficient prescriptions. Lately, an approach to predict resistance from genome sequencing data applies machine learning models, which has taken credibility due to its capability to make reliable predictions. Further, thanks to the increasing knowledge about resistance mechanisms associated with A. baumannii, there is enough accessible data for developing these models. We used 343 genomes, 76 from the Colombian National Institute of Health, and 267 gathered from the Biosample NCBI database. We created models based on machine learning using lasso regression, random forest, and gradient boosting, to predict the minimum inhibitory concentration of 10 antibiotics. Random forest was the algorithm that show is better results, achieving an average accuracy within +/- a double dilution of 91% (I.C 95, 85- 97), a very major error, and a major error rate of 1.71% and 0.7% respectively. We employ known resistance genes as the model input, which were identified using the Resistance Gene Identifier software. These results show that the A. baumannii antibiotics susceptibility prediction, based on genome sequence, is promising as a possible diagnostic tool in the clinic.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, gráficas, tablas
Colecciones
![Atribución-SinDerivadas 4.0 Internacional](/themes/Mirage2//images/creativecommons/cc-generic.png)