Predicción del perfil de resistencia a antibióticos a partir de datos de secuenciación del genoma completo de aislamientos colombianos de Providencia rettgeri comprendidos en el período 2015 – 2016
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2021Metadata
Show full item recordSummary
La resistencia a los antibióticos es considerada una de las amenazas más urgentes de la salud pública mundial. Actualmente obtener resultados fenotípicos de esa resistencia por los métodos convencionales basados en cultivos toma mucho tiempo. La secuenciación de genoma completo (WGS) supera estas limitaciones ya que permite inferir el comportamiento fenotípico mediante la identificación de elementos de resistencia a antibióticos en el genoma en menor tiempo, sin embargo, aún no se ha conseguido una predicción óptima de estos perfiles. Los métodos de Machine Learning facilitan esta optimización, por lo tanto, el objetivo de este trabajo fue implementar un modelo de predicción de resistencia a antibióticos utilizando métodos de Machine Learning a partir de datos de WGS de 521 Enterobacterales que incluye 28 aislamientos colombianos de Providencia rettgeri. Para la predicción se utilizaron tres métodos: a) Regresión Logística (RL), b) Support Vector Machine (SVM) y c) Random Forest (RF) y tres métodos de selección de características: 1) Eliminación recursiva de características (RFECV), 2) regularización L1 y 3) Feature importance. Se desarrollaron modelos de predicción a 10 antibióticos, con una exactitud promedio del 88% (IC 95% ± 6) y exactitudes individuales de 89% (IC 95% ± 7), 93% (IC 95% ± 5), 90% (IC 95% ± 7), 93% (IC 95% ± 6), 81% (IC 95% ± 12), 93% (IC 95% ± 8), 81% (IC 95% ± 10), 79% (IC 95% ± 9), 86% (IC 95% ± 9) y 93% (IC 95% ± 5) para amikacina, ciprofloxacina, trimetropim/sulfometoxazol, tetraciclina, tigeciclina, colistina, ceftazidima, cefepime, imipenem y meropenem, respectivamente. Los métodos que permitieron obtener estos desempeños corresponden a RL y SVM con los métodos de selección de características RFECV y regularización L1. Estos hallazgos señalan que los modelos construidos pueden predecir con exactitud elevada la resistencia a antibióticos de diferentes especies de bacterias y apoya la idea de que pueden convertirse en una herramienta potencial para el diagnóstico clínico. (Texto tomado de la fuente)Abstract
Antibiotic resistance is considered one of the most urgent threats to global public health. Due to the public health risk, there are several methods for obtained phenotypic results. However, conventional methods take days or weeks. Whole-genome sequencing (WGS) overcomes these limitations by estimating phenotypic behavior and identifying antibiotic resistance elements in the genome in a faster way. However, information about the optimal prediction of these profiles is still scarce. The project aim was to implement an antibiotic resistance prediction model using Machine Learning methods, using WGS data of 521 Enterobacterales isolates, including 28 Providencia rettgeri isolates sequenced in Colombia. The Machine Learning methods used were a) Logistic Regression (RL), b) Support Vector Machine (SVM), and c) Random Forest (RF). Also, the following feature selection methods were applied: 1) recursive feature elimination (RFECV), 2) L1 regularization, and 3) feature importance. Finally, prediction models were developed for 10 antibiotics, with a mean accuracy of 88% (IC 95% ± 6) and individual accuracies of 89% (IC 95% ± 7), 93% (IC 95% ± 5), 90% (IC 95% ± 7), 93% (IC 95% ± 6), 81% (IC 95% ± 12), 93% (IC 95% ± 8) 81% (IC 95% ± 10), 79% (IC 95% ± 9), 86% (IC 95% ± 9) and 93% (IC 95% ± 5), for amikacin, ciprofloxacin, trimethoprim/sulfamethoxazole, tetracycline, tigecycline, colistin, ceftazidime, cefepime, imipenem and meropenem respectively. These performances correspond to RL and SVM, using RFECV and L1 as regularization feature selection methods. These findings indicate that these models could accurately predict antibiotic resistance from different Enterobacteriaceae species and could be a potential tool for clinical diagnosis.Keywords
Physical description
ilustraciones, graficas, mapas
Collections
This work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit