Trabajo de grado - Maestría
Predicción del perfil de resistencia a antibióticos a partir de datos de secuenciación del genoma completo de aislamientos colombianos de Providencia rettgeri comprendidos en el período 2015 – 2016
Fecha
2021Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Tenorio Arévalo, María Caridad
Institución
Resumen
La resistencia a los antibióticos es considerada una de las amenazas más urgentes de la
salud pública mundial. Actualmente obtener resultados fenotípicos de esa resistencia por
los métodos convencionales basados en cultivos toma mucho tiempo. La secuenciación
de genoma completo (WGS) supera estas limitaciones ya que permite inferir el
comportamiento fenotípico mediante la identificación de elementos de resistencia a
antibióticos en el genoma en menor tiempo, sin embargo, aún no se ha conseguido una
predicción óptima de estos perfiles. Los métodos de Machine Learning facilitan esta
optimización, por lo tanto, el objetivo de este trabajo fue implementar un modelo de
predicción de resistencia a antibióticos utilizando métodos de Machine Learning a partir de
datos de WGS de 521 Enterobacterales que incluye 28 aislamientos colombianos de
Providencia rettgeri. Para la predicción se utilizaron tres métodos: a) Regresión Logística
(RL), b) Support Vector Machine (SVM) y c) Random Forest (RF) y tres métodos de
selección de características: 1) Eliminación recursiva de características (RFECV), 2)
regularización L1 y 3) Feature importance. Se desarrollaron modelos de predicción a 10
antibióticos, con una exactitud promedio del 88% (IC 95% ± 6) y exactitudes individuales
de 89% (IC 95% ± 7), 93% (IC 95% ± 5), 90% (IC 95% ± 7), 93% (IC 95% ± 6), 81% (IC
95% ± 12), 93% (IC 95% ± 8), 81% (IC 95% ± 10), 79% (IC 95% ± 9), 86% (IC 95% ± 9) y
93% (IC 95% ± 5) para amikacina, ciprofloxacina, trimetropim/sulfometoxazol, tetraciclina,
tigeciclina, colistina, ceftazidima, cefepime, imipenem y meropenem, respectivamente. Los
métodos que permitieron obtener estos desempeños corresponden a RL y SVM con los
métodos de selección de características RFECV y regularización L1. Estos hallazgos
señalan que los modelos construidos pueden predecir con exactitud elevada la resistencia
a antibióticos de diferentes especies de bacterias y apoya la idea de que pueden
convertirse en una herramienta potencial para el diagnóstico clínico. (Texto tomado de la fuente) Antibiotic resistance is considered one of the most urgent threats to global public health.
Due to the public health risk, there are several methods for obtained phenotypic results.
However, conventional methods take days or weeks. Whole-genome sequencing (WGS)
overcomes these limitations by estimating phenotypic behavior and identifying antibiotic
resistance elements in the genome in a faster way. However, information about the optimal
prediction of these profiles is still scarce. The project aim was to implement an antibiotic
resistance prediction model using Machine Learning methods, using WGS data of 521
Enterobacterales isolates, including 28 Providencia rettgeri isolates sequenced in
Colombia. The Machine Learning methods used were a) Logistic Regression (RL), b)
Support Vector Machine (SVM), and c) Random Forest (RF). Also, the following feature
selection methods were applied: 1) recursive feature elimination (RFECV), 2) L1
regularization, and 3) feature importance. Finally, prediction models were developed for 10
antibiotics, with a mean accuracy of 88% (IC 95% ± 6) and individual accuracies of 89%
(IC 95% ± 7), 93% (IC 95% ± 5), 90% (IC 95% ± 7), 93% (IC 95% ± 6), 81% (IC 95% ± 12),
93% (IC 95% ± 8) 81% (IC 95% ± 10), 79% (IC 95% ± 9), 86% (IC 95% ± 9) and 93% (IC
95% ± 5), for amikacin, ciprofloxacin, trimethoprim/sulfamethoxazole, tetracycline,
tigecycline, colistin, ceftazidime, cefepime, imipenem and meropenem respectively. These
performances correspond to RL and SVM, using RFECV and L1 as regularization feature
selection methods. These findings indicate that these models could accurately predict
antibiotic resistance from different Enterobacteriaceae species and could be a potential tool
for clinical diagnosis.