Modelo de inteligencia artificial para realizar gap filling en ensambles de reads cortos de genomas de Acinetobacter baumannii
Cargando...
Autores
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Resumen
Las técnicas de secuenciación masiva de nueva generación (NGS) fueron revolucionarias en el campo de la genómica y en el proceso de secuenciación de genomas completos (WGS), debido a que permiten secuenciar un volumen de datos con gran profundidad, y a un costo asequible. Estos procedimientos implementan secuenciación masiva de reads cortos, que permiten la lectura en paralelo de todo el genoma. Pese la alta capacidad de lectura, los reads cortos son fragmentos pequeños de secuencias mucho más grandes. Por ello, las técnicas de ensamblaje son fundamentales en la extensión de contigs y orientación de scaffolds, para obtener genomas completos. No obstante, los ensambladores para secuenciación de reads cortos NGS presentan limitaciones técnicas y teóricas asociadas a las regiones repetitivas o de baja complejidad presentes en los genomas. Estas regiones limitan los cálculos de orientación entre scaffols, lo que genera huecos o gaps en los procesos de ensamblaje. Pese
a las limitantes del ensamblaje con reads cortos NGS, el numero proyectos de secuenciación y la disponibilidad de datos de WGS siguen en aumento debido a que es altamente costo efectivo. Uno de los organismos con gran crecimiento en el numero de proyectos de secuenciación es la bacteria multirresistente Acinetobacter baumannii. Debido a que es riesgo para la salud pública mundial dado a su capacidad para sobrevivir en ambientes hospitalarios y de generar infecciones graves. Con el fin de mejorar los procesos de calidad en los ensamblajes y aprovechar el gran número de datos de secuenciación se propone implementar metodologías de inteligencia artificial, para entrenar modelos capaces de cerrar huecos en los ensamblajes de novo de Acinetobacter baumannii, que implementen metodologías de reads cortos. (Texto tomado de la fuente)
Abstract
Next-generation sequencing (NGS) techniques were revolutionary in the field of genomics and in the whole-genome sequencing (WGS) process, because they allow for the sequencing of a large volume of data with great depth and at an affordable cost. These procedures implement massive sequencing of short reads, which allow for the parallel reading of the entire genome. Despite the high reading capacity, short reads are small fragments of much larger sequences. Therefore, assembly techniques are fundamental in the extension of contigs and the orientation of scaffolds to obtain complete genomes. However, assemblers for short-read NGS sequencing have technical and theoretical limitations associated with repetitive or low-complexity regions present in the genomes. These regions limit the calculations of orientation between scaffolds, generating gaps in the assembly processes. Despite the limitations of short read NGS assembly, the number of sequencing projects and the availability of WGS data continue to increase because it is highly cost-effective. One of the organisms with a significant increase in the number of sequencing projects is the multidrug-resistant bacterium Acinetobacter baumannii. This is because it poses a risk to global public health due to its ability to survive in hospital environments and cause serious infections. In order to improve quality processes in assemblies and take advantage of the large amount of sequencing data, it is proposed to implement artificial intelligence methodologies to train models capable of closing gaps in de novo Acinetobacter baumannii assemblies that implement short read methodologies.
Descripción
Ilustraciones, diagramas, gráficos

