Método para identificar y caracterizar variantes del SARS-CoV-2 mediante algoritmos de aprendizaje de máquinas y simulaciones moleculares

Cargando...
Miniatura

Document language:

Español

Título de la revista

ISSN de la revista

Título del volumen

Resumen

La vigilancia genómica del SARS-CoV-2 ha permitido la identificación de variantes de interés y de preocupación a nivel mundial, relevantes para el manejo de salud pública, el mejoramiento de pruebas de diagnóstico y el diseño de las vacunas. Aproximadamente 16 millones de secuencias del virus han sido reportadas a la fecha, un número de instancias varios ordenes de magnitud superior a las decenas de miles de secuencias que han podido ser analizadas con árboles filogenéticos usando estrategias de paralelización computacional. El aprendizaje automático constituye una alternativa para el procesamiento de grandes conjuntos de datos y la identificación de patrones en el genoma viral, características que pueden ser aprovechadas para la identificación de variantes y el reconocimiento de linajes emergentes. En el presente trabajo se construyó una herramienta para la identificación de variantes del SARS-CoV-2 a partir de la obtención y procesamiento automático de secuencias del virus, transformaciones numéricas de los datos y aprendizaje no supervisado. Además, se incorporaron herramientas bioinformáticas para el modelado y la caracterización de proteínas codificadas por los genomas representativos de los linajes identificados. (Tomado de la fuente)

Abstract

Descripción

Ilustraciones, gráficos

Palabras clave

Citación