Maestría en Bioinformática
URI permanente para esta colecciónhttps://repositorio.unal.edu.co/handle/unal/82242
Examinar
Envíos recientes
Item type: Ítem , Estrategia bioinformática para el análisis taxonómico y funcional de la microbiota subgingival de pacientes colombianos con periodontitis(Universidad Nacional de Colombia, 2025) Neuta Poveda, Yineth; Barreto Hernández , Emiliano; 0000-0001-9350-0941El análisis de datos a partir de genes marcadores se ha centrado en estrategias bioinformáticas que agrupan diversas herramientas desarrolladas en los últimos años, incluyendo múltiples pasos. Esas estrategias se han utilizado para analizar la microbiota de la cavidad oral a partir de datos genómicos basados en marcadores como el gen 16S rRNA, sin embargo, existen pocos estudios que evalúen la microbiota oral en pacientes colombianos con periodontitis, de acuerdo con la última clasificación de la enfermedad, por lo que el objetivo del presente trabajo fue implementar la estrategia bioinformática más adecuada para el análisis taxonómico y funcional de datos metagenómicos del gen 16s rRNA, obtenidos a partir de muestras de placa subgingival de pacientes colombianos con periodontitis. Se determino realizar el análisis con QIIME2, que se caracteriza por ser de código abierto y en el cual se pueden realizar análisis a partir de datos de secuencias de amplicones incluyendo en su análisis demultiplexación y filtrado de calidad, asignación taxonómica por ASV, y reconstrucción filogenética, utilizando en complemento DADA 2. Adicionalmente se realizó predicción de la función con PICRUST2, a partir de los ASV identificados. Se concluyo que QIIME 2 es un framework que permite realizar análisis múltiples, lo que confirma su uso para análisis de comunidades microbianas, así mismo en la clasificación, el uso de base de datos especializadas como HOMD para evaluar la microbiota oral, permite focalizar los resultados al ambiente determinado, logrando una clasificación hasta el nivel de especie, evidenciaron microorganismos específicos más frecuentes asociados con periodontitis tales como Filifactor alocis, Fretibacterium, Eubacterium nodatum group, Eubacterium saphenum, Eubacterium brachy, Dialister invisus, Porphyromonas gingivalis, Desulfubulbus, Selenomonas, Sneathia, Treponema, Tannerella forythia y Parvimonas. El análisis con PICRUST2 permitió observar vías metabólicas que se asociaron principalmente con los grupos de periodontitis, lo que podría sugerir una alta actividad metabólica de los microorganismos asociados con esta condición clínica. (Texto tomado de la fuente)Item type: Ítem , Reconstrucción de la red del metabolismo de las antocianinas y procesos asociados en papa(Universidad Nacional de Colombia, 2025-08-18) Arias Zambrano, Andrés David; Liliana López, Kleine; Roda Fornaguera, Federico; Chaib De Mares, Maryam; Silva Arias, Gustavo Adolfo; Grupo de Investigación en Bioinformática y Biología de SistemasLas variedades de papa pigmentadas son una fuente rica de antocianinas, las cuales despiertan gran interés por sus propiedades nutricionales y cosméticas, y su importancia en procesos de defensa de la planta contra diversos tipos de estrés. Aunque la ruta de biosı́ntesis de antocianinas se encuentra bien descrita y se conocen los genes estructurales que participan en esta, aún se desconocen múltiples procesos regulatorios y los genes implicados en estos. Algunos estudios de redes de co-expresión se han dirigido con el fin de ampliar el conocimiento que se tiene a este respecto, aunque con un limitado número de variedades de papa. En el presente trabajo de tesis se empleó una aproxi- mación pangenómica con el fin de reconstruir la red de co-expresión génica de la biosı́ntesis en papa empleando 37 variedades de origen colombiano, re- sultando en la identificación de una serie de genes de potencial importancia en la regulación de este y otros procesos asociados. (Texto tomado de la fuente).Item type: Ítem , Evaluación de la influencia de un grupo de metabolitos característicos de individuos con Parkinson en la función astrocítica humana mediante modelado computacional(Universidad Nacional de Colombia, 2025-07-15) Rojo Orozco, María Alejandra; Pinzón Velasco, Andrés Mauricio; Arboleda Bustos, Gonzalo Humberto; Grupo de Investigación en Bioinformática y Biología de SistemasEl Parkinson (EP) es una enfermedad neurodegenerativa multifactorial y poligénica, caracterizada por la acumulación de proteínas mal plegadas, como la α-sinucleína, y la pérdida de neuronas dopaminérgicas en la sustancia negra. Además, su complejidad biológica y genética aún no se comprende del todo, lo que la convierte en una de las enfermedades neurodegenerativas más prevalentes y costosas a nivel mundial. En este sentido, estudios recientes destacan el papel crucial de las células gliales, en particular los astrocitos, en enfermedades neurodegenerativas, debido a su rol en el soporte neuronal, el reciclaje de neurotransmisores, la homeostasis metabólica y la protección de la barrera hematoencefálica (BHE). Adicionalmente, también se ha evidenciado la implicación del microbioma intestinal en estos procesos mediante el eje intestino-cerebro (Gut-Brain Axis, GBA). En este contexto, el presente trabajo evalúa los efectos de metabolitos desregulados, como triptófano, indol, fructosa, ácido mirístico y ácido fenilacético, identificados en modelos computacionales del microbioma de pacientes con EP, y su impacto sobre un modelo computacional de astrocitos humanos, mediante COBRApy y análisis de balance de flujo (FBA). Se evaluaron escenarios con diferentes restricciones metabólicas, que revelaron alteraciones en rutas asociadas al metabolismo de aminoácidos esenciales y al metabolismo energético. En particular, la restricción de triptófano indujo reconfiguraciones en rutas mitocondriales, de transporte y posibles ajustes en el estado redox celular. La activación de la vía de la quinurenina (KYN) mostró un efecto compensatorio parcial al preservar flujos clave y modular rutas críticas en ausencia de triptófano. Además, se identificaron posibles cambios en la β-oxidación de lípidos, la síntesis de esteroides y el transporte lisosomal, junto con variaciones en reacciones clave P450SCC1m, NDPK6, ASPTAm y Ex_fru. Estos hallazgos subrayan el impacto potencial de metabolitos intestinales en la función astrocítica y su posible vínculo con la progresión de la EP, abriendo oportunidades para hipótesis testables y el refinamiento de modelos computacionales gliales. (Texto tomado de la fuente).Item type: Ítem , Caracterización genómica de un grupo de individuos con Deterioro Cognitivo Leve (DCL) en población del Atlántico, Colombia(Universidad Nacional de Colombia, 2025) Largo González, Johan Hernando; Pinzón Velasco, Andrés Mauricio; Arboleda Bustos, Carlos Eduardo; Largo Gonzalez, Johan Hernando [0000149121]; Largo Gonzalez, Johan Hernando [0000000247872960]; Largo Gonzalez, Johan Hernando [Johan-Largo-Gonzalez]; Grupo de Investigación en Bioinformática y Biología de SistemasEl deterioro cognitivo leve (DCL) es una etapa temprana de la enfermedad de Alzheimer (EA), caracterizada por una disminución en la cognición sin llegar a ser demencia. Factores genéticos influyen en su desarrollo, y se han identificado variantes asociadas a su progresión, destacando el alelo APOE-ϵ4 como un marcador clave en la transición de DCL a EA. La prevalencia de DCL varía entre 5,0% y 36,7% a nivel mundial, mientras que en Colombia afecta al 17,5% de la población, con mayor incidencia en la región del Atlántico. A pesar de las herramientas diagnósticas actuales, es necesario un enfoque multiómico para una comprensión más profunda de la enfermedad. Los avances en secuenciación de nueva generación (NGS) permiten identificar factores genéticos clave en enfermedades neurodegenerativas, facilitando el desarrollo de estrategias preventivas y terapéuticas. En este contexto, surge la oportunidad de realizar un estudio de asociación y caracterización genómica en pacientes con DCL y controles de la población del Atlántico, Colombia, con el objetivo de profundizar en los mecanismos genéticos involucrados en esta región, que presenta una alta prevalencia de enfermedades neurodegenerativas (Texto tomado de la fuente).Item type: Ítem , Método de Aprendizaje de Máquina para la subclasificación del Cáncer de Mama Triple Negativo(Universidad Nacional de Colombia, 2024) Padilla Fino, David Santiago; Niño Vasquez, Luis Fernando; Parra Lopez, Carlos Alberto; 0002020596; Inmunología y Medicina Traslacional (IM&T); Laboratorio de Investigación en Sistemas Inteligentes (LISI)El cáncer de mama triple negativo es el subtipo de cáncer mama con peor pronóstico clínico. Esta característica se ha asociado a la dificultad de desarrollar tratamientos específicos, debido a su elevada diversidad molecular. Aunque se han realizado múltiples esfuerzos de clasificación, estos no han logrado proporcionar una solución efectiva para diseñar terapias más dirigidas. No obstante, en los últimos años, los avances en el uso de herramientas como la transcriptómica y el aprendizaje de máquinas han abierto nuevas posibilidades para abordar este desafío. En este trabajo, se emplearon datos de secuenciación del transcriptoma junto con técnicas de aprendizaje de máquinas para optimizar y generar una nueva clasificación del cáncer de mama triple negativo, resaltando su relevancia tanto desde el punto de vista clínico como biológico (Texto tomado de la fuente)Item type: Ítem , Construcción de una red de regulación génica en respuesta a la polución ambiental a partir de la integración de datos ómicos e identificación de potenciales biomarcadores relacionados(Universidad Nacional de Colombia, 2024) Infante Hurtado, Byron Alexis; Lopez Kleine, Liliana; Garcia Arteaga, Juan David; Infante Hurtado, Byron Alexis [0000085303]; Infante Hurtado, Byron Alexis [wl9emw0AAAAJ&hl]; Infante Hurtado, Byron Alexis [0000-0002-0058-2085]; Infante Hurtado, Byron Alexis [Byron-Infante]; Grupo de Investigación en Bioinformática y Biología de SistemasLa Organización Mundial de Salud reportó en el 2021 que la contaminación del aire es uno de los mayores riesgos para la salud, principalmente debido a la exposición al material particulado fino (PM2.5). Este tipo de contaminante se asocia con enfermedades pulmonares y millones de muertes prematuras. En Bogotá, en los últimos años se han registrado picos de concentración de PM2.5 peligrosos para la salud. En el presente trabajo se evalúan los efectos de la exposición a PM2.5 sobre la regulación génica. La metodología utilizada consistió en: 1) Análisis de unión diferencial en datos de ChIP-seq, 2) Análisis de expresión diferencial en datos de RNA-seq y 3) Construcción y análisis de redes de regulación. Además, se utilizó un enfoque novedoso en la construcción de redes de regulación a partir de datos de ChIP-seq. Con la información obtenida se lograron identificar posibles metafirmas de genes y biomarcadores transcripcionales y epigenéticos, además de evidenciar el potencial de la metodología utilizada. Este trabajo de investigación es pionero en Colombia tanto por la integración de datos de diferente índole como por su contribución al entendimiento del impacto de la contaminación del aire, un problema cada vez más frecuente de las activades humanas (Texto tomado de la fuente).Item type: Ítem , Modelo de epistasis basado en aprendizaje automático para pacientes con discapacidad intelectual y retraso del neurodesarrollo(Universidad Nacional de Colombia, 2024-04-29) Murcia Triviño, Jossie Esteban; Niño Vásquez, Luis Fernando; López Rivera, Juan Javier; laboratorio de Investigación en Sistemas Inteligentes LisiLos estudios de asociación como epistasis representan un factor importante en la comprensión de la expresión de enfermedades complejas, como lo son los trastornos del neurodesarrollo (TND), que presentan un desafío en el entendimiento de su etiología. Aunque varios estudios han revelado diferentes hallazgos de mutaciones, los efectos de asociación entre polimorfismos de un solo nucleótido (SNP) siguen siendo desconocidos. La reducción de dimensionalidad multifactorial (MDR) es un método de minería de datos por inducción constructiva empleado para detectar interacciones complejas. Este estudio comprendió una cohorte retrospectiva de pacientes pediátricos con prueba de exoma trio por sospecha de alteraciones genéticas para TND. Después de los controles de calidad sobre genotipos, se desarrolló el método MDR bajo la Prueba de desequilibrio de pedigrí (MDR-PDT). Además, se identificaron variantes asociadas individualmente con la enfermad a partir de la prueba de desequilibrio de transmisión (TDT). Se encontró que la variante rs6843524 (SEC24D) significativa por TDT (valor-P=0.003135) evidenció asociaciones con SNP; rs6843524-rs895952 (MDR-PDT valor-P=0.0084) y rs6843524-rs1168666 (MDR-PDT valor-P=0.0079). Aunque las variantes rs1168666 (SETD1B) y rs4974081 (QRICH1) no fueron significativas en MDR, si se identificaron en varios modelos y sus genes destacaron en el análisis de enriquecimiento (FDR 1.11e-05 y 6.55e-05). A pesar de la baja significancia de los modelos MDR-PDT, se lograron validar asociaciones importantes por medio de las otras pruebas y la interpretación biológica. Estos modelos pueden ser muy útiles en el descubrimiento de nuevas variantes, especialmente cuando son desarrollados sobre poblaciones grandes y con un análisis completo desde la secuenciación. (Texto tomado de la fuente).Item type: Ítem , Modelo de aprendizaje automático de integración de datos genómicos, epigenómicos, transcriptómicos y clínicos provenientes de estudios de cáncer de endometrio y de cáncer de mama(Universidad Nacional de Colombia, 2023-11-03) Eyrolle-Cellier, Samuel; Niño Vásquez, Luis Fernando; laboratorio de Investigación en Sistemas Inteligentes LisiEl cáncer de mama y el cáncer de endometrio son enfermedades complejas que presentan mucha heterogeneidad a nivel molecular e histológico. Ciertos pacientes de estos dos tipos de cáncer comparten tanto mecanismos moleculares y celulares, como factores causales, como lo es el hiperestrogenismo. Este proyecto de investigación buscó identificar biomarcadores tumorales compartidos entre ambas enfermedades. 565 pacientes con cáncer de mama y 348 con cáncer de endometrio de la plataforma The Cancer Genome Atlas fueron seleccionados según sus características histológicas, hormonales e inmunológicas. Sus datos ómicos fueron analizados de manera separada e integrada mediante el uso del algoritmo de aprendizaje multi-vista Deep Generalized Canonical Correlation Analysis y del método de reducción de dimensionalidad Uniform Manifold Approximation and Projection. Se extrajeron biomarcadores de cada grupo (cluster) a través del cálculo del puntaje de información mutua entre las variables iniciales y las variables sintéticas UMAP1 y UMAP2. El análisis de los biomarcadores reveló que varios de estos genes tienen un rol en la proliferación celular, la apoptosis y la angiogénesis. Así mismo, el análisis reveló que la ausencia de metilación en las regiones promotoras de CLTC, importante en la organización del huso mitótico, y SON, involucrado en el empalme del ARN, es una característica compartida entre muchos pacientes de la cohorte. Por otro lado, FBXO11 y PTPN11 se caracterizan por niveles altos de expresión génica en ambos tipos de cáncer. FBXO11 codifica para una ubiquitina ligasa necesaria para la degradación proteica; mientras que PTPN11 codifica para una tirosina fosfatasa que actúa en la transducción de señales mediante una regulación positiva de la vía de señalización RAS/RAF/MAPK. En conclusión, la estrategia de integración multi-ómica permitió descubrir biomarcadores que no aparecen en el análisis de datos ómicos de un solo tipo. Se inscribe como una prueba de concepto de integración de distintos tipos de datos provenientes de diferentes contextos patológicos en el campo de la oncología. (Texto tomado de la fuente).Item type: Ítem , Modelo in-silico para la predicción de péptidos con restricción HLA-l candidatos a vacuna en SARS-CoV-2(Universidad Nacional de Colombia, 2023-08-01) Hernandez Nieto, Holman Alexander; Niño Vásquez, Luis Fernando; Parra López, Carlos Alberto; laboratorio de Investigación en Sistemas Inteligentes Lisi; Inmunología y Medicina TraslacionalEn este trabajo se resalta la importancia de las herramientas computacionales en el diseño de vacunas contra el SARS-CoV-2, virus que desde su descubrimiento en Wuhan China en diciembre de 2019, entre los años 2020 y 2022, generó una pandemia a nivel mundial que causó cerca de siete millones de muertes y cerca de ochocientos millones de casos. El SARS-CoV-2 pertenece a la familia Coronaviridae y consta de múltiples proteínas, siendo la proteína de espícula (S) importante motivo de estudio para el desarrollo de vacunas. Las células presentadoras desempeñan un papel vital en este proceso, ya que son responsables de procesar y presentar los antígenos a las células T, lo cual desencadena la activación y regulación de la respuesta inmunitaria adaptativa mediada por las células T. Este mecanismo de presentación de antígenos es esencial para el funcionamiento adecuado del sistema inmunológico contra patógenos y el cáncer. En este trabajo, tiene que ver con los procesos de procesamiento y presentación de antígenos en la superficie de células presentadoras de antígeno en el contexto de moléculas del MHC clase I o II necesario para su reconocimiento por parte de los Receptores para el Antígenos de las Células T (TCR) requisito fundamental para la generación de una respuesta inmune eficaz de las células T contra el antígeno. Se destaca la imperiosa necesidad de impulsar constantemente el desarrollo y mejora de herramientas bioinformáticas con el objetivo de identificar el universo de péptidos que se unen de manera altamente estable a las moléculas MHC I y II, como herramienta útil para para el rápido diseño de nuevas vacunas contra patógenos emergentes como el SARS-CoV-2. En este contexto es necesario avanzar en el refinamiento de herramientas bioinformáticas en la identificación de fragmentos de proteínas de los patógenos que presentados en moléculas MHC, estimulan eficientemente a los linfocitos T, resulta de vital importancia para el ámbito clínico, ya que estas tienen un impacto significativo en la 7 rápida identificación de fragmentos procesados de los patógenos o de los tumores importante para el diseño de nuevas vacunas. El avance de las ciencias ómicas y métodos de secuenciación de última generación, han permitido no solo un análisis más detallado y completo de la información genética y proteómica relacionada con los péptidos y el MHC sino mejorar el desempeño de herramientas bioinformáticas para la predicción de epítopos inmunogénicos (fragmentos de los patógenos o de los tumores presentados en moléculas MHC eficientemente reconocidos por los linfocitos T). Esto, a su vez, facilita la identificación de antígenos específicos presentados por el MHC, lo que es fundamental para comprender cómo el sistema inmunológico detecta y responde a distintos tipos de amenaza, como lo son las infecciones el cáncer y las enfermedades autoinmunes. El perfeccionamiento continuo de las herramientas bioinformáticas para seleccionar de forma más precisas posibles antígenos útiles como vacuna, fortalece la posibilidad de diseñar vacunas sintéticas basadas en péptidos que por su inmunogenicidad y simplicidad de producción son una importante alternativa para el diseño racional de vacunas contra patógenos emergentes. La identificación de péptidos presentados eficientemente por moléculas MHC va a contribuir al desarrollo de nuevas vacunas más efectivas y a refinar estrategias de inmunoterapia dirigidas contra el cáncer, agentes infecciosos, y enfermedades autoinmunes, estrategias en las que los linfocitos T juegan un papel fundamental. En este trabajo, haciendo uso de herramientas de predicción se desarrolló un pipeline bioinformático para la predicción de epítopos candidatos a vacuna contra el SARS-CoV-2 teniendo en cuenta las moléculas MHC-I expresadas por la población colombiana. Cuando se comparó la inmunogenicidad para el sistema inmune de pacientes con SARS-CoV-2 del universo de péptidos identificados en el proteoma del virus utilizando la herramienta diseñada, con la inmunogenicidad de estos péptidos reportados en la literatura científica por otros autores revela que los péptidos predichos por nosotros merecen ser considerados como nuevos candidatos a vacuna contra el SARS-CoV-2 para ser utilizada en la población colombiana. (Texto tomado de la fuente)Item type: Ítem , Pipeline bioinformático para el seguimiento epidemiológico de bacterias multirresistentes dentro de un hospital a partir de genoma completo y datos clínicos(Universidad Nacional de Colombia, 2023) Prada Padilla, Sebastian; Barreto Hernández, Emiliano; Bioinformática del Instituto de Biotecnología de la Universidad Nacional de ColombiaLa resistencia a los antimicrobianos es una amenaza de salud pública reconocida a nivel mundial y cobra especial atención en entidades hospitalarias, donde se presentas brotes infecciosos problemáticos por la resistencia de las bacterias y las condiciones de salud de los pacientes, por ello, las entidades hospitalarias implementan medidas de seguimiento epidemiológico para el control y prevención de la propagación de dichas infecciones. En los últimos años los investigadores han optado por incluir información genómica a los estudios epidemiológicos obteniendo resultados más precisos que aportan y podrían mejorar el control de estas infecciones en los hospitales. El objetivo de este trabajo fue diseñar e implementar un pipeline que integre datos clínicos y genómicos para el seguimiento de bacterias dentro de un hospital. Primero se hizo un análisis de requerimientos para determinar los métodos y herramientas bioinformáticas necesarias para el seguimiento con ambos tipos de datos, luego, se diseñó e implementó el pipeline basado en el sistema SGIG, una aplicación web para para la identificación, tipificación y seguimiento de la resistencia a antibióticos desarrolla por el grupo de investigación Bioinformática del Instituto de Biotecnología de la Universidad Nacional de Colombia; y por último, se evaluó la implementación del pipeline en el sistema SGIG con un conjunto de datos clínicos y genómicos provenientes de un hospital. Como resultado el SGIG ahora cuenta con el módulo: Reporte de epidemiologia de precisión, el cual genera un árbol de máxima verosimilitud basado en los SNPs del core genome y relaciona el árbol con una línea de tiempo que representa las estancias de los pacientes en los diferentes sitios del hospital. Este análisis permite hacer un seguimiento epidemiológico más preciso dentro del hospital que mejora el control de las infecciones bacterianas. (Texto tomado de la fuente)Item type: Ítem , Modelo basado en técnicas de machine learning para la clasificación de virus de ARN(2023) Colmenares Celis, Carolina; Bermúdez Santana, Clara Isabel; Niño Vásquez, Luis Fernando; Rnomica Teórica y Computacional; laboratorio de Investigación en Sistemas Inteligentes LisiLos virus son las entidades biológicas más abundantes de la Tierra, pero detectarlos, aislarlos y clasificarlos ha sido todo un reto para la ciencia. Los virus de ARN patógenos causan numerosas muertes humanas, especialmente los implicados en la transmisión de enfermedades zoonóticas, lo que conduce a emergencias víricas y pandemias globales como la asociada al SARS-CoV-2. En este estudio, se explora y describen representaciones teóricas como la de árbol extendido, HIT y árbol de grano grueso para virus de ARN, basados en niveles de secuencia y estructura. Estas representaciones se utilizaron para determinar cuál de ellas demuestra un mejor potencial como entradas para un modelo de clasificación basado en técnicas de aprendizaje de máquina. Para el diseño del modelo, se investigaron algoritmos de perceptrón multicapa, árboles de sufijos, modelos ocultos de Markov (HMM) y redes neuronales convolucionales con memoria de corto y largo plazo (CNN-LSTM). La aplicación de estos algoritmos se llevó a cabo utilizando dos conjuntos de datos. Los datos de entrenamiento consistieron en secuencias de familias de virus ARN, incluyendo Orthomyxoviridae, Sedoreoviridae, Spinareoviridae, Retroviridae y Arteriviridae, obtenidas de la base de datos del Centro Nacional para la Información Biotecnológica (NCBI). Los datos de prueba están comprendidos de metaviromas recolectados durante la "Expedición Biológica en Ecosistemas Representativos de Colombia: Bosque húmedo tropical de la Sierra Nevada de Santa Marta", un proyecto financiado por Colciencias en colaboración con el grupo de investigación teórica y computacional RNomica de la Universidad Nacional de Colombia. Ambos conjuntos de datos se transformaron en las representaciones estructurales mencionadas utilizando el paquete ViennaRNA. La representación HIT mostró las mejores características para la extracción, y los modelos basados en HMMs y CNN-LSTM demostraron un rendimiento superior y potencial para clasificar metagenomas de virus ARN. (Texto tomado de la fuente)Item type: Ítem , Evaluación de herramientas bioinformáticas útiles en la tipificación de Klebsiella pneumoniae y Pseudomonas aeruginosa a partir de datos de secuenciación de genomas completos(Universidad Nacional de Colombia, 2023-06-15) Carabali Mosquera, Oscar Eduardo; Barreto Hernández, Emiliano; BioinformáticaLa Secuencia del Genoma Completo se obtiene mediante las tecnologías de secuenciación, especialmente las de próxima generación (NGS). Gracias a su alto poder discriminatorio, simplicidad, precisión, velocidad y flexibilidad, la aplicación de la Secuenciación de Genoma Completo (WGS) se ha convertido en una herramienta que aporta el nivel más alto hasta el momento de discriminación de cepas bacterianas para la investigación de brotes, permitiendo identificar estructura y composición de genes, variantes genéticas y reordenamientos del genoma entre otros (Kwong et al., 2015). Por tal motivo, esta herramienta es de gran utilidad para la investigación epidemiológica ya que proporciona información más detallada y precisa para la toma oportuna de medidas de control derivado de la identificación, tipificación, dinámica de transmisión, procedencia de infección y posibles patrones de propagación de brotes con bacterias como Klebsiella pneumoniae y Pseudomonas aeruginosa causantes de Infecciones Asociadas a la Atención en Salud (IAAS), esto dado que estas bacterias poseen un alto grado de adaptabilidad fisiológica y elevados niveles de resistencia frente a numerosos agentes antimicrobianos, por lo que son patógenos con una elevada incidencia de morbilidad y mortalidad (Saharman et al., 2019)(Moradigaravand et al., 2017). Dentro del uso más frecuente de los datos de Secuenciación de Genoma Completo (WGS) se encuentra la tipificación molecular bacteriana. Por la cual, se han desarrollado varios métodos que se basan principalmente en análisis derivados de Ribosomal Multilocus Sequence Typing (rMLST), Core genome multilocus sequence typing (cgMLST), Whole genome multi locus sequence typing (wgMLST), core genome single nucleotide polymorphism (cgSNP), whole-genome single nucleotide polymorphism (wgSNP) y pangenome (Coll et al., 2020)(Anani et al., 2020). Estos métodos pueden variar en su resolución e idoneidad dependiendo de las especies. Sin embargo, debido al variado número de herramientas bioinformáticas útiles para tipificar y a la falta de consenso de evaluación comparativa de las herramientas los investigadores se pueden enfrentan con dificultades en la elección de herramientas indicada para sus actividades. Es por ello, que se hace necesario realizar una evaluación del desempeño de las herramientas útiles para tipificar, con el fin de informar al usuario sobre las mejores herramientas bioinformáticas disponibles actualmente que brinden información precisa y relevante. (Texto tomado de la fuente)Item type: Ítem , Modelo de aprendizaje automático para predecir el riesgo de evento adverso en analgésicos opioides aplicando datos de secuenciación de última generación (NGS) en una población de pacientes colombianos(Universidad Nacional de Colombia, 2022-11-02) Garzón Venegas, Eliana del Pilar; Aristizábal Gutiérrez, Fabio Ancízar; Niño Vásquez, Luis Fernando; laboratorio de Investigación en Sistemas Inteligentes LisiOBJETIVO: Desarrollar un modelo basado en aprendizaje automático para la predicción del riesgo de evento adverso, a partir del genotipo en farmacogenes asociados con la farmacocinética y farmacodinámica de analgésicos opioides, a partir de datos de secuenciación de última generación (NGS), en una cohorte de pacientes colombianos. MÉTODOS: Se desarrolló un pipeline de anotación de variantes y anotación funcional en 39 genes asociados a la farmacocinética y farmacodinamia de 17 analgésicos opioides de uso común en Colombia a partir de 2080 VCF de exomas provenientes de la secuenciación de nueva generación (NGS). Se realizó un modelo de aprendizaje automático para la clasificación del riesgo efecto adverso utilizando bosques aleatorios, naive Bayes y perceptrón multicapa. RESULTADOS: El pipeline de anotación de variantes y anotación funcional en 39 genes asociados a la farmacocinética y farmacodinamia de 17 analgésicos opioides de uso común en Colombia detecta 9 variantes de riesgo. Los algoritmos de aprendizaje automático se entrenan y evalúan a partir de un dataset compuesto por 1900 variantes genéticas con score de riesgo desde 0.5 a 1.5, 50 variantes genéticas con un escore de 1.5 a 2 y 9 variantes genéticas con score de 2.5 a 4, las cuales están asociadas con efecto adverso, se analizan empleando bosques aleatorios, naive bayes y perceptrón multicapa, obteniendo resultados deficientes en la clasificación de la clase 2 y clase 3 debido al desbalance de datos en estas clase, con lo cual se realiza un enriquecimiento del dataset a partir de variantes de la base de datos PharmGKB, ampliando la data de la clase 3. Se evalúan varias combinaciones de clases por medio de bosques aleatorios y perceptrón multicapa, obteniendo los mejores resultados de clasificación, considerado únicamente dos clases, clase 1, suprimiendo valores de score de 0.5 y 1 y clase 2 compuesta por la unión de datos con score de 2.5 a 5. CONCLUSIONES: Fue posible desarrollar modelos computacionales de clasificación del riesgo de efecto adverso. Sin embargo, se concluye que el desequilibrio en las clases, genera problemas de clasificación, lo que resulta en una reducción significativa de la sensibilidad y la precisión de los modelos de aprendizaje automático. Para poder generar relaciones entre variantes genéticas y su asociación con la presentación de efecto adverso se hace indispensable considerar variables de diversas ómicas que le den un peso importante a la asociación, acompañado de la información clínica y de seguimiento de los pacientes. (Texto tomado de la fuente)Item type: Ítem , Identificación de reacciones controladoras en un modelo computacional multi-ómico astrocitario de lipotoxicidad inducida por ácido palmítico(Universidad Nacional de Colombia, 2022-10-04) Angarita Rodríguez, María Andrea; Pinzón Velasco, Andres Mauricio; Janneth González Santos; Grupo de Investigación en Bioinformática y Biología de Sistemas - GIBBSLos astrocitos juegan un papel importante en varios procesos en el cerebro, incluidas condiciones patológicas como las enfermedades neurodegenerativas. Estudios recientes han demostrado que el aumento de ácidos grasos saturados como el ácido palmítico (PA) desencadena vías proinflamatorias en el cerebro. El uso de neuroesteroides sintéticos como la tibolona ha demostrado mecanismos neuroprotectores. Sin embargo, faltan estudios amplios, con un punto de vista sistémico, sobre el papel neurodegenerativo de PA y los mecanismos neuroprotectores de la tibolona. En este estudio, realizamos la integración de datos multiómicos (transcriptoma y proteoma) en un modelo metabólico a escala genómica de astrocitos humanos para estudiar la respuesta astrocitaria durante el tratamiento con palmitato. Evaluamos los flujos metabólicos en tres escenarios (saludable, inflamación inducida por PA y tratamiento con tibolona bajo inflamación por PA). También aplicamos un enfoque de teoría de control para identificar aquellas reacciones que ejercen más control en el sistema astrocítico. Por último, analizamos las cavidades de las enzimas asociadas a estas reacciones para determinar sus potenciales sitios de unión caracterizándolos en función de puntajes de ligandabilidad y capacidad de interacción farmacológica (drogabilidad). Nuestros resultados sugieren que PA genera una modulación del metabolismo central y secundario, mostrando un cambio en el uso de la fuente de energía a través de la inhibición del ciclo del folato, la β-oxidación de ácidos grasos y la regulación positiva de la formación de cuerpos cetónicos. Encontramos 25 interruptores metabólicos bajo regulación celular mediada por PA, 9 de los cuales fueron críticos solo en el escenario inflamatorio pero no en el protector de tibolona. Dentro de estas reacciones, los perfiles de acoplamiento inhibitorio, total y direccional fueron hallazgos clave, que desempeñaron un papel fundamental en la desregulación de las vías metabólicas que pueden aumentar la neurotoxicidad. De los 25 interruptores metabólicos 16 presentaron cavidades potencialmente drogables que, a su vez, contienen el sitio activo de la proteína. En su conjunto, estas 16 enzimas se configuran como potenciales objetivos terapéuticos. Finalmente, el marco general de nuestro enfoque facilitó la comprensión de la regulación metabólica compleja y puede usarse para la exploración in silico de los mecanismos de regulación de las células astrocitarias, y potencialmente de otros tipos celulares, dirigiendo un trabajo experimental futuro más complejo en enfermedades neurodegenerativas. (Texto tomado de la fuente)Item type: Ítem , Modelado computacional de astrocito humano usando datos de transcriptómica y proteómica(Universidad Nacional de Colombia, 2022-07-17) Mendoza Mejía, Nicolás; Pinzón Velasco, Andrés Mauricio; González Santos, Janet; Grupo de Investigación en Bioinformática y Biología de SistemasAunque la astrogliosis está relacionada con eventos neuroprotectores; su neurotoxicidad se ha correlacionado con enfermedades neurodegenerativas y otros desórdenes (Sofroniew & Vinters, 2010). Lo que ha aumentado la atención en el estudio de estas células. Sin embargo, los procesos de señalización y actividad metabólica relacionados con la neurotoxicidad aún son poco conocidos (González et al., 2020; Sofroniew, 2015), por lo que se han empleado modelos metabólicos a escala genómica (GEM) de astrocito para estudiar estas respuestas. Por lo tanto, en este trabajo se hace la contextualización de un GEM de astrocito humano integrando datos multiomicos con una nueva aproximación en combinación con el algoritmo iMAT, permitiendo incluir información de diversos procesos biológicos en el modelo (Karahalil, 2016; Vivek-Ananth & Samal, 2016). En consecuencia, el GEM resultante presenta una mayor cobertura del metabolismo y una capacidad predictiva superior en los escenarios simulados coincidiendo con lo reportado en la literatura. Además, durante la reconstrucción de este modelo se generaron dos algoritmos, uno permite integrar el proteoma y transcriptoma, mientras el otro corrige los desbalances estequiométricos presentes en el modelo. Finalmente, este modelo tiene el potencial de acelerar el estudio de la astrogliosis, permitiendo descifrar la relación entre el metabolismo del astrocito y la aparición de enfermedades neurodegenerativas mediante la generación de hipótesis y la predicción del desempeño de fármacos. (Texto tomado de la fuente)Item type: Ítem , Análisis de metodologías estadísticas en RNA-seq, con aplicación a cáncer de pulmón(Universidad Nacional de Colombia, 2021) Castañeda Valderrama, Paula Fernanda; Alfonso Malaver, Carlos EduardoLa identificación de genes expresados diferencialmente en un grupo de pacientes que padezcan una enfermedad, es un primer paso en el desarrollo de procedimientos para la detección temprana de dicha enfermedad en los pacientes control. Bajo esta premisa, un propósito deseable de algunas metodologías desarrolladas, es identificar los genes diferencialmente expresados de un conjunto de pacientes con cáncer de pulmón [19], enfermedad que cobra más de 150.000 vidas cada año en los Estados Unidos y cerca de 1.76 millones de muertes a nivel mundial [26]. Existen diferentes metodologías que permiten hallar los genes diferencialmente expresados, en la presente investigación se comparan tres de ellas Limma[22], Deseq2 [16] y Noiseq [10], haciendo uso de un conjuntos de datos simulados por medio del paquete de Bioconductor del software R de nombre compcodeR[27], que permite simular muestras de genes con características similares a un conjunto real, donde se conoce el porcentaje y el conjunto de genes que está diferencialmente expresado dentro de la matriz de conteos. Se generan tres matrices de conteos con 20 y 30 muestras, 30000 genes, 300 y 500 genes diferencialmente expresados, para las tres matrices se ejecutan las tres metodologías mencionadas, encontrando que es Deseq2 el método que encuentra el mayor número real de genes diferencialmente expresados y tiene un mejor porcentaje de Recall. Finalmente se aplica el método seleccionado, Deseq2, a las muestras recolectadas de pacientes con cáncer de pulmón, análisis de muestras de pacientes, de tejido epitelial pulmonar normal y tumores pulmonares de carcinoma de células escamosas [19]. La aplicación encuentra 7506 genes diferencialmente expresados. (Texto tomado de la fuente)Item type: Ítem , Protocolo computacional para la asignación taxonómica de virus en metadatos genómicos(Universidad Nacional de Colombia, 2020) Cobo Paz, Valentina; Bermudez Santana, Clara Isabel; Usme Ciro, Jose Aldemar; Rnomica Teórica y ComputacionalLos virus están ampliamente distribuidos en todos los ecosistemas naturales y son el grupo de entidades biológicas más diverso conocido. Aunque su biodiversidad biológica estimada es de 31 ordenes de magnitud, nuestro conocimiento es menor al 1%. Además, debido a su capacidad de impacto a la salud humana, como lo ha sido la reciente pandemia de Sars- cov-2, es esencial la búsqueda de estrategias que sean rápidas y fiables al clasificar nuevos virus usando los datos disponibles como referencia de manera eficiente. Nuestro objetivo es encontrar métodos flexibles para filtrar y clasificar secuencias víricas utilizando diversos recursos como el aprendizaje de máquina principalmente con una resolución adecuada, una alta eficiencia y buena precisión, manteniendo la flexibilidad del modelo a secuencias víricas diversas. Seleccionamos las máquinas de soporte vectorial y los árboles de gradiente potenciado como los métodos que más nos favorecían en términos de recursos computacionales, rendimiento y predicción, los datos usados fueron descargados del NCBI Virus para entrenar los modelos. Las secuencias virales fueron filtradas cuidadosamente para el entrenamiento del modelo. Después del filtrado de los datos, 19 familias tuvieron el número de secuencias más representativas. Finalmente, de este conjunto de datos, 80 % fueron usados para entrenar las máquinas de aprendizaje y 20% fue utilizado para validar las clases taxonómicas. Las secuencias víricas se transformaron a una representación numérica a través de el método count vectorizer en k-mers de diferentes tamaños, incluyendo 3k-mers con el fin de preservar la información de los marcos abiertos de lectura (ORF’s) y evitar el sobreajuste. En este trabajo, nuestros métodos permiten encontrar asociaciones a nivel taxonómico de familia entre las secuencias virales y la taxonomía, por medio de recursos computacionales eficientes de predicción y a diferencia de métodos convencionales de comparación de secuencias. Sin embargo, es importante señalar que en el aprendizaje de máquina la calidad de la predicción recae directamente en la calidad de la base de datos de entrenamiento y la definición de la clase, por lo tanto descripciones débiles de las familias de virus son la mayor limitación para construir un modelo coherente de clasificación de secuencias. Finalmente, el modelo de árboles de gradiente potenciado tiene la mejor probabilidad de predicción, encontramos que 8 familias que fueron predichas para los datos experimentales concuerdan con los reportes científicos para Culex sp. y Aedes sp. (Texto tomado de la fuente).Item type: Ítem , Modelo Computacional para el análisis de historias clínicas de pacientes con Artritis Reumatoide aplicando bioinformática traslacional y minería de textos(Universidad Nacional de Colombia, 2021-11-16) Del Risco Morales, Alexander; Niño Vasquez, Luis Fernando; Quintana Gerardo; laboratorio de Investigación en Sistemas Inteligentes LisiEste trabajo tiene como finalidad crear un modelo computacional que permita identificar el avance de la enfermedad de artritis reumatoide (AR) con base en el análisis de historias clínicas de pacientes diagnosticados con Artritis Reumatoide. Se plantea que mediante la minería de texto, se puede extraer la información que permita a los profesionales del área identificar datos relevantes para el proceso de diagnóstico de AR y de esta forma hacer un diagnóstico temprano de la misma, así también, se pretende aplicar el concepto de bioinformática traslacional, esto implica que la información de valor y que cumpla con los objetivos propuestos de esta investigación pueda ser transferida de forma efectiva a los pacientes que sufren esta enfermedad. Se ha desarrollado un modelo que aplica minería de textos, recuperación de la información, lingüística computacional, aprendizaje de máquina y otras áreas del conocimiento relacionadas, que permiten transformar y tratar los datos no estructurados para poder hacer el análisis correspondiente de las historias clínicas y así descubrir conocimiento implícito inmerso en las narrativas de las historias clínicas que ayude con el propósito de tener más y mejor información asociada a la artritis reumatoide y la evolución de los pacientes. (Texto tomado de la fuente)Item type: Ítem , Identificación y clasificación de las rutas metabólicas de las especies de Leptospira spp(Universidad Nacional de Colombia, 2021) Beltrán, Óscar Gabriel; Pinzón Velasco, Andrés Mauricion; Grupo de Investigación en Bioinformática y Biologı́a de SistemasEl aislamiento de Leptospira spp. es considerado como la prueba de laboratorio de mayor fiabilidad para el diagnostico de leptospirosis. Sin embargo, las limitaciones del cultivo impiden su implementación para el diagnostico de rutina y han retrasado el desarrollo de nuevas alternativas diagnósticas y terapéuticas. El objetivo de este trabajo fue identificar y caracterizar de las rutas metabólicas del género Leptospira a partir de su contenido genómico y con ello explorar las capacidades metabólicas de este microorganismo. De acuerdo con lo anterior, se encontraron cinco grupos monofiléticos que concuerdan con su estado de patogenicidad pero que difieren en parte de su contenido genómico. Del mismo modo, se realizaron reconstrucciones de modelos metabólicos a escala genómica que demostraron la presencia de distintas rutas metabólicas en los clados, así como respuestas diferenciales durante análisis basados en restricciones. Lo anterior sugiere que las diferencias en los contenidos genómicos provienen de procesos adaptativos y se asocian a los diversos fenotipos observados durante el cultivo. Estos resultados proponen que los miembros de los distintos clados tienen diferentes requisitos nutricionales y que estos metabolitos tienen el potencial de ser utilizados para la diferenciación de especies, como blancos farmacológicos y/o suplementos para la formulación de nuevos medios de cultivo o para ajustar los existentes. (Texto tomado de la fuente)Item type: Ítem , Modelo farmacogenético y clínico para la predicción de desenlaces en pacientes con artritis reumatoide tratados con metotrexato y adalimumab(2020-10-30) Hernández Tarapués, Fabián Alberto; Niño Vásquez, Luis Fernando; Aristizábal Gutiérrez, Fabio Ancízar; LABORATORIO DE INVESTIGACIÓN EN SISTEMAS INTELIGENTES - LISIGOAL: To develop a pharmacogenetic and clinical model to predict effectiveness outcomes in a cohort of patients diagnosed with rheumatoid arthritis (RA) treated with methotrexate or adalimumab at the Central Military Hospital in Bogota, Colombia. METHODS: Five statistical learning methods were tested on the data set with previous pre-processing for variable cleaning and selection: Logistic regression, decision trees, random forests, Support Vector Machines (SVM) and Artificial Neural Networks (ANN). The models were applied in a cohort of 155 patients treated with MTX which was derived in a training (124 patients) and a test cohort (31 patients). Both clinical variables and genetic variations were included. The chosen outcome was the therapy response measured as a DAS 28 score <3.2. The performance evaluation criterion was the area (AUC) under the receiver operating characteristics (ROC) curve. RESULTS: The algorithms with the highest predictive power were SVM and ANN. For the MTX cohort, the main selected variables were age, time with RA, functional classification, and genotypes of the rs9344, rs4148396, rs4673993, rs1801133 and rs7279445 variants. Given the size of the cohort of ADA-treated patients (12 patients), no machine learning model could be successfully adjusted. CONCLUSIONS: A prognostic model with high predictive power was developed in the cohort of patients treated with MTX, which is able to identify patients prone to not responding well to treatment.
- «
- 1 (current)
- 2
- 3
- »