Show simple item record

dc.rights.licenseAtribución-NoComercial 4.0 Internacional
dc.contributorZambrano Eder, María Mercedes
dc.contributor.authorHernández Neuta, Ginna Esmeralda
dc.date.accessioned2019-06-24T16:38:19Z
dc.date.available2019-06-24T16:38:19Z
dc.date.issued2011
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/7500
dc.description.abstractEl tratamiento efectivo de la infección por Mycobacterium tuberculosis (Mtb) se dificulta por la aparición de cepas resistentes a fármacos, por lo cual se hace prioritaria la identificación de nuevos blancos terapéuticos. Muchos de los genes considerados como esenciales y/o candidatos, se encuentran dentro del 30% del genoma de Mtb cuya función se desconoce, lo que dificulta su validación experimental. Los métodos de biología computacional permiten integrar diferentes tipos de datos para identificar relaciones funcionales entre proteínas conocidas y desconocidas. En este trabajo se utilizó el análisis de correlación canónica basado en kernels (ACCK) para integrar información genómica y post-genómica y predecir posibles funciones de proteínas hipotéticas identificadas previamente como exclusivas del complejo M. tuberculosis (CMTB). Los datos genómicos y post-genómicos obtenidos de las bases de datos públicas, incluyeron información sobre vías metabólicas (KI), distancias intergénicas (kdist), perfiles filogenéticos (kphy), microarreglos (kexp) y grupos de proteínas ortólogas (kcog Para hacer las predicciones funcionales se realizó un ACC entre K). I and KII, donde KI corresponde a la parte conocida del grafo metabólico de Mtb y KII corresponde a la integración de los datos genómicos y pos-genómicos recolectados: KII = kdist + kphy + kexp + kcog. El resultado del ACCK es la proyección de las proteínas en un espacio conjunto, en el cual se pueden calcular distancias entre proteínas conocidas y desconocidas. El umbral de predicción se definió como la mayor distancia entre dos proteínas conocidas que participan en una misma vía metabólica. El ACCK dio como resultado una matriz de distancias para 728 proteínas de Mtb que permitió El análisis desarrollado en este trabajó permitió hacer una aproximación a la anotación de proteínas de Mtb de función desconocida a partir de la integración de datos de distinta naturaleza, aportando al conocimiento de la biología de la micobacteria. El ACCK es un método flexible que permitió integrar variables heterogéneas y proponer posibles funciones para las proteínas estudiadas con un error de clasificación aceptable. El siguiente paso es la validación experimental de las funciones predichas. / Abstract. The need for new drugs against Mycobacterium tuberculosis has led to the identification of novel gene targets, many of which are annotated as proteins of unknown function that makes their experimental validation difficult. Computational biology approaches can integrate data of diverse origin and help to predict protein functions. Here we used the kernel canonical correlation analysis (KCCA) to integrate genomic and post-genomic data to predict the function of hypothetical proteins that were previously identified as exclusive of pathogenic strains of the M. tuberculosis complex (MTBC). Data collected from databases included: metabolic pathways (KI), intergenic distances (kdist), phylogenetic profiles (kphy), microarray data (kexp) and cluster of orthologous groups (kcog). The highest distance between two proteins in the same metabolic pathway was used as threshold to define the possible partners of hypothetical proteins. Using KCCA we analyzed 728 M. tuberculosis proteins with correct classification percentage of 78.3%. Hypothetical proteins were functionally associated with proteins involved in metabolism of amino acids, thiamine, purine and pyrimidine, in phenylalanine biosynthesis and oxidative phosphorylation. The functional relationships predicted for all problem proteins were represented as a global network composed of 314 nodes, of which 140 were associated with at least one metabolic pathway. KCCA is a flexible and useful method for integrating heterogeneous data and inferring possible relationships between known and hypothetical proteins of M. tuberculosis with minimal error of classification. These predicted functions must however be further confirmed by experimental validation.
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Bogotá Facultad de Medicina Departamento de Salud Pública
dc.relation.ispartofDepartamento de Salud Pública
dc.rightsDerechos reservados - Universidad Nacional de Colombia
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subject.ddc61 Ciencias médicas; Medicina / Medicine and health
dc.titlePredicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicos / Functional prediction of hypothetical proteins in mycobacterium tuberculosis from genomic and post-genomic data
dc.typeTrabajo de grado - Maestría
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dc.identifier.eprintshttp://bdigital.unal.edu.co/3886/
dc.description.degreelevelMaestría
dc.relation.referencesHernández Neuta, Ginna Esmeralda (2011) Predicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicos / Functional prediction of hypothetical proteins in mycobacterium tuberculosis from genomic and post-genomic data. Maestría thesis, Universidad Nacional de Colombia.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.subject.proposalPredicción funcional
dc.subject.proposalProteínas hipotéticas
dc.subject.proposalMycobacterium tuberculosis
dc.subject.proposalMétodos kernel
dc.subject.proposalDatos genómicos
dc.subject.proposalBiología computacional / Functional prediction
dc.subject.proposalHypothetical proteins
dc.subject.proposalMycobacterium tuberculosis
dc.subject.proposalKernel methods
dc.subject.proposalGenomic data
dc.subject.proposalComputational biology
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial 4.0 InternacionalThis work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit