Predicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicos

dc.contributor.advisorZambrano Eder, María Mercedes
dc.contributor.advisorLópez Kleine, Liliana
dc.contributor.authorHernández Neuta, Ginna Esmeraldaspa
dc.date.accessioned2019-06-24T16:38:19Zspa
dc.date.available2019-06-24T16:38:19Zspa
dc.date.issued2011spa
dc.description.abstractEl tratamiento efectivo de la infección por Mycobacterium tuberculosis (Mtb) se dificulta por la aparición de cepas resistentes a fármacos, por lo cual se hace prioritaria la identificación de nuevos blancos terapéuticos. Muchos de los genes considerados como esenciales y/o candidatos, se encuentran dentro del 30% del genoma de Mtb cuya función se desconoce, lo que dificulta su validación experimental. Los métodos de biología computacional permiten integrar diferentes tipos de datos para identificar relaciones funcionales entre proteínas conocidas y desconocidas. En este trabajo se utilizó el análisis de correlación canónica basado en kernels (ACCK) para integrar información genómica y post-genómica y predecir posibles funciones de proteínas hipotéticas identificadas previamente como exclusivas del complejo M. tuberculosis (CMTB). Los datos genómicos y post-genómicos obtenidos de las bases de datos públicas, incluyeron información sobre vías metabólicas (KI), distancias intergénicas (kdist), perfiles filogenéticos (kphy), microarreglos (kexp) y grupos de proteínas ortólogas (kcog Para hacer las predicciones funcionales se realizó un ACC entre K). I and KII, donde KI corresponde a la parte conocida del grafo metabólico de Mtb y KII corresponde a la integración de los datos genómicos y pos-genómicos recolectados: KII = kdist + kphy + kexp + kcog. El resultado del ACCK es la proyección de las proteínas en un espacio conjunto, en el cual se pueden calcular distancias entre proteínas conocidas y desconocidas. El umbral de predicción se definió como la mayor distancia entre dos proteínas conocidas que participan en una misma vía metabólica. El ACCK dio como resultado una matriz de distancias para 728 proteínas de Mtb que permitió El análisis desarrollado en este trabajó permitió hacer una aproximación a la anotación de proteínas de Mtb de función desconocida a partir de la integración de datos de distinta naturaleza, aportando al conocimiento de la biología de la micobacteria. El ACCK es un método flexible que permitió integrar variables heterogéneas y proponer posibles funciones para las proteínas estudiadas con un error de clasificación aceptable. El siguiente paso es la validación experimental de las funciones predichas. / Abstract. The need for new drugs against Mycobacterium tuberculosis has led to the identification of novel gene targets, many of which are annotated as proteins of unknown function that makes their experimental validation difficult. Computational biology approaches can integrate data of diverse origin and help to predict protein functions. Here we used the kernel canonical correlation analysis (KCCA) to integrate genomic and post-genomic data to predict the function of hypothetical proteins that were previously identified as exclusive of pathogenic strains of the M. tuberculosis complex (MTBC). Data collected from databases included: metabolic pathways (KI), intergenic distances (kdist), phylogenetic profiles (kphy), microarray data (kexp) and cluster of orthologous groups (kcog). The highest distance between two proteins in the same metabolic pathway was used as threshold to define the possible partners of hypothetical proteins. Using KCCA we analyzed 728 M. tuberculosis proteins with correct classification percentage of 78.3%. Hypothetical proteins were functionally associated with proteins involved in metabolism of amino acids, thiamine, purine and pyrimidine, in phenylalanine biosynthesis and oxidative phosphorylation. The functional relationships predicted for all problem proteins were represented as a global network composed of 314 nodes, of which 140 were associated with at least one metabolic pathway. KCCA is a flexible and useful method for integrating heterogeneous data and inferring possible relationships between known and hypothetical proteins of M. tuberculosis with minimal error of classification. These predicted functions must however be further confirmed by experimental validation.spa
dc.description.degreelevelMaestríaspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.eprintshttp://bdigital.unal.edu.co/3886/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/7500
dc.language.isospaspa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Bogotá Facultad de Medicina Departamento de Salud Públicaspa
dc.relation.ispartofDepartamento de Salud Públicaspa
dc.relation.referencesHernández Neuta, Ginna Esmeralda (2011) Predicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicos / Functional prediction of hypothetical proteins in mycobacterium tuberculosis from genomic and post-genomic data. Maestría thesis, Universidad Nacional de Colombia.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc61 Ciencias médicas; Medicina / Medicine and healthspa
dc.subject.proposalPredicción funcionalspa
dc.subject.proposalProteínas hipotéticasspa
dc.subject.proposalMycobacterium tuberculosisspa
dc.subject.proposalMétodos kernelspa
dc.subject.proposalDatos genómicosspa
dc.subject.proposalBiología computacional / Functional predictionspa
dc.subject.proposalHypothetical proteinsspa
dc.subject.proposalMycobacterium tuberculosisspa
dc.subject.proposalKernel methodsspa
dc.subject.proposalGenomic dataspa
dc.subject.proposalComputational biologyspa
dc.titlePredicción funcional de proteínas hipotéticas de mycobacterium tuberculosis a partir del análisis de datos genómicos y post-genómicosspa
dc.title.translatedFunctional prediction of hypothetical proteins in mycobacterium tuberculosis from genomic and post-genomic dataSpa
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
598552.2011.pdf
Tamaño:
3.68 MB
Formato:
Adobe Portable Document Format