Estudio computacional del recambio de genes y pseudogenes de microRNAs en genomas del subphylum Tunicata
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2016-08-29Metadata
Mostrar registro completoSummary
En el presente trabajo se describen los principales conceptos, métodos, desarrollos y aplicaciones requeridos para estudiar computacionalmente el recambio de genes y pseudogenes de microRNAs en genomas del subphylum Tunicata. En primer lugar, se resalta la importancia de trabajar con el grupo ya que este pertenece al clado de los cordados y ha sido reportado como el grupo hermano de los vertebrados por tener similaridad con las células migratorias de la cresta neural y por presentar repeticiones extracelulares específicas (ECs), compartidas con vertebrados y no con los cefalocordados. Debido a que el grupo Tunicata ha sido sugerido por muchos autores de extrema importancia para comprender la evolución de los cordados desde diferentes aspectos como la dinámica de la organización genómica, la funcionalidad genómica y la posible regulación de la innovación morfológica mediada por diferentes factores epigenéticos como los miRNAs, entonces el presente trabajo se enfoca en el desarrollo metodológico computacional requerido para contribuir no solo a la anotación de miRNAs en los genomas del grupo sino, al estudio sistemático preliminar de su recambio evolutivo en los tunicados. Ya que existe información y anotación previa de genes de miRNAs a lo largo de gran variedad de organismos y que se ha reconocido una tendencia al incremento de familias de miRNAs, con respecto a la ganancia de complejidad a nivel estructural en los organismos, el presente trabajo sistemáticamente utiliza la combinación de métodos computacionales integrados por tuberías de procesos desarrolladas in situ para la búsqueda por homología de secuencias y por la búsqueda de homología derivada de la aplicación de métodos de alineamiento de estructuras secundarias construidos bajo fundamentos de modelos ocultos de Markov (HMMs) o modelos de covarianza. Teniendo en cuenta la dificultad para identificar homólogos de genes no codificantes, en este trabajo se aplicaron diferentes variaciones de estrategias de homología clásicas por blast y el uso de modelos ocultos de Markov (HMMs) para identificar candidatos a genes y pseudogenes de miRNAs sobre los genomas de 5 especies de tunicados, 1 especie de cefalocordados y 2 especies de vertebrados, con una posterior validación de candidatos por medio de modelos de covarianza curados y específicos de metazoarios. Adicionalmente, para estudiar el recambio de genes y pseudogenes de miRNAs se identificaron por un lado en los genomas trabajados, las sub-regiones que forman clusters de genes y pseudogenes de miRNAs utilizando un criterio que involucra conceptos de alineamiento de sub-regiones genómicas y la identificación de anclas usando genes codificantes ortólogos y la introducción de un modelo de interpolación linear de coordenadas. Finalmente, los clusters de genes y pseudogenes de miRNAs fueron automatizadamente alineados para el calculo de conservación evolutiva, perdidas, ganancias y procesos de duplicación por medio de matrices.Summary
Abstract. In this work the main concepts, methods, developments and applications required to study computationally the microRNA gene turnover in subphylum Tunicata are described. In firrst place, the importance of working with this group belonging to the clade of chordates is highlighted since is consider as the sister group of vertebrates by having similarity with migratory cells from the neural crest and presents extracellular repeats specific (ECs) which are shared with vertebrates but not with the cephalochordates. Because the group has been listed by many authors of extreme importance for understanding the evolution of chordates from different aspects such as the dynamics of the genomic organization, genomics functionality and the possible regulation of morphological innovation mediated different epigenetic factors such as miRNAs, then, this work focuses on the computational development required to contribute not only into the annotation of miRNAs gene or pseudogenes in the genomes of the group but also, into the preliminary study of their evolutionary turnover in tunicates. Since, the annotation of miRNAs has been clearly established along wide variety of organisms, and has recognized an increasing trend to the gain of miRNAs families with respect to the gain of complexity at the structural level in many organisms, this work systematically uses the combination of computational methods integrated into pipelines developed in situ to search for primary sequence homology and an homology search based on methods that combine alignments of secondary structures built covariance models founded in Hidden Markov Models (HMMs) known as covariance models. Considering the methodological difficulty to tackle the task to identify homologous of noncoding genes, in this work, to identify candidate genes and pseudogenes of miRNAs homologous among the genomes of five species of tunicates, one cephalochordate and two vertebrate species were applied different strategies by using modifications of the classical homology searches implemented in blast and also including Hidden Markov Models (HMMs) concepts. Further validations of candidates were computed by using specific metazoan curated covariance models. Additionally, to study the turnover of genes and pseudogenes of miRNAs, sub-genomic regions that embedded clusters of genes and pseudogenes of miRNAs were detected by using an approach that involves sub-genomic regions alignments, anchors of orthologous genes and the computation of linear interpolation coordinates. Finally, to compute the evolutionary conservation, gains, losses and duplications into matrices, clusters of genes and pseudogenes of miRNAs were automatically aligned.Keywords
Collections
Exceto quando indicado o contrário, a licença deste item é descrito como Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit