Identificación de relaciones entre genes utilizando técnicas de inteligencia computacional
Author
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2014Metadata
Show full item recordSummary
En este trabajo se propone una metodología general para la identificación de relaciones entre genes a partir de datos de expresión obtenidos mediante dos técnicas diferentes: microarreglos de ADN y secuenciación directa del ARN mensajero (RNA_Seq), e integrando datos de categorías biológicas con las que están asociados los genes. La metodología propuesta contempla diversas fases como selección de genes, agrupamiento, análisis de los grupos, construcción de redes de interacción entre genes y comparación biológica de los resultados. En cada una de las fases de la metodología se aplican técnicas de inteligencia computacional conformadas por teorías y algoritmos de minería de datos y aprendizaje de máquina. Para llevar a cabo cada una de estas fases se emplearon datos de expresión y categóricos de la planta Arabidopsis thaliana. Los resultados obtenidos reflejaron que la metodología propuesta permite la integración de datos de diferente naturaleza aportando más información al caso de estudio y adicionalmente obtener relaciones entre genes.Summary
Abstract. In this work, a general methodology for the identification of relationships between genes from expression data using two different techniques (DNA microarrays and RNA_Seq) is proposed. This technique is based on integrating data from biological categories associated to the genes. The proposed methodology comprises several stages such as gene selection, gene clustering, group analysis, building of interaction networks between genes, and biological comparison of the results. In each phase of the methodology, some computer intelligence techniques, based on data mining and machine learning theories and algorithms, were applied. To carry out each phase, expression and category data from the plant Arabidopsis thaliana were used. The results showed that the proposed methodology allows the integration of different kinds of data contributing more information to the case study and obtaining gene-gene relationships.Keywords
Collections
