Métodos de reducción de dimensión de variables para la clasificación de muestras de datos de expresión en células unitarias
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2021-10-04Metadata
Show full item recordSummary
El estudio de datos de expresión en células unitarias ha venido creciendo en los últimos años dada su gran utilidad, ya que permite entender el funcionamiento de los sistemas biológicos a nivel molecular. Estos datos son muy extensos en términos informáticos por lo que es importante usar un método de reducción de dimensión adecuado para poder interpretar y visualizar la información. Actualmente, hay varios métodos y algoritmos que realizan esta labor. Sin embargo, carecen de buenos resultados o sustentos teóricos estadísticos fuertes. Por medio de simulaciones se comparan los métodos más populares, analizando sus fortalezas, debilidades y limitaciones. Se plantea un método de reducción de dimensión basado en un modelo lineal mixto, tratando de capturar toda la información importante para datos de single cell RNA sequencing. Además, se propone una metodología particularmente fácil de implementar, que permite destacar los genes influyentes de un proceso biológico. Esta metodología es implementada en datos de oligodendrogliomas, mostrando 3 vías metabólicas que pueden ayudar a entender la heterogeneidad celular de este tipo de tejido. (Texto tomado de la fuente).Abstract
The study of single cell expression data has been growing in recent years given its great utility since it allows us to understand how the biological systems work in a molecular level. These data are very extensive in computational terms, then it is important to use an adequate dimension reduction method to be able to interpret and visualize the information. Currently, there are several methods and algorithms that perform this work. However, they lack good results or strong statistical theoretical support. With simulations, it is proposed to compare the most popular methods, analyzing its strengths, weaknesses and limitations. It is proposed a dimension reduction method based on a mixed linear model that aims to capture all the important information of single cell RNA sequencing data. Moreover, it is proposed a particularly easy-to-apply methodology that let the researcher mark the influyent genes in a biological process. This methodology is applied to oligodendrogioma data, showing 3 methabolic pathways that can lead to a better understanding of the celular heterogenity of this Tissue.Keywords
Physical description
ilustraciones, gráficas, tablas
Collections
