Métodos de reducción de dimensión de variables para la clasificación de muestras de datos de expresión en células unitarias
dc.contributor.advisor | Lopez Kleine, Liliana | spa |
dc.contributor.author | Hernández Castañeda, Julián | spa |
dc.contributor.researchgroup | Grupo de Investigación en Bioinformática y Biología de Sistemas | spa |
dc.date.accessioned | 2021-10-26T21:36:05Z | |
dc.date.available | 2021-10-26T21:36:05Z | |
dc.date.issued | 2021-10-04 | |
dc.description | ilustraciones, gráficas, tablas | spa |
dc.description.abstract | El estudio de datos de expresión en células unitarias ha venido creciendo en los últimos años dada su gran utilidad, ya que permite entender el funcionamiento de los sistemas biológicos a nivel molecular. Estos datos son muy extensos en términos informáticos por lo que es importante usar un método de reducción de dimensión adecuado para poder interpretar y visualizar la información. Actualmente, hay varios métodos y algoritmos que realizan esta labor. Sin embargo, carecen de buenos resultados o sustentos teóricos estadísticos fuertes. Por medio de simulaciones se comparan los métodos más populares, analizando sus fortalezas, debilidades y limitaciones. Se plantea un método de reducción de dimensión basado en un modelo lineal mixto, tratando de capturar toda la información importante para datos de single cell RNA sequencing. Además, se propone una metodología particularmente fácil de implementar, que permite destacar los genes influyentes de un proceso biológico. Esta metodología es implementada en datos de oligodendrogliomas, mostrando 3 vías metabólicas que pueden ayudar a entender la heterogeneidad celular de este tipo de tejido. (Texto tomado de la fuente). | spa |
dc.description.abstract | The study of single cell expression data has been growing in recent years given its great utility since it allows us to understand how the biological systems work in a molecular level. These data are very extensive in computational terms, then it is important to use an adequate dimension reduction method to be able to interpret and visualize the information. Currently, there are several methods and algorithms that perform this work. However, they lack good results or strong statistical theoretical support. With simulations, it is proposed to compare the most popular methods, analyzing its strengths, weaknesses and limitations. It is proposed a dimension reduction method based on a mixed linear model that aims to capture all the important information of single cell RNA sequencing data. Moreover, it is proposed a particularly easy-to-apply methodology that let the researcher mark the influyent genes in a biological process. This methodology is applied to oligodendrogioma data, showing 3 methabolic pathways that can lead to a better understanding of the celular heterogenity of this Tissue. | eng |
dc.description.degreelevel | Maestría | spa |
dc.description.degreename | Magíster en Ciencias - Estadística | spa |
dc.description.notes | Incluye anexos | spa |
dc.description.researcharea | Estadística genómica | spa |
dc.format.extent | vii, 75 páginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.instname | Universidad Nacional de Colombia | spa |
dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/80618 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad Nacional de Colombia | spa |
dc.publisher.branch | Universidad Nacional de Colombia - Sede Bogotá | spa |
dc.publisher.department | Departamento de Estadística | spa |
dc.publisher.faculty | Facultad de Ciencias | spa |
dc.publisher.place | Bogotá, Colombia | spa |
dc.publisher.program | Bogotá - Ciencias - Maestría en Ciencias - Estadística | spa |
dc.relation.references | Chial, Heidi: DNA sequencing technologies key to the Human Genome Project. En: Nature Education 1 (2008), Nr. 1, p. 219 | spa |
dc.relation.references | Cook, R D.: Principal components, sufficient dimension reduction, and envelopes. (2018) | spa |
dc.relation.references | Cook, R D. ; Zhang, Xin: Fast envelope algorithms. En: Statistica Sinica 28 (2018), Nr. 3, p. 1179-1197 | spa |
dc.relation.references | Ding, Jiarui ; Condon, Anne ; Shah, Sohrab P.: Interpretable dimensionality reduction of single cell transcriptome data with deep generative models. En: Nature communications 9 (2018), Nr. 1, p. 1-13 | spa |
dc.relation.references | Eberwine, James ; Sul, Jai-Yoon ; Bartfai, Tamas ; Kim, Junhyong: The promise of single-cell sequencing. En: Nature methods 11 (2014), Nr. 1, p. 25-27 | spa |
dc.relation.references | Hicks, Stephanie. Welcome to the World of Single-Cell RNA-Sequencing | spa |
dc.relation.references | Lee, Kuang-Yao ; Li, Bing ; Chiaromonte, Francesca [u. a.]: A general theory for nonlinear sufficient dimension reduction: Formulation and estimation. En: The Annals of Statistics 41 (2013), Nr. 1, p. 221-249 | spa |
dc.relation.references | Maaten, Laurens van d. ; Hinton, Geoffrey: Visualizing data using t-SNE. En: Journal of machine learning research 9 (2008), Nr. Nov, p. 2579-2605 | spa |
dc.relation.references | McCulloch, Charles E. ; Neuhaus, John M.: Generalized linear mixed models. En: Encyclopedia of biostatistics 4 (2005) | spa |
dc.relation.references | Oshlack, Alicia ; Robinson, Mark D. ; Young, Matthew D.: From RNA-seq reads to di erential expression results. En: Genome biology 11 (2010), Nr. 12, p. 1-10 | spa |
dc.relation.references | Ozsolak, Fatih ; Milos, Patrice M.: RNA sequencing: advances, challenges and opportunities. En: Nature reviews genetics 12 (2011), Nr. 2, p. 87-98 | spa |
dc.relation.references | Rencher, Alvin C. ; Christensen, WF: Methods of multivariate analysis. a john wiley & sons. En: Inc. Publication (2002), p. 727 | spa |
dc.relation.references | Tirosh, Itay ; Venteicher, Andrew S. ; Hebert, Christine ; Escalante, Leah E. ; Patel, Anoop P. ; Yizhak, Keren ; Fisher, Jonathan M. ; Rodman, Christopher ; Mount, Christopher ; Filbin, Mariella G. [u. a.]: Single-cell RNA-seq supports a developmental hierarchy in human oligodendroglioma. En: Nature 539 (2016), Nr. 7628, p. 309-313 | spa |
dc.relation.references | Wang, Zhong ; Gerstein, Mark ; Snyder, Michael: RNA-Seq: a revolutionary tool for transcriptomics. En: Nature reviews genetics 10 (2009), Nr. 1, p. 57-63 | spa |
dc.relation.references | Yan, Peng ; Zhou, Bin ; Ma, Yingdong ; Wang, Ani ; Hu, Xiaojun ; Luo, Youli ; Yuan, Yajun ; Wei, Yajun ; Pang, Pengfei ; Mao, Junjie: Tracking the important role of JUNB in hepatocellular carcinoma by single-cell sequencing analysis. En: Oncology Letters | spa |
dc.relation.references | Yu, Pingjian ; Lin, Wei: Single-cell transcriptome study as big data. En: Genomics, proteomics & bioinformatics 14 (2016), Nr. 1, p. 21-30 | spa |
dc.relation.references | Zhu, Li-Ping ; Zhu, Li-Xing ; Feng, Zheng-Hui: Dimension reduction in regressions through cumulative slicing estimation. En: Journal of the American Statistical Asso- ciation 105 (2010), Nr. 492, p. 1455-1466 | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.license | Reconocimiento 4.0 Internacional | spa |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | spa |
dc.subject.ddc | 500 - Ciencias naturales y matemáticas | spa |
dc.subject.decs | RNA-Seq | eng |
dc.subject.decs | RNA-Seq | spa |
dc.subject.lemb | Lineal models (statistics) | eng |
dc.subject.lemb | Modelos lineales (Estadística) | spa |
dc.subject.lemb | Experimental design | eng |
dc.subject.lemb | Diseño experimental | spa |
dc.subject.proposal | SCseq | eng |
dc.subject.proposal | Envelopes | eng |
dc.subject.proposal | Dimention reduction | eng |
dc.subject.proposal | Classication of samples | eng |
dc.subject.proposal | Mixed linear model | eng |
dc.subject.proposal | Clasificacion de muestras | spa |
dc.subject.proposal | Modelo lineal mixto | spa |
dc.subject.proposal | Reducción de dimensión | spa |
dc.title | Métodos de reducción de dimensión de variables para la clasificación de muestras de datos de expresión en células unitarias | spa |
dc.title.translated | Dimension reduction methods for Single cell Rna -seq data classification | eng |
dc.type | Trabajo de grado - Maestría | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | spa |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
dc.type.content | Text | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | spa |
dc.type.version | info:eu-repo/semantics/acceptedVersion | spa |
dcterms.audience.professionaldevelopment | Investigadores | spa |
dcterms.audience.professionaldevelopment | Público general | spa |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 1032492680.2021.pdf
- Tamaño:
- 3.43 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis de Maestría en Estadística
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 3.98 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: