Métodos de reducción de dimensión de variables para la clasificación de muestras de datos de expresión en células unitarias

dc.contributor.advisorLopez Kleine, Lilianaspa
dc.contributor.authorHernández Castañeda, Juliánspa
dc.contributor.researchgroupGrupo de Investigación en Bioinformática y Biología de Sistemasspa
dc.date.accessioned2021-10-26T21:36:05Z
dc.date.available2021-10-26T21:36:05Z
dc.date.issued2021-10-04
dc.descriptionilustraciones, gráficas, tablasspa
dc.description.abstractEl estudio de datos de expresión en células unitarias ha venido creciendo en los últimos años dada su gran utilidad, ya que permite entender el funcionamiento de los sistemas biológicos a nivel molecular. Estos datos son muy extensos en términos informáticos por lo que es importante usar un método de reducción de dimensión adecuado para poder interpretar y visualizar la información. Actualmente, hay varios métodos y algoritmos que realizan esta labor. Sin embargo, carecen de buenos resultados o sustentos teóricos estadísticos fuertes. Por medio de simulaciones se comparan los métodos más populares, analizando sus fortalezas, debilidades y limitaciones. Se plantea un método de reducción de dimensión basado en un modelo lineal mixto, tratando de capturar toda la información importante para datos de single cell RNA sequencing. Además, se propone una metodología particularmente fácil de implementar, que permite destacar los genes influyentes de un proceso biológico. Esta metodología es implementada en datos de oligodendrogliomas, mostrando 3 vías metabólicas que pueden ayudar a entender la heterogeneidad celular de este tipo de tejido. (Texto tomado de la fuente).spa
dc.description.abstractThe study of single cell expression data has been growing in recent years given its great utility since it allows us to understand how the biological systems work in a molecular level. These data are very extensive in computational terms, then it is important to use an adequate dimension reduction method to be able to interpret and visualize the information. Currently, there are several methods and algorithms that perform this work. However, they lack good results or strong statistical theoretical support. With simulations, it is proposed to compare the most popular methods, analyzing its strengths, weaknesses and limitations. It is proposed a dimension reduction method based on a mixed linear model that aims to capture all the important information of single cell RNA sequencing data. Moreover, it is proposed a particularly easy-to-apply methodology that let the researcher mark the influyent genes in a biological process. This methodology is applied to oligodendrogioma data, showing 3 methabolic pathways that can lead to a better understanding of the celular heterogenity of this Tissue.eng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias - Estadísticaspa
dc.description.notesIncluye anexosspa
dc.description.researchareaEstadística genómicaspa
dc.format.extentvii, 75 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/80618
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.departmentDepartamento de Estadísticaspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeBogotá, Colombiaspa
dc.publisher.programBogotá - Ciencias - Maestría en Ciencias - Estadísticaspa
dc.relation.referencesChial, Heidi: DNA sequencing technologies key to the Human Genome Project. En: Nature Education 1 (2008), Nr. 1, p. 219spa
dc.relation.referencesCook, R D.: Principal components, sufficient dimension reduction, and envelopes. (2018)spa
dc.relation.referencesCook, R D. ; Zhang, Xin: Fast envelope algorithms. En: Statistica Sinica 28 (2018), Nr. 3, p. 1179-1197spa
dc.relation.referencesDing, Jiarui ; Condon, Anne ; Shah, Sohrab P.: Interpretable dimensionality reduction of single cell transcriptome data with deep generative models. En: Nature communications 9 (2018), Nr. 1, p. 1-13spa
dc.relation.referencesEberwine, James ; Sul, Jai-Yoon ; Bartfai, Tamas ; Kim, Junhyong: The promise of single-cell sequencing. En: Nature methods 11 (2014), Nr. 1, p. 25-27spa
dc.relation.referencesHicks, Stephanie. Welcome to the World of Single-Cell RNA-Sequencingspa
dc.relation.referencesLee, Kuang-Yao ; Li, Bing ; Chiaromonte, Francesca [u. a.]: A general theory for nonlinear sufficient dimension reduction: Formulation and estimation. En: The Annals of Statistics 41 (2013), Nr. 1, p. 221-249spa
dc.relation.referencesMaaten, Laurens van d. ; Hinton, Geoffrey: Visualizing data using t-SNE. En: Journal of machine learning research 9 (2008), Nr. Nov, p. 2579-2605spa
dc.relation.referencesMcCulloch, Charles E. ; Neuhaus, John M.: Generalized linear mixed models. En: Encyclopedia of biostatistics 4 (2005)spa
dc.relation.referencesOshlack, Alicia ; Robinson, Mark D. ; Young, Matthew D.: From RNA-seq reads to di erential expression results. En: Genome biology 11 (2010), Nr. 12, p. 1-10spa
dc.relation.referencesOzsolak, Fatih ; Milos, Patrice M.: RNA sequencing: advances, challenges and opportunities. En: Nature reviews genetics 12 (2011), Nr. 2, p. 87-98spa
dc.relation.referencesRencher, Alvin C. ; Christensen, WF: Methods of multivariate analysis. a john wiley & sons. En: Inc. Publication (2002), p. 727spa
dc.relation.referencesTirosh, Itay ; Venteicher, Andrew S. ; Hebert, Christine ; Escalante, Leah E. ; Patel, Anoop P. ; Yizhak, Keren ; Fisher, Jonathan M. ; Rodman, Christopher ; Mount, Christopher ; Filbin, Mariella G. [u. a.]: Single-cell RNA-seq supports a developmental hierarchy in human oligodendroglioma. En: Nature 539 (2016), Nr. 7628, p. 309-313spa
dc.relation.referencesWang, Zhong ; Gerstein, Mark ; Snyder, Michael: RNA-Seq: a revolutionary tool for transcriptomics. En: Nature reviews genetics 10 (2009), Nr. 1, p. 57-63spa
dc.relation.referencesYan, Peng ; Zhou, Bin ; Ma, Yingdong ; Wang, Ani ; Hu, Xiaojun ; Luo, Youli ; Yuan, Yajun ; Wei, Yajun ; Pang, Pengfei ; Mao, Junjie: Tracking the important role of JUNB in hepatocellular carcinoma by single-cell sequencing analysis. En: Oncology Lettersspa
dc.relation.referencesYu, Pingjian ; Lin, Wei: Single-cell transcriptome study as big data. En: Genomics, proteomics & bioinformatics 14 (2016), Nr. 1, p. 21-30spa
dc.relation.referencesZhu, Li-Ping ; Zhu, Li-Xing ; Feng, Zheng-Hui: Dimension reduction in regressions through cumulative slicing estimation. En: Journal of the American Statistical Asso- ciation 105 (2010), Nr. 492, p. 1455-1466spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseReconocimiento 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/spa
dc.subject.ddc500 - Ciencias naturales y matemáticasspa
dc.subject.decsRNA-Seqeng
dc.subject.decsRNA-Seqspa
dc.subject.lembLineal models (statistics)eng
dc.subject.lembModelos lineales (Estadística)spa
dc.subject.lembExperimental designeng
dc.subject.lembDiseño experimentalspa
dc.subject.proposalSCseqeng
dc.subject.proposalEnvelopeseng
dc.subject.proposalDimention reductioneng
dc.subject.proposalClassication of sampleseng
dc.subject.proposalMixed linear modeleng
dc.subject.proposalClasificacion de muestrasspa
dc.subject.proposalModelo lineal mixtospa
dc.subject.proposalReducción de dimensiónspa
dc.titleMétodos de reducción de dimensión de variables para la clasificación de muestras de datos de expresión en células unitariasspa
dc.title.translatedDimension reduction methods for Single cell Rna -seq data classificationeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentPúblico generalspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1032492680.2021.pdf
Tamaño:
3.43 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Estadística

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.98 KB
Formato:
Item-specific license agreed upon to submission
Descripción: