dc.rights.licenseAtribución-NoComercial 4.0 Internacional
dc.contributor.advisorLópez Kleine, Liliana
dc.contributor.authorBello Reyes, Nicolás
dc.descriptionilustraciones, graficas
dc.description.abstractLas metodologías de secuenciación de ARN han acelerado en gran medida el entendimiento de los procesos biológicos a nivel molecular en diferentes organismos. Aún así, estas metodologías son costosas, lo que lleva a conjuntos de datos de alta dimensionalidad con tamaños de muestra reducidos. Actualmente DESeq2 es una de las metodologías más usadas para el análisis de expresión diferencial, y a pesar de tener una gran fexibilidad en términos de sus hiper-parámetros, en la mayoría de casos se usa con parámetros predeterminados. En este trabajo se analizan dos elementos importantes de esta metodología: se evalúa el desempeño cuando los conteos siguen una distribución Poisson en vez de Binomial negativa y se muestra como la sensibilidad del método aumenta con esta distribución. Adicionalmente se contrasta la corrección por pruebas múltiples de Benjamini y Hochberg con la propuesta de Boca y Leek, y se propone un gráfico para la identificación de la relación funcional con la covariable. (Texto tomado de la fuente)
dc.description.abstractARN sequencing methods have dramatically accelerated our understanding of molecular biological processes within different organisms. However, these methodologies are costly, leading to datasets of high dimensionality and limited sampling size. At present DESeq2 is among the most used methodologies for this type of analysis, and despite its great flexibility regarding its hyper-parameters, it is mostly used with default values. In this work we analyze two important elements in this methodology: we assess the performance when counts follow a Poisson distribution instead of a negative binomial and we show how the sensibility increases with this distribution. Additionally we contrast the multiple-test correction proposed by Benjamini and Hochberg with that of Boca and Leek, and we also suggest a plot for the correct identification of the functional relationship with the informative covariate.
dc.format.extentv, 39 páginas
dc.publisherUniversidad Nacional de Colombia
dc.subject.ddc570 - Biología::576 - Genética y evolución
dc.titleAnálisis del desempeño de DESeq2 para detección de genes diferencialmente expresados para datos de secuenciación genómica
dc.typeTrabajo de grado - Maestría
dc.publisher.programBogotá - Ciencias - Maestría en Ciencias - Estadística
dc.description.degreenameMagíster en Ciencias - Estadística
dc.identifier.instnameUniversidad Nacional de Colombia
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombia
dc.publisher.departmentDepartamento de Estadística
dc.publisher.facultyFacultad de Ciencias
dc.publisher.placeBogotá, Colombia
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotá
dc.subject.lembARN MENSAJERO
dc.subject.lembRna, messenger
dc.subject.lembDatabases, nucleic acid
dc.subject.proposalExpresión diferencial
dc.subject.proposalModelos lineales generalizados
dc.subject.proposalPruebas múltiples
dc.subject.proposalDifferential expression
dc.subject.proposalGeneralized Linear Models
dc.subject.proposalMultiple testing
dc.title.translatedAnalysis of the performance of DESeq2 for the detection of differentially expressed genes for genome sequencing data

