Análisis del desempeño de DESeq2 para detección de genes diferencialmente expresados para datos de secuenciación genómica
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2022Metadata
Show full item recordSummary
Las metodologías de secuenciación de ARN han acelerado en gran medida el entendimiento de los procesos biológicos a nivel molecular en diferentes organismos. Aún así, estas metodologías son costosas, lo que lleva a conjuntos de datos de alta dimensionalidad con tamaños de muestra reducidos. Actualmente DESeq2 es una de las metodologías más usadas para el análisis de expresión diferencial, y a pesar de tener una gran fexibilidad en términos de sus hiper-parámetros, en la mayoría de casos se usa con parámetros predeterminados. En este trabajo se analizan dos elementos importantes de esta metodología: se evalúa el desempeño cuando los conteos siguen una distribución Poisson en vez de Binomial negativa y se muestra como la sensibilidad del método aumenta con esta distribución. Adicionalmente se contrasta la corrección por pruebas múltiples de Benjamini y Hochberg con la propuesta de Boca y Leek, y se propone un gráfico para la identificación de la relación funcional con la covariable. (Texto tomado de la fuente)Abstract
ARN sequencing methods have dramatically accelerated our understanding of molecular biological processes within different organisms. However, these methodologies are costly, leading to datasets of high dimensionality and limited sampling size. At present DESeq2 is among the most used methodologies for this type of analysis, and despite its great flexibility regarding its hyper-parameters, it is mostly used with default values. In this work we analyze two important elements in this methodology: we assess the performance when counts follow a Poisson distribution instead of a negative binomial and we show how the sensibility increases with this distribution. Additionally we contrast the multiple-test correction proposed by Benjamini and Hochberg with that of Boca and Leek, and we also suggest a plot for the correct identification of the functional relationship with the informative covariate.Keywords
Physical description
ilustraciones, graficas
Collections
This work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit