• Correo ElectrónicoCorreo Electrónico
  • Dirección Nacional de Información AcadémicaDNINFOA - SIA
  • BibliotecaBibliotecas
  • ConvocatoriasConvocatorias
  • Identidad U.N.Identidad U.N.
Escudo de la República de ColombiaEscudo de la República de Colombia
  • English 
    • español
    • English
    • português (Brasil)
  • Aspirantes
  • Estudiantes
  • Egresados
  • Docentes
  • Administrativos
repositorio.unal.edu.co
Bibliotecas
  • Mapa de sedes
  • Amazonía
  • Bogotá
  • Caribe
  • Manizales
  • Medellín
  • Orinoquía
  • Palmira
Biblioteca Digital
  • Repositorio Institucional
  • Entrega de tesis y publicación en línea
  • Digitalización de documentos
  • Normatividad publicación en línea
  • Portal de Revistas UN
  • Suscripción a contenidos UN
  • Contáctenos
Recursos Bibliográficos
  • Recursos electrónicos
  • Catálogo UN
  • Diccionarios y enciclopedias
  • Herramientas bibliográficas
  • Libros electrónicos
  • Descubridor
  • Índices bibliográficos
  • Adquisicion de material bibliografico
Formación
  • Agenda de formación
  • Solicitud de nuevo taller
  • Guía de autoarchivo de documentos
Acerca de
  • Misión y visión
  • Dirección Nacional de Bibliotecas
  • Convenios y redes
  • Video del Sinab
  • Preguntas frecuentes
Sedes
  • Amazonia
  • Bogotá
  • Caribe
  • De La Paz
  • Manizales
  • Medellín
  • Orinoquia
  • Palmira
  • Tumaco
Servicios
Perfiles
Home
    • español
    • English
    • português (Brasil)
  • Login
View Item 
  •   Institutional Repository of Universidad Nacional
  • 1- Tesis y Disertaciones
  • Sede Bogotá
  • Facultad de Ciencias
  • Departamento de Estadística
  • View Item
  •   Institutional Repository of Universidad Nacional
  • 1- Tesis y Disertaciones
  • Sede Bogotá
  • Facultad de Ciencias
  • Departamento de Estadística
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Methodology for estimating association between categorical variables with application to Genome-wide association studies (GWAS)

Thumbnail
Methodology for estimating associatio between.pdf (1.203Mb)
Date published
2019
Author
Cortés Muñoz, Fabián
Metadata
Show full item record

Summary
Several genomic data analysis contexts have a large number of statistical hypotheses, which are tested simultaneously. When the association between categorical phenotypes (i.e. healthy and not healthy) and Single Nucleotide Polymorphisms (SNPs) are ssessed by applying statistical tests, the two key challenges to address are the following: which method is the best for using multiple testing and how to increase the statistical power after adjustment for multiple testing. In this association studies, a solid criterion obtained to consider its significant with high statistical power and without necessarily increasing the sample size is crucial. Numerous methods have been developed for addressing these limitations; they have improved type I and type II errors rates. The proposed methods are mainly based on changing the type for establishing the association and extending it to continuous traits. Some of these statistical methods are very complex, which are difcult to use, specially for non-statisticians who usually obtain such data. Moreover, very few methods focused on developing a new statistical test for categorical data, which is the most common form of measuring phenotypical traits in humans and other organisms. By applying the maximum values of chi-square distribution as the test statistic, this study propose a new statistical test called Quotient C that allows testing associations between thousands of SNPs and a categorical trait. In real datasets, Quotient C is observed to be less stringent criterion that allows the declaration of a large number of associations between SNPs and dichotomous outcomes in comparison with the classical methods used for correcting multiple testing, thus keeping the probability of incorrectly rejecting a true null hypothesis (type I error) equal or less than type I error. The proposed method has a lower type II error rate and a better statistical power than the following methods: Bonferroni, Holm, Hochberg and Benjamini and Hochberg.
 
En varios contextos de análisis de datos genómicos, una gran cantidad de hipótesis estadísticas se ponen a prueba al mismo tiempo sobre un mismo conjunto de datos. En Estudios de asociación del genoma completo (GWAS, por sus siglas en inglés), se evalúa la asociación entre fenotipos categóricos (como por ejemplo, sanos versus enfermos) y la presencia o ausencia de polimorfismos de nucleótido simples (SNPs, por sus siglas en inglés) mediante pruebas estadísticas. En éstos tipos de estudios, dos problemas principales se deben abordar: qué método usar para la corrección por pruebas múltiples y cómo aumentar la potencia estadística después de realizar ajustes al error tipo I. La obtención de un criterio sólido para declarar asociaciones significativas con alto poder estadístico sin aumentar el tamaño de la muestra es crucial para estos estudios de asociación. Además los métodos propuestos deben ser fáciles de usar y comprender para los científicos que producen los datos. Diversos métodos han sido desarrollados a fin de abordar tales limitaciones con importantes resultados en la disminución de los errores de tipo I y tipo II. Los métodos propuestos se basan principalmente en cambiar el tipo de prueba para establecer la asociación y extenderla a fenotipos continuos. Algunos de ellos son métodos muy complejos y son difíciles de usar para los no estadísticos, quienes son generalmente los que producen los datos. Además, muy pocos métodos se han centrado en desarrollar una nueva prueba estadística para datos categóricos, que es la forma más común de medir rasgos fenotípicos en humanos y otros organismos. Una nueva prueba estadística, llamada Cociente C, se ha propuesto y permite evaluar asociaciones entre una gran cantidad de SNPs y un rasgo categórico, utilizando un estadística de prueba basado en los valores máximos de variables aleatorias χ 2 . Esta nueva metodología ha demostrado en datos reales, encontrar un número mayor de polimorfismos asociados con el fenotipo y poseer mayor potencia estadística en comparación con las propuestas clásicas de corrección por pruebas múltiples.
 
Subject
Genome-wide association studies ; Multiple testing problem ; categorical data data ; Type I error ; Statistical power ; Estudios de asociación del genoma completo ; Problemas de comparaciones múltiples ; Datos categóricos ; Error tipo I ; Potencia estadística ;
URI
https://repositorio.unal.edu.co/handle/unal/77356
Collections
  • Departamento de Estadística [189]

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesKnowledge AreasThis CollectionBy Issue DateAuthorsTitlesKnowledge Areas

My Account

LoginRegister

Statistics

View Google Analytics Statistics
Régimen Legal
Talento humano
Contratación
Ofertas de empleo
Rendición de cuentas
Concurso docente
Pago Virtual
Control interno
Calidad
Buzón de notificaciones
Correo institucional
Mapa del sitio
Redes Sociales
FAQ
Quejas y reclamos
Atención en línea
Encuesta
Contáctenos
Estadísticas
Glosario

Contacto página web:
Carrera 45 # 26-85
Edif. Uriel Gutiérrez
Bogotá D.C., ; Colombia
(+57 1) 316 5000

© Copyright 2014
Algunos derechos reservados.
mediosdigitales@unal.edu.co
Acerca de este sitio web

Actualización: 04/10/19

Orgullo UNOrgullo UNAgencia de noticiasAgencia de noticias
Trámites en líneaContaduría General de la República