Standardization of a methodology for identification and annotation of associations between single nucleotide polymorphisms and highly polygenic traits in ruminants
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2019-06-19Resumen
Given the importance of the production of ruminants, it is necessary to investigate the genetic variants associated with the traits of economic interest in these animals, as well as the biology underlying the genotype-phenotype associations. To conduct these associations, a widely used strategy is to perform genome-wide association studies (GWAS). The GWAS must have the support of adequate quality control (QC), to then identify the associations between genetic markers type SNP and phenotypes. Additionally, the biological contextualization of these associations starts from the annotation of the genes close to the associated markers. Currently, there are several tools, including R libraries, to perform these analyses. However, it is necessary to develop a tool that allows unifying the three main steps (QC, GWAS, and annotation) for species other than human. For the above, the present work developed a methodology that unified the three mentioned steps in the R environment. The generated code was submitted for publication and is freely available in the repository https://github.com/bojusemo/Diploid-GWAS. The code was tested in two populations of ruminants, the Colombian Creole Hair Sheep and Simmental cattle. In these populations, the SNPs with low quality were removed, there was no detected population stratification, and no samples were removed for low quality. The SNP OAR26_10469468.1 was associated with the meat tenderness of Colombian Creole hair sheep. This SNP is in the gene TENM3. TENM3 protein has two domains with functions associated with meat tenderness in cattle and pigs. The SNP BovineHD4100012055 was associated with birth weight in Simmental. The closest gene to this SNP is the olfactory receptor 52E8-like, which is a member of the protein family G protein-coupled receptor (GPCR). GPCR has associated with birth weight in humans. Six markers were associated with 305-day milk yield in Simmental. Neither the closest genes of these markers nor their protein domains have been reported as associated with milk production.Resumen
Resumen: Dada la importancia que tiene la producción de rumiantes, es necesario investigar las variantes genéticas asociadas a las características de interés comercial de dichos animales, así como la biología subyacente a esas asociaciones genotipo-fenotipo. Para hacer dichas asociaciones, una estrategia ampliamente utilizada es realizar estudios de asociación del genoma completo (GWAS). Los GWAS deben partir de un filtro adecuado de la información de las variables y de los individuos, denominado control de calidad (QC), para luego identificar las asociaciones entre marcadores genéticos tipo SNP y los fenotipos. Por su parte, la contextualización biológica de estas asociaciones parte de la anotación de los genes cercanos a los marcadores asociados. Para realizar estos análisis, actualmente hay varias herramientas, incluidas librerías de R. Sin embargo, falta desarrollar una herramienta que permita unificar los tres principales pasos (QC, GWAS y anotación) para datos de especies distintas al humano en R. Por lo anterior, el presente trabajo desarrolló una metodología que unificó en el entorno de R los tres pasos mencionados. El código generado se sometió a publicación y se encuentran disponibles de manera libre en el repositorio https://github.com/bojusemo/Diploid-GWAS. El código fue probado en dos poblaciones de rumiantes, el Ovino de Pelo Criollo Colombiano y los bovinos Simmental. En estas poblaciones, se eliminaron los SNPs con una baja calidad, no se detectó estratificación poblacional y no se eliminaron muestras por baja calidad. El SNP OAR26_10469468.1 estuvo asociado con la terneza de la carne del Ovino de Pelo Criollo Colombiano. Éste SNP está en el gen TENM3. La proteína TENM3 tiene dos dominios con funciones asociadas con la terneza de la carne en bovinos y porcinos. El SNP BovineHD4100012055 estuvo asociado con el peso al nacimiento de Simmental. El gen más cercano a este SNP es el olfactory receptor 52E8-like, que pertenece a la familia de proteínas G protein-coupled receptor (GPCR). Se ha reportado asociación entre GPCR y el peso al nacimiento en humanos. Seis marcadores estuvieron asociados a la producción de leche a los 305 días en Simmental. Ni los genes más cercanos a los marcadores, ni los dominios de las proteínas han sido reportados como asociados con la producción de leche.Palabras clave
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito