Modelo de epistasis basado en aprendizaje automático para pacientes con discapacidad intelectual y retraso del neurodesarrollo
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2024-04-29Resumen
Los estudios de asociación como epistasis representan un factor importante en la comprensión de la expresión de enfermedades complejas, como lo son los trastornos del neurodesarrollo (TND), que presentan un desafío en el entendimiento de su etiología. Aunque varios estudios han revelado diferentes hallazgos de mutaciones, los efectos de asociación entre polimorfismos de un solo nucleótido (SNP) siguen siendo desconocidos. La reducción de dimensionalidad multifactorial (MDR) es un método de minería de datos por inducción constructiva empleado para detectar interacciones complejas. Este estudio comprendió una cohorte retrospectiva de pacientes pediátricos con prueba de exoma trio por sospecha de alteraciones genéticas para TND. Después de los controles de calidad sobre genotipos, se desarrolló el método MDR bajo la Prueba de desequilibrio de pedigrí (MDR-PDT). Además, se identificaron variantes asociadas individualmente con la enfermad a partir de la prueba de desequilibrio de transmisión (TDT). Se encontró que la variante rs6843524 (SEC24D) significativa por TDT (valor-P=0.003135) evidenció asociaciones con SNP; rs6843524-rs895952 (MDR-PDT valor-P=0.0084) y rs6843524-rs1168666 (MDR-PDT valor-P=0.0079). Aunque las variantes rs1168666 (SETD1B) y rs4974081 (QRICH1) no fueron significativas en MDR, si se identificaron en varios modelos y sus genes destacaron en el análisis de enriquecimiento (FDR 1.11e-05 y 6.55e-05). A pesar de la baja significancia de los modelos MDR-PDT, se lograron validar asociaciones importantes por medio de las otras pruebas y la interpretación biológica. Estos modelos pueden ser muy útiles en el descubrimiento de nuevas variantes, especialmente cuando son desarrollados sobre poblaciones grandes y con un análisis completo desde la secuenciación. (Texto tomado de la fuente).Abstract
Association studies such as epistasis studies represent an important factor in understanding the expression of complex diseases, such as neurodevelopmental disorders (NDD). These disorders exhibit a challenge around their etiology. Even though certain studies have revealed several mutation findings, the association effects between Single Nucleotide Polymorphisms (SNPs) remain unknown. Multifactor dimensionality reduction (MDR) is a constructive induction data mining approach that can be used to identify those effects. In this work, a retrospective cohort study based on pediatric patients with trio exome analysis due to suspected genetic alterations for NDD was carried out. After developing genotype quality controls, MDR method was performed under Pedigree Imbalance Test (MDR-PDT). In addition, variants individually associated to disease were identified with Transmission Disequilibrium Test (TDT). We found that variant rs6843524 (SEC24D) is TDT significant (P-value=0.003135) and evidenced SNP interactions; rs6843524-rs895952 (MDR-PDT P-value=0.0084) and rs6843524-rs1168666 (MDR-PDT P-value=0.0079). Although variants rs1168666 (SETD1B) and rs4974081 (QRICH1) were not significant by MDR they were identified by several models and their genes were outstanding in enrichment analysis (FDR 1.11e-05 y 6.55e-05). Despite the low significance of MDR-PDT models, important associations were validated through other tests and biological interpretation. These models can be very useful in discovering new variants, especially when they are developed on larger populations and performing a complete analysis beginning from sequencing.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, diagramas
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito