Modelo de aprendizaje automático de integración de datos genómicos, epigenómicos, transcriptómicos y clínicos provenientes de estudios de cáncer de endometrio y de cáncer de mama
Autor
Director
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2023-11-03Resumen
El cáncer de mama y el cáncer de endometrio son enfermedades complejas que presentan mucha heterogeneidad a nivel molecular e histológico. Ciertos pacientes de estos dos tipos de cáncer comparten tanto mecanismos moleculares y celulares, como factores causales, como lo es el hiperestrogenismo. Este proyecto de investigación buscó identificar biomarcadores tumorales compartidos entre ambas enfermedades. 565 pacientes con cáncer de mama y 348 con cáncer de endometrio de la plataforma The Cancer Genome Atlas fueron seleccionados según sus características histológicas, hormonales e inmunológicas. Sus datos ómicos fueron analizados de manera separada e integrada mediante el uso del algoritmo de aprendizaje multi-vista Deep Generalized Canonical Correlation Analysis y del método de reducción de dimensionalidad Uniform Manifold Approximation and Projection. Se extrajeron biomarcadores de cada grupo (cluster) a través del cálculo del puntaje de información mutua entre las variables iniciales y las variables sintéticas UMAP1 y UMAP2. El análisis de los biomarcadores reveló que varios de estos genes tienen un rol en la proliferación celular, la apoptosis y la angiogénesis. Así mismo, el análisis reveló que la ausencia de metilación en las regiones promotoras de CLTC, importante en la organización del huso mitótico, y SON, involucrado en el empalme del ARN, es una característica compartida entre muchos pacientes de la cohorte. Por otro lado, FBXO11 y PTPN11 se caracterizan por niveles altos de expresión génica en ambos tipos de cáncer. FBXO11 codifica para una ubiquitina ligasa necesaria para la degradación proteica; mientras que PTPN11 codifica para una tirosina fosfatasa que actúa en la transducción de señales mediante una regulación positiva de la vía de señalización RAS/RAF/MAPK. En conclusión, la estrategia de integración multi-ómica permitió descubrir biomarcadores que no aparecen en el análisis de datos ómicos de un solo tipo. Se inscribe como una prueba de concepto de integración de distintos tipos de datos provenientes de diferentes contextos patológicos en el campo de la oncología. (Texto tomado de la fuente).Abstract
Breast cancer and endometrial cancer are complex diseases that show a high degree of molecular and histological heterogeneity. Certain patients with these two types of cancer share both molecular and cellular mechanisms, as well as causal factors such as hyperestrogenism. This research project aimed to identify shared tumor biomarkers between both diseases. 565 breast cancer patients and 348 endometrial cancer patients from The Cancer Genome Atlas platform were selected based on their histological, hormonal, and immunological characteristics. Their omics data was analyzed separately and integratively using the multi-view learning algorithm Deep Generalized Canonical Correlation Analysis and the dimensionality reduction method Uniform Manifold Approximation and Projection. Biomarkers were extracted from each cluster by calculating the mutual information score between the initial variables and the UMAP1 and UMAP2 synthetic variables. The analysis of the biomarkers revealed that several of these genes play a role in cell proliferation, apoptosis, and angiogenesis. Additionally, the analysis showed that the absence of methylation in the promoter regions of CLTC, which is important in the organization of the mitotic spindle, and SON, involved in RNA splicing, is a shared characteristic among many patients in the cohort. On the other hand, FBXO11 and PTPN11 are characterized by high levels of gene expression in both types of cancer. FBXO11 encodes for a ubiquitin ligase necessary for protein degradation, while PTPN11 encodes for a tyrosine phosphatase that acts in signal transduction by positively regulating the RAS/RAF/MAPK signaling pathway. In conclusion, the multi-omic integration strategy allowed the discovery of biomarkers that have not been identified in the omics data analysis of a single type. It serves as a proof of concept for integrating different types of data from different pathological contexts in the field of oncology.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, diagramas
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito