Caracterización del perfil de transcripción génico en pacientes de cáncer de mama triple negativo en Colombia

dc.contributor.advisorLópez Kleine, Lilianaspa
dc.contributor.authorCastaño Bernal, Andrés Felipespa
dc.coverage.countryColombiaspa
dc.date.accessioned2024-09-20T15:06:32Z
dc.date.available2024-09-20T15:06:32Z
dc.date.issued2024
dc.descriptionIlustraciones, diagramas, tablasspa
dc.description.abstractEl cáncer de mama es una enfermedad muy heterogénea donde se han desarrollado varios subtipos de diagnóstico y tratamiento particular, razón por la cual, no existe ningún método estadístico que sea infalible a la hora de caracterizar el perfil transcriptómico de pacientes que sufren esta enfermedad. Dentro de los subtipos que se conocen, se encuentra el cáncer de mama triple negativo que afecta principalmente a mujeres con ancestría afro descendiente o latina y se caracteriza por no mostrar señales en los tres receptores que permiten el diagnóstico de la enfermedad. La complejidad de este subtipo de cáncer, sumada al hecho de que Colombia es diversa y se encuentran muchas mujeres con predisposición genética, donde en el país se generan cada día más conjuntos genómicos que tienen multidimensionalidad y estos son estudiados principalmente por personas sin formación estadística, de áreas como la biología, la clínica y la medicina, entre otras, fueron los factores que motivaron el presente estudio en el cual se abordará una metodología estadística sencilla e intuitiva, que pueda relacionar la información clínica a un conjunto de genes. El principal objetivo fue determinar los genes más informativos para la caracterización de las pacientes en una pequeña muestra de pacientes colombianas con multidimensionalidad. Una vez seleccionados, se evaluó su relación con variables clínicas y su capacidad para clasificar las muestras de manera adecuada con base en el diagnóstico clínico. Para ello se usaron métodos como el RGCCA, DESeq2, Random Forest y las aplicaciones limma en R, basadas en modelos lineales y estimaciones bayesianas. Finalmente, se buscó más información para identificar su relación con la enfermedad en el aplicativo DAVID (Texto tomado de la fuente).spa
dc.description.abstractBreast cancer is a very heterogeneous disease in which several diagnostic and treatment subtypes have been developed, which is why there is no infallible statistical method when it comes to characterizing the transcriptomic profile of patients suffering from this disease. Among the known subtypes is triple negative breast cancer, which mainly affects women of African or Latin descent and is characterized by not showing signals in the three receptors that allow the diagnosis of the disease. The complexity of this subtype of cancer, added to the fact that Colombia is diverse and there are many women with a genetic predisposition, where in the country more and more genomic sets are generated every day that have multidimensionality and these are studied mainly by people without statistical training, from areas such as biology, clinical and medicine, among others, were the factors that motivated the present study in which a simple and intuitive statistical methodology will be addressed, which can relate clinical information to a set of genes. The main objective was to determine the most informative genes for the characterization of patients in a small sample of Colombian patients with multidimensionality. Once selected, their relationship with clinical variables and their ability to classify samples appropriately based on clinical diagnosis were evaluated. For this purpose, methods such as RGCCA, DESeq2, Random Forest and the limma applications in R, based on linear models and Bayesian estimates were used. Finally, more information was sought to identify their relationship with the disease in DAVID app.eng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagister en Ciencias - Estadísticaspa
dc.format.extentxv, 101 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/86849
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeBogotá, Colombiaspa
dc.publisher.programBogotá - Ciencias - Maestría en Ciencias - Estadísticaspa
dc.relation.referencesAmerican Joint Committee on Cancer, . (2010). AJCC Cancer Staging Manual, Seventh Edition, p. 347–369. Springer.spa
dc.relation.referencesAnders, S. y Huber, W. (2010). Differential expression analysis for sequence count data. Genome Biology, 11(106).spa
dc.relation.referencesAronow, B. J., Richardson, B. D., y Handwerger, S. (2001). Microarray analysis of trophoblast differentiation: gene expression reprogramming in key gene function categories. Physiological Genomics, 6(2):105–116.spa
dc.relation.referencesAsamblea Nacional Constituyente, . (1991). Constitución política de Colombia.spa
dc.relation.referencesAyodeji, S., Bao, B., Teslow, E. A., Polin, L. A., Dyson, G., Bollig-Fischer, A., y Fehl, C. (2022). Hyperglycemic o-glcnac transferase activity drives cancer stem cell induction in TNBC.spa
dc.relation.referencesBauer, K. R., Brown, M., Cress, R. D., Parise, C. A., y Caggiano, V. (2007). Descriptive analysis of estrogen receptor (ER)-negative, progesterone receptor (PR)-negative, and HER2-negative invasive breast cancer, the so-called triplenegative phenotype. Cancer, 109(9):1721–1728.spa
dc.relation.referencesBenjamini, Y. y Hochberg, Y. (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. R Stat Soc Ser B Methodol, 57(1):289–300.spa
dc.relation.referencesBorisov, N., Sorokin, M., Tkachev, V., Garazha, A., y Buzdin, A. (2020). Cancer gene expression profiles associated with clinical outcomes to chemotherapy treatments. BMC Medical Genomics, 13(S8).spa
dc.relation.referencesBreastCancer.org (2022). Prueba de firma genética para el pronóstico de cáncer de mama prosigna. BreastCancer.org https://www.breastcancer.org/es/pruebasdeteccion/prueba-prosigna.spa
dc.relation.referencesBreiman, L. (2001). Random forests. Machine Learning, 45(1):5–32.spa
dc.relation.referencesBreiman, L., Friedman, J., Stone, C. J., y Olshen, R. A. (1984). Classification and regression trees. CRC Press.spa
dc.relation.referencesBrent, R. (1973). Algorithms for minimization without derivatives. Prentice-Hall.spa
dc.relation.referencesChiu, A. M., Mitra, M., Boymoushakian, L., y Coller, H. A. (2018). Integrative analysis of the inter-tumoral heterogeneity of triple-negative breast cancer. Scientific Reports, 8(1).spa
dc.relation.referencesCohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychological Measurement, 20(1):37–46.spa
dc.relation.referencesDANE (2018). Encuesta calidad de vida 2018. Departamento Administrativo Nacional de Estadística.spa
dc.relation.referencesDatta, S. y Nettleton, D. (2014). Statistical analysis of Next Generation Sequencing Data. Springer.spa
dc.relation.referencesGu, Z., Liu, J., Cao, K., Zhang, J., y Wang, J. (2012). Centrality-based pathway enrichment: a systematic approach for finding significant pathways dominated by key genes. BMC Systems Biology, 6(1).spa
dc.relation.referencesHäberle, L., Hein, A., Rübner, M., Schneider, M., Ekici, A., Gass, P., Hartmann, A., Schulz-Wendtland, R., Beckmann, M., Lo, W.-Y., Schroth, W., Brauch, H., Fasching, P., y Wunderle, M. (2017). Predicting triple-negative breast cancer subtype using multiple single nucleotide polymorphisms for breast cancer risk and several variable selection methods. Geburtshilfe und Frauenheilkunde, 77(06):667–678.spa
dc.relation.referencesHarbeck, N., Penault-Llorca, F., Cortes, J., Gnant, M., Houssami, N., Poortmans, P., Ruddy, K., Tsang, J., y Cardoso, F. (2019). Breast cancer. Nature Reviews Disease Primers, 5(66).spa
dc.relation.referencesHoward, J., Goh, C. Y., Gorzel, K. W., Higgins, M., y McCann, A. (2022). The potential role of cofilin-1 in promoting triple negative breast cancer (TNBC) metastasis via the extracellular vesicles (evs). Translational Oncology, 15(1):101247.spa
dc.relation.referencesInstituto Nacional de Cancerología, . (2020). Base de datos de pacientes de cáncer de mama triple negativo.spa
dc.relation.referencesIvanov, S. V., Panaccione, A., Nonaka, D., Prasad, M. L., Boyd, K. L., Brown, B., Guo, Y., Sewell, A., y Yarbrough, W. G. (2013). Diagnostic sox10 gene signatures in salivary adenoid cystic and breast basal-like carcinomas. British Journal of Cancer, 109(2):444–451.spa
dc.relation.referencesLehmann, B. D., Jovanović, B., Chen, X., Estrada, M. V., Johnson, K. N., Shyr, Y., Moses, H. L., Sanders, M. E., y Pietenpol, J. A. (2016). Refinement of triple-negative breast cancer molecular subtypes: Implications for neoadjuvant chemotherapy selection. PLOS ONE, 11(6):e0157368.spa
dc.relation.referencesLeming., S. (2010). Maqc-ii project: human breast cancer (br) data set. National Center for Biotechnology Information https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE20194.spa
dc.relation.referencesLloyd, S. (1982). Least squares quantization in PCM. IEEE Transactions on Information Theory, 28(2):129–137.spa
dc.relation.referencesLove, M., Huber, W., y Anders, S. (2014). Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology, 15(1):550.spa
dc.relation.referencesLv, X., He, M., Zhao, Y., Zhang, L., Zhu, W., Jiang, L., Yan, Y., Fan, Y., Zhao, H., Zhou, S., Ma, H., Sun, Y., Li, X., Xu, H., y Wei, M. (2019). Identification of potential key genes and pathways predicting pathogenesis and prognosis for triple-negative breast cancer. Cancer Cell International, 19(1).spa
dc.relation.referencesLópez Kleine, L. (2012). Estadística genómica orientada a la predicción funcional de proteínas. Universidad Nacional de Colombia, Serie: Aplicaciones en Bioestadística.spa
dc.relation.referencesMedina, E. A. y Espinosa, F. (2009). Microarreglos: Tecnología con aplicaciones en el campo de la salud humana. Alergia, Asma e Inmunología Pediátricas, 18(2):52–59.spa
dc.relation.referencesMedina-Merino, R. F. y Ñique Chacón, C. I. (2017). Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python. Interfases, 10(1):165–189.spa
dc.relation.referencesNational Human Genome Research Institute, . (2011). Terminación del proyecto genoma humano: Preguntas más frecuentes.spa
dc.relation.referencesNational Institutes of Health, . (2023). David functional annotation bioinformatics microarray analysis. https://david.ncifcrf.gov/home.jsp.spa
dc.relation.referencesOrtiz Casas, B. (2019). Microarreglos (microarrays): Conceptos básicos. [Archivo de video]. Youtube. https://www.youtube.com/watch?v=16V1q4nctdg&ab_channel=SFPIEUV.spa
dc.relation.referencesOzerov, I. V., Lezhnina, K. V., Izumchenko, E., Artemov, A. V., Medintsev, S., Vanhaelen, Q., Aliper, A., Vijg, J., Osipov, A. N., Labat, I., West, M. D., Buzdin, A., Cantor, C. R., Nikolsky, Y., Borisov, N., Irincheeva, I., Khokhlovich, E., Sidransky, D., Camargo, M. L., y Zhavoronkov, A. (2016). In silico pathway activation network decomposition analysis (ipanda) as a method for biomarker development. Nature Communications, 7(1).spa
dc.relation.referencesPardo, C. E. y Cabarcas, G. (2001). Métodos estadísticos multivariados en investigación social. Simposio de estadística, 13.spa
dc.relation.referencesPerou, C. M., Sørlie, T., Eisen, M. B., van de Rijn, M., Jeffrey, S. S., Rees, C. A., Pollack, J. R., Ross, D. T., Johnsen, H., Akslen, L. A., Fluge, Ø., Pergamenschikov, A., Williams, C., Zhu, S. X., Lønning, P. E., Børresen-Dale, A.-L., Brown, P. O., y Botstein, D. (2000). Molecular portraits of human breast tumours. Nature, 406(6797):747–752.spa
dc.relation.referencesPeña, D. (2002). Análisis de Datos Multivariantes. McGraw-Hill.spa
dc.relation.referencesPhipson, B., Lee, S., Majewski, I. J., Alexander, W. S., y Smyth, G. K. (2016). Robust hyperparameter estimation protects against hypervariable genes and improves power to detect differential expression. The Annals of Applied Statistics, 10(2).spa
dc.relation.referencesPopielarski, M., Ponamarczuk, H., Stasiak, M., Wata la, C., y Światkowska, M. (2019). Modifications of disulfide bonds in breast cancer cell migration and invasiveness. American Journal of Cancer Research, 8.spa
dc.relation.referencesPrado-Vázquez, G., Gámez-Pozo, A., Trilla-Fuertes, L., Arevalillo, J. M., Zapater-Moros, A., Ferrer-Gómez, M., Díaz-Almirón, M., López-Vacas, R., Navarro, H., Maín, P., Feliú, J., Zamora, P., Espinosa, E., y Vara, J. Á. F. (2019). A novel approach to triple-negative breast cancer molecular classification reveals a luminal immune-positive subgroup with good prognoses. Scientific Reports, 9(1538).spa
dc.relation.referencesRitchie, M. E., Phipson, B., Wu, D., Hu, Y., Law, C. W., Shi, W., y Smyth, G. K. (2015). limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research, 43(7):e47–e47.spa
dc.relation.referencesRodríguez Castro, D. C. (2017). Clasificación no lineal para datos de conteo: aplicación a datos de expresión de secuenciación de RNA. [Tesis de Maestría, Universidad Nacional de Colombia]. https://repositorio.unal.edu.co/handle/unal/62187.spa
dc.relation.referencesSchäfer, J. y Strimmer, K. (2005). A shrinkage approach to large-scale covariance matrix estimation and implications for functional genomics. Statistical Applications in Genetics and Molecular Biology, 4(1).spa
dc.relation.referencesSimon, R. M., Korn, E. L., McShane, L. M., Radmacher, M. D., Wright, G. W., y Zhao, Y. (2003). Design and analysis of DNA microarray investigations. Springer.spa
dc.relation.referencesSmyth, G. K. (2004). Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology, 3(1):1–25.spa
dc.relation.referencesStatQuest with Josh Stamer, . (2017). Statquest: A gentle introduction to RNA-seq. [Archivo de video]. Youtube. https://www.youtube.com/watch?v=tlf6wYJrwKY&ab_channel=StatQuestwithJoshStarmer.spa
dc.relation.referencesTenenhaus, A. y Tenenhaus, M. (2011). Regularized generalized canonical correlation analysis. Psychometrika, 76(2):257–284.spa
dc.relation.referencesvan den Elsen, J. M. (2001). Structure of golgi alpha-mannosidase ii: a target for inhibition of growth and metastasis of cancer cells. The EMBO Journal, 20(12):3008–3017.spa
dc.relation.referencesWalker-Smith, T. L. y Peck, J. (2019). Genetic and genomic advances in breast cancer diagnosis and treatment. Nursing for Women’s Health, 23(6):518–525.spa
dc.relation.referencesWang, M., Law, M. E., Davis, B. J., Yaaghubi, E., Ghilardi, A. F., Ferreira, R. B., Chiang, C.-W., Guryanova, O. A., Kopinke, D., Heldermon, C. D., Castellano, R. K., y Law, B. K. (2019). Disulfide bond-disrupting agents activate the tumor necrosis family-related apoptosis-inducing ligand/death receptor 5 pathway. Cell Death Discovery, 5(1).spa
dc.relation.referencesWinship Cancer Institute, . (s.f.). Genes del cáncer. cancer quest, Emory University.spa
dc.relation.referencesYan, C., Hu, J., Yang, Y., Hu, H., Zhou, D., Ma, M., y Xu, N. (2019). Plasma extracellular vesicle-packaged micrornas as candidate diagnostic biomarkers for early-stage breast cancer. Molecular Medicine Reports.spa
dc.relation.referencesZaharia, M. y Gómez, H. (2014). Cáncer de mama triple negativo: una enfermedad de difícil diagnóstico y tratamiento. Revista Peruana de Medicina Experimental y Salud Pública, 30(4):649–656.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc510 - Matemáticas::511 - Principios generales de las matemáticasspa
dc.subject.ddc510 - Matemáticas::519 - Probabilidades y matemáticas aplicadasspa
dc.subject.ddc610 - Medicina y saludspa
dc.subject.decsModels, Statisticaleng
dc.subject.decsClasificación Internacional de Enfermedadesspa
dc.subject.decsInternational Classification of Diseaseseng
dc.subject.decsEstadísticas de Saludspa
dc.subject.decsHealth Statisticseng
dc.subject.decsModelos Estadísticosspa
dc.subject.proposalCáncer de mamaspa
dc.subject.proposalCaracterizaciónspa
dc.subject.proposalClasificaciónspa
dc.subject.proposalDatos genómicosspa
dc.subject.proposalGenesspa
dc.subject.proposalMultidimensionalidadspa
dc.subject.proposalBreast cancereng
dc.subject.proposalCharacterizationeng
dc.subject.proposalClassificationeng
dc.subject.proposalGenomic dataeng
dc.subject.proposalGeneseng
dc.subject.proposalMultidimensionalityeng
dc.titleCaracterización del perfil de transcripción génico en pacientes de cáncer de mama triple negativo en Colombiaspa
dc.title.translatedCharacterization of the gene transcription profile in patients with triple negative breast cancer in Colombiaeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentEstudiantesspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentMaestrosspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1032481681.2024.pdf
Tamaño:
14.61 MB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de Maestría en Ciencias - Estadística

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: