Análisis de la especialización temática de las revistas de Ingeniería pertenecientes a SciELO usando minería de texto
| dc.contributor.advisor | Velásquez Henao, Juan David | |
| dc.contributor.author | López Moreno, Ana María | |
| dc.contributor.cvlac | ||
| dc.contributor.orcid | Henao, Juan David [0000-000307831432] | |
| dc.date.accessioned | 2025-11-06T21:49:48Z | |
| dc.date.available | 2025-11-06T21:49:48Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | La minería de texto y las técnicas de análisis de redes se han consolidado como herramientas clave para el estudio de grandes volúmenes de información científica. En el contexto de las revistas de Ingeniería indexadas en SciELO, el análisis temático basado en coocurrencia de palabras clave permite identificar comunidades semánticas relevantes y mapear las áreas de especialización dentro del campo. A partir de un corpus compuesto por más de 15.000 artículos publicados entre 2015 y 2024, se construyó una red de coocurrencia semántica sobre la cual se aplicó el algoritmo Louvain. Este enfoque permitió detectar ocho clústeres temáticos dominantes, que reflejan líneas de investigación como biotecnología ambiental, inteligencia artificial, educación superior, materiales, cambio climático, optimización, salud pública y sostenibilidad. La evaluación de las comunidades temáticas se complementó con análisis de distribución por revista y año, mapas de correlación editorial y redes bibliométricas de citación, co-citación y acoplamiento, revelando patrones de afinidad intelectual entre publicaciones y núcleos editoriales convergentes. (texto tomado de la fuente) | spa |
| dc.description.abstract | Text mining and network analysis techniques have become essential tools for the study of large volumes of scientific information. In the context of Engineering journals indexed in SciELO, thematic analysis based on keyword co-occurrence enables the identification of meaningful semantic communities and the mapping of specialization areas within the field. Using a corpus of over 15,000 articles published between 2015 and 2024, a semantic co-occurrence network was constructed and the Louvain algorithm was applied. This approach allowed the detection of eight dominant thematic clusters, reflecting research areas such as environmental biotechnology, artificial intelligence, higher education, materials, climate change, optimization, public health, and sustainability. The evaluation of thematic communities was complemented by analyses of distribution by journal and year, editorial correlation maps, and bibliometric networks of citation, co-citation, and bibliographic coupling, revealing intellectual affinities between publications and convergent editorial profiles. | eng |
| dc.description.curriculararea | Estadística.Sede Medellín | |
| dc.description.degreelevel | Maestría | |
| dc.description.degreename | Maestría en Ciencias - Estadística | |
| dc.format.extent | 1 recurso en línea (56 páginas) | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Nacional de Colombia | spa |
| dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
| dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
| dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/89110 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Nacional de Colombia | |
| dc.publisher.branch | Universidad Nacional de Colombia - Sede Medellín | |
| dc.publisher.faculty | Facultad de Ciencias | |
| dc.publisher.place | Medellín, Colombia | |
| dc.publisher.program | Medellín - Ciencias - Maestría en Ciencias - Estadística | |
| dc.relation.references | Blondel, V. D., Guillaume, J. L., Lambiotte, R., & Lefebvre, E. (2008). Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, 2008(10), P10008. https://doi.org/10.1088/1742-5468/2008/10/P10008 | |
| dc.relation.references | Contreras Barrera, F. (2014). Aplicación de técnicas de minería de texto para la clasificación de documentos científicos. Universidad Nacional de Colombia. | |
| dc.relation.references | Gollapalli, S. D., & Mitra, P. (2014). Analyzing topical evolution in scientific literature using hierarchical clustering. Journal of Informetrics, 8(2), 336–352. | |
| dc.relation.references | Hernández Fernández, L. (2012). Manual de edición de revistas científicas. Universidad de La Habana. | |
| dc.relation.references | Lorensi Canto, F., Alperin, J. P., & Fischman, G. (2022). Cobertura de revistas latinoamericanas en Google Scholar Metrics y bases internacionales. Revista Latinoamericana de Bibliotecología, 48(2), 55–73. | |
| dc.relation.references | Miner, G., Elder, J., Hill, T., Nisbet, R., Delen, D., & Fast, A. (2012). Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications. Elsevier. | |
| dc.relation.references | Moher, D., Liberati, A., Tetzlaff, J., & Altman, D. G. (2009). Preferred Reporting Items for Systematic Reviews and Meta-Analyses: The PRISMA Statement. PLoS Medicine, 6(7), e1000097. | |
| dc.relation.references | Packer, A. L. (2016). The SciELO Open Access: a model for the Global South. Learned Publishing, 29(S1), 15–23. | |
| dc.relation.references | Shah, U., Jain, R., & Jain, V. (2003). Keyword-based clustering and classification of scientific documents. Proceedings of the IEEE International Conference on Data Mining (ICDM), 563–566. | |
| dc.relation.references | Téllez-Zenteno, J. F., Morales-Buenrostro, L. E., & Estañol, B. (2007). El factor de impacto y su importancia en la evaluación de las revistas científicas. Revista de Investigación Clínica, 59(1), 62–70. | |
| dc.relation.references | Vasen, F., & Vilchis, I. (2017). Clasificación de revistas científicas en América Latina: Tensiones entre la evaluación local y la visibilidad internacional. Revista CTS, 12(35), 49–70. | |
| dc.relation.references | Vélez-Cuartas, G., Lucio-Arias, D., & Leydesdorff, L. (2016). Regional and Global Science: Publications from Latin America and the Caribbean in the SciELO Citation Index and the Web of Science. El Profesional de la Información, 25(3), 396–405. | |
| dc.relation.references | Wang, X., & Chen, J. (2020). Topic modeling for thematic characterization of journals in social sciences. Scientometrics, 125(2), 1011–1035. | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.license | Reconocimiento 4.0 Internacional | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores | |
| dc.subject.ddc | 510 - Matemáticas::519 - Probabilidades y matemáticas aplicadas | |
| dc.subject.lemb | Minería de datos | |
| dc.subject.lemb | Bibliometría | |
| dc.subject.lemb | Evaluación de revistas | |
| dc.subject.lemb | Estudios metricos de la información | |
| dc.subject.proposal | Minería de texto | spa |
| dc.subject.proposal | Coocurrencia | spa |
| dc.subject.proposal | Bibliometría | spa |
| dc.subject.proposal | SciELO | spa |
| dc.subject.proposal | Agrupamiento temático | spa |
| dc.subject.proposal | Louvain | spa |
| dc.subject.proposal | CRISP-DM | spa |
| dc.title | Análisis de la especialización temática de las revistas de Ingeniería pertenecientes a SciELO usando minería de texto | spa |
| dc.title.translated | Analysis of thematic specialization in engineering Journals indexed in SciELO using text mining | eng |
| dc.type | Trabajo de grado - Maestría | |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dcterms.audience.professionaldevelopment | Estudiantes | |
| dcterms.audience.professionaldevelopment | Investigadores | |
| oaire.accessrights | http://purl.org/coar/access_right/c_abf2 |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Tesis de Maestría en Ciencias - Estadística.pdf
- Tamaño:
- 2.66 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 5.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:

