Aplicación de técnicas de detección de temáticas emergentes para establecer prioridades de Investigación y Desarrollo en el área de Machine Learning
Director
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2023-05-28Resumen
La detección de temáticas emergentes es de gran relevancia para los equipos que se dedican a la Investigación y Desarrollo en Machine Learning, ya que les permite formular proyectos de investigación, generar nuevas oportunidades de negocio y aportar valor en términos de producto, tecnología y conocimiento. Sin embargo, estos equipos se enfrentan a varios obstáculos, como la rápida generación de información, la diversidad de fuentes de datos disponibles y la falta de implementaciones no comerciales escalables que permitan automatizar el análisis. Con el objetivo de abordar esta necesidad, se propone una discusión sobre las metodologías actuales para la detección de temáticas emergentes. Además, se presenta una propuesta metodológica que combina tres técnicas de procesamiento de lenguaje natural: el Clasificador de Ontología de Ciencias de la Computación, los mapas temáticos y BERTopic. Una vez establecida esta metodología, se aplica a textos de artículos científicos en el campo del Machine Learning, lo que permite obtener una lista de temas prioritarios. Finalmente, se realiza una discusión de los resultados, contrastándolos con los cambios estructurales dentro del área. Como resultado de este estudio, se logra identificar subáreas de investigación y temas específicos que se consideran emergentes en la actualidad. Se recomienda a los equipos de investigación aborden estos temas, ya que representan áreas de gran potencial y relevancia en el campo del Machine Learning. (Texto tomado de la fuente)Abstract
The emerging topics detection is of great relevance for research and development teams in Machine Learning, as it empowers them to formulate research projects, generate novel business prospects, and contribute value in terms of products, technologies, and knowledge. Nonetheless, these teams encounter diverse challenges including the swift information generation, the abundance of data sources, and the scarcity of scalable non- commercial implementations that facilitate automated analysis. To address this need, a discussion on current methodologies for detecting emerging topics is proposed. Additionally, a methodological proposal is presented, which combines three natural language processing techniques: Computer Science Ontology Classifier, thematic maps, and BERTopic. This methodology is applied to scientific articles in the Machine Learning domain, resulting in a prioritized inventory of topics. Lastly, a comprehensive discussion of the outcomes is conducted, contrasting them with the structural transformations occurring within the field. As a result of this study, specific research subareas and topics that are considered emerging in the present time are identified. It is recommended that research teams address these topics, as they represent areas of significant potential and relevance in the field of Machine Learning.Palabras clave
Descripción Física/Lógica/Digital
ilustraciones, diagramas
Colecciones
![Atribución-SinDerivadas 4.0 Internacional](/themes/Mirage2//images/creativecommons/cc-generic.png)