Generación de diagramas de clase y casos de uso a partir de historias de usuario utilizando procesamiento de lenguaje natural

dc.contributor.advisorCamargo Mendoza, Jorge Eliecer
dc.contributor.authorTovar Onofre, Miguel Ángel
dc.contributor.researchgroupUnsecurelab Cybersecurity Research Groupspa
dc.date.accessioned2023-03-29T19:54:54Z
dc.date.available2023-03-29T19:54:54Z
dc.date.issued2023
dc.descriptionilustracionesspa
dc.description.abstractEl presente trabajo busca el desarrollo de un modelo computacional para la generación de diagramas UML a partir de historias de usuario en español, por medio de la aplicación de patrones gramaticales y procesamiento de lenguaje natural. Como conjunto de datos se tomaron diferentes conjuntos de historias de usuario traducidas al español y sus correspondientes diagramas generados manualmente. Los patrones aplicados fueron construidos con base en reglas establecidas para este proceso en idioma inglés, las cuales fueron adaptadas al idioma español y con base en los componentes extraídos, se construyen los diagramas. La evaluación del modelo computacional indica que es capaz de detectar los componentes como clases y actores, alcanzando un recall de hasta 0.8 en algunos casos. Sin embargo, presenta problemas de precisión al momento de extraer sus atributos, métodos o casos de uso, llegando a presentar valores inferiores a 0.1 en algunos componentes. Finalmente el modelo establece una base para guiar a los diseñadores y/o analistas en la implementación de proyectos de software. (Texto tomado de la fuente)spa
dc.description.abstractThe present work seeks to develop a computational model for the generation of UML diagrams from Spanish user stories by means of the application of grammatical patterns and natural language processing. Different sets of user stories translated into Spanish and their corresponding manually generated diagrams were taken as a dataset. The applied patterns were constructed based on rules established for this process in English language, which were adapted to Spanish language and based on the extracted components, the diagrams were constructed. The evaluation of the computational model indicates that it is capable of detecting components such as classes and actors, reaching a recall of up to 0.8 in some cases. However, it presents precision problems when extracting attributes, methods or use cases, presenting values lower than 0.1 in some components. Finally, the model establishes a basis to guide designers and/or analysts in the implementation of software projects.eng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ingeniería - Ingeniería de Sistemas y Computaciónspa
dc.description.methodsPara este trabajo, se solicitó a estudiantes de carreras a fines a la ingeniería de software, el análisis de distintos grupos de historias de usuario en español y la posterior generación manual de los diagramas de clase y casos de uso a partir de dicho análisis. De manera paralela, se aplicó procesamiento de lenguaje natural sobre las distintas historias de usuario con el fin de obtener sus características (Tokens, lemmas, etiquetas PoS) y de este modo, obtener mayor información sobre sus estructuras. Posteriormente, se construyeron reglas de patrones para la extracción de componentes UML con base en trabajos previos y las reglas gramaticales del idioma español, las cuales fueron aplicadas sobre las diferentes historias de usuario para la detección de los distintos componentes de los diagramas a construir, de acuerdo a la estructura gramatical de las mismas. Una vez extraídos, los componentes son organizados en un archivo de texto, el cual es procesado por un generador automático de diagramas UML y de este modo, obtener los diagramas correspondientes a los diferentes grupos de historias de usuario. Para la evaluación de desempeño del modelo computacional, se realizó una comparación de los componentes encontrados de manera automática y los componentes obtenidos manualmente, teniendo en cuenta diferentes umbrales de similaridad entre los componentes para calcular la precisión, recall y F1 del modelo computacional, frente a la generación manual de diagramas UML partiendo de historias de usuario.spa
dc.description.researchareaIngeniería de Softwarespa
dc.format.extentxvi, 95 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/83672
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.placeBogotá,Colombiaspa
dc.publisher.programBogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computaciónspa
dc.relation.referencesA. Batool, Y. Motla, B. Hamid, S. Asghar, M. Mukhtar, and M. Ahmed, “Comparative study of traditional requirement engineering and agile requirement engineering,” pp. 1006–1014, 01 2013.spa
dc.relation.referencesH. Gomaa, “Software modeling and design: Uml, use cases, patterns, and software architectures,” Software Modeling and Design: UML, Use Cases, Patterns, and Software Architectures, pp. 1–550, 01 2011.spa
dc.relation.referencesJ. Rumbaugh, G. Booch, and I. Jacobson, The Unified Modeling Language Reference Manual. Addison-Wesley, 2010.spa
dc.relation.referencesR. Lee, Artificial Intelligence in Daily Life. 01 2020.spa
dc.relation.referencesC. Narawita and K. Vidanage, “Uml generator – use case and class diagram generation from text requirements,” International Journal on Advances in ICT for Emerging Regions (ICTer), vol. 10, p. 1, 01 2018.spa
dc.relation.referencesS. Vemuri, S. Chala, and M. Fathi, “Automated use case diagram generation from textual user requirement documents,” pp. 1–4, 04 2017.spa
dc.relation.referencesF. Gilson and C. Irwin, “From user stories to use case scenarios - towards a generative approach,” 12 2018.spa
dc.relation.referencesS. Nasiri, Y. Rhazali, M. Lahmer, and N. Chenfour, “Towards a generation of class diagram from user stories in agile methods,” Procedia Computer Science, vol. 170, pp. 831– 837, 01 2020.spa
dc.relation.referencesS. Nasiri, Y. Rhazali, M. Lahmer, and A. Adadi, “From user stories to uml diagrams driven by ontological and production model,” International Journal of Advanced Computer Science and Applications, vol. 12, 01 2021.spa
dc.relation.referencesA. M. Maatuk and E. A. Abdelnabi, “Generating uml use case and activity diagrams using nlp techniques and heuristics rules,” in International Conference on Data Science, E-Learning and Information Systems 2021, DATA’21, (New York, NY, USA), p. 271–277, Association for Computing Machinery, 2021.spa
dc.relation.referencesS. Ahmed, A. Ahmed, and N. U. Eisty, “Automatic transformation of natural to unified modeling language: A systematic review,” in 2022 IEEE/ACIS 20th International Conference on Software Engineering Research, Management and Applications (SERA), pp. 112–119, 2022.spa
dc.relation.referencesE. A. Abdelnabi, A. M. Maatuk, and M. Hagal, “Generating uml class diagram from natural language requirements: A survey of approaches and techniques,” in 2021 IEEE 1st International Maghreb Meeting of the Conference on Sciences and Techniques of Automatic Control and Computer Engineering MI-STA, pp. 288–293, 2021.spa
dc.relation.referencesM. H. Kassab, “The changing landscape of requirements engineering practices over the past decade,” 2015 IEEE Fifth International Workshop on Empirical Requirements Engineering (EmpiRE), pp. 1–8, 2015.spa
dc.relation.referencesI. K. Raharjana, D. Siahaan, and C. Fatichah, “User stories and natural language processing: A systematic literature review,” IEEE Access, vol. 9, pp. 53811–53826, 2021.spa
dc.relation.referencesG. Lucassen, F. Dalpiaz, J. M. Werf, and S. Brinkkemper, “The use and effectiveness of user stories in practice,” in Proceedings of the 22nd International Working Conference on Requirements Engineering: Foundation for Software Quality - Volume 9619, REFSQ 2016, (Berlin, Heidelberg), p. 205–222, Springer-Verlag, 2016.spa
dc.relation.referencesE. Btoush and M. Hammad, “Generating er diagrams from requirement specifications based on natural language processing,” International Journal of Database Theory and Application, vol. 8, pp. 61–70, 04 2015.spa
dc.relation.referencesE. Meryem, K. Nafil, and R. Touahni, “Automatic transformation of user stories into uml use case diagrams using nlp techniques,” Procedia Computer Science, vol. 130, pp. 42–49, 01 2018.spa
dc.relation.referencesA. Gupta, “Generation of multiple conceptual models from user stories in agile,” in REFSQ Workshops, 2019.spa
dc.relation.referencesY. Rigou, D. Lamontagne, and I. Khriss, “A sketch of a deep learning approach for discovering uml class diagrams from system’s textual specification,” 2020 1st International Conference on Innovative Research in Applied Science, Engineering and Technology (IRASET), pp. 1–6, 2020.spa
dc.relation.referencesT. Kochbati., S. Li., S. G´erard., and C. Mraidha., “From user stories to models: A machine learning empowered automation,” in Proceedings of the 9th International Conference on Model-Driven Engineering and Software Development - MODELSWARD,, pp. 28–40, INSTICC, SciTePress, 2021.spa
dc.relation.referencesF. Dalpiaz, “Requirements data sets (user stories),” 2018.spa
dc.relation.referencesF. Dalpiaz, A. Sturm, and P. Gieske, “Extraction of conceptual models: User stories vs. use cases,” 2020.spa
dc.relation.referencesA. N´ev´eol, H. Dalianis, S. Velupillai, G. Savova, and P. Zweigenbaum, “Clinical natural language processing in languages other than english: Opportunities and challenges,” Journal of biomedical semantics, vol. 9, p. 12, 03 2018.spa
dc.relation.referencesM. S. M. Suhaimin, M. H. A. Hijazi, R. Alfred, and F. Coenen, “Natural language processing based features for sarcasm detection: An investigation using bilingual social media texts,” in 2017 8th International Conference on Information Technology (ICIT), pp. 703–709, 2017.spa
dc.relation.referencesS. Elbasha, A. Elhawil, and N. Drawil, “Multilingual sentiment analysis to support business decision-making via machine learning models,” 12 2021.spa
dc.relation.referencesS. N. Group., “Stanza – a python nlp package for many human languages.” Accedido en 24-09-2022 a https://stanfordnlp.github.io/stanza/, 2020.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseReconocimiento 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/spa
dc.subject.lembIngeniería de la computación-enseñanzas, congresos, conferencias, etc.spa
dc.subject.lembComputer engineering - study and teaching - congresseseng
dc.subject.lembEstructura de datos (computadores)spa
dc.subject.lembData structure (computer science)eng
dc.subject.proposalReconocimiento de patronesspa
dc.subject.proposalUMLeng
dc.subject.proposalModelos computacionalesspa
dc.subject.proposalProcesamiento de lenguaje naturalspa
dc.subject.proposalAprendizaje de maquinaspa
dc.subject.proposalAnálisis de requerimientosspa
dc.subject.proposalHistorias de usuariospa
dc.subject.proposalPatterns recognitioneng
dc.subject.proposalComputational modelseng
dc.subject.proposalNatural language processingeng
dc.subject.proposalMachine learningeng
dc.subject.proposalRequirements analysiseng
dc.subject.proposalUser storieseng
dc.titleGeneración de diagramas de clase y casos de uso a partir de historias de usuario utilizando procesamiento de lenguaje naturalspa
dc.title.translatedGenerating class diagrams and use cases from user stories using natural language processingeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1016095600.2023.pdf
Tamaño:
2.29 MB
Formato:
Adobe Portable Document Format
Descripción:
Maestría en Ingeniería - Ingeniería de Sistemas y Computación

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: