Identificación de factores a mejorar para aumentar la recomendación, análisis de NPS para clientes neutros a partir de procesamiento de lenguaje natural

dc.contributor.advisorOspina Arango, Juan David
dc.contributor.authorAgudelo Restrepo, Leydi
dc.date.accessioned2022-06-17T14:55:39Z
dc.date.available2022-06-17T14:55:39Z
dc.date.issued2022
dc.descriptionilustraciones, diagramas, tablasspa
dc.description.abstractEste trabajo presenta una metodología para identificación de factores a mejorar para aumentar la intención de recomendación de los clientes de una entidad financiera. Se utilizaron 7.000 verbatims de los clientes clasificados como neutros en la encuesta net promoter score, que corresponden a la información de los años 2019, 2020 y 2021. Se realizó procesamiento de esta información para obtener un corpus estructurado que representa el contenido de todos los verbatims. Se aplicó análisis de sentimientos con el objetivo de analizar los sentimientos subyacentes en los verbatims de los clientes, el cual permitió concluir que en cada uno de los años analizados más de un 80% de los clientes tenían un sentimiento negativo asociado a su verbatim. Se entrenaron diferentes algoritmos con la intención de encontrar los temas más relevantes para los clientes, los modelos entrenados fueron, asignación latente de dirichlet, indexación semántica latente y factorización de matriz no negativa, los modelos fueron evaluados utilizando el enfoque de la maximización de la coherencia, combinado con juicio humano para validar los tópicos en el contexto del negocio. Entre los modelos entrenados el que mejores resultados arrojó fue la asignación latente de dirichlet, alcanzando la coherencia máxima para dos tópicos, los cuáles fueron caracterizados como costos y servicio en los canales de atención. Combinando el resultado del modelado de tópicos con el análisis de sentimientos, se descubrió que el sentimiento que predomina por parte de los clientes en los dos tópicos es negativo, y para algunos casos es positivo o neutro. (Texto tomado de la fuente)spa
dc.description.abstractThis paper presents a methodology for identifying factors to be improved in order to increase the recommendation intention of customers of a financial institution. We used 7,000 verbatims from customers classified as neutral in the net promoter score survey, corresponding to information from the years 2019, 2020 and 2021. This information was processed to obtain a structured corpus representing the content of all verbatims. Sentiment analysis was applied with the objective of analyzing the underlying sentiments in the customer verbatim, which allowed concluding that in each of the years analyzed more than 80% of the clients had a negative sentiment associated with their verbatim. Different algorithms were trained with the intention of finding the most relevant topics for the customers, the trained models were, latent dirichlet assignment, latent semantic indexing and non-negative matrix factorization, the models were evaluated using the coherence maximization approach, combined with human judgment to validate the topics in the context of the business. Among the trained models, the one that yielded the best results was the latent dirichlet assignment, reaching the maximum coherence for two topics, which were characterized as costs and service in the service channels. Combining the results of the topic modeling with the sentiment analysis, it was found that the predominant customer sentiment for the two topics is negative, and for some cases it’s positive or neutral.eng
dc.description.curricularareaÁrea Curricular de Ingeniería de Sistemas e Informáticaspa
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagister en Ingeniería Analíticaspa
dc.description.researchareaProcesamiento de Lenguaje Naturalspa
dc.format.extent70 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/81608
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellínspa
dc.publisher.departmentDepartamento de la Computación y la Decisiónspa
dc.publisher.facultyFacultad de Minasspa
dc.publisher.placeMedellín, Colombiaspa
dc.publisher.programMedellín - Minas - Maestría en Ingeniería - Analíticaspa
dc.relation.referencesAthanasiou, V., & Maragoudakis, M. (2017). A novel, gradient boosting framework for sentiment analysis in languages where NLP resources are not plentiful: a case study for modern Greek. Algorithms, 10(1), 34.spa
dc.relation.referencesAziz, A. A., & Starkey, A. (2019). Predicting supervise machine learning performances for sentiment analysis using contextual-based approaches. IEEE Access, 8, 17722-17733.spa
dc.relation.referencesAnderson, E. W., Fornell, C., & Lehmann, D. R. (1994). Customer satisfaction, market share, and profitability: Findings from Sweden. Journal of marketing, 58(3), 53-66.spa
dc.relation.referencesBaviera, T. (2017). Técnicas para el análisis del sentimiento en Twitter: Aprendizaje Automático Supervisado y SentiStrength. Dígitos, 1(3), 33-50.spa
dc.relation.referencesBird S, Klein E, y Loper E, (2009), Natural Language Processing with Python, Estados Unidos de América, O’Reilly Medía.spa
dc.relation.referencesCheng, M., & Jin, X. (2019). What do Airbnb users care about? An analysis of online review comments. International Journal of Hospitality Management, 76, 58-70.spa
dc.relation.referencesChiruzzo, L., Rosá, A., & Etcheverry, M. (2020). Análisis de Sentimiento para Tweets en Español: Algunos Experimentos con Foco en los Tweets Neutros. Procesamiento del lenguaje natural, (64), 109-116.spa
dc.relation.referencesDe la Torre, J., & del Consuelo, M. (2017). Nuevas técnicas de minería de textos: Aplicaciones (Doctoral dissertation, Universidad de Granada).spa
dc.relation.referencesFeng, L., & Wei, W. (2020). A Combined Method of r-NPS and t-NPS Evaluations for Identification of Negative Triggers of Detractors’ Experience. Sustainability, 12(4), 1652.spa
dc.relation.referencesFernández, J., Boldrini, E., Gómez, J. M., & Martínez-Barco, P. (2011). Análisis de Sentimientos y Minería de Opiniones: el corpus EmotiBlog. Procesamiento del lenguaje natural, 47, 179-187.spa
dc.relation.referencesFernández, J., Gutiérrez, Y., Gómez, J. M., Martínez-Barco, P., Montoyo, A., Munoz, R. (2013). Sentiment analysis of spanish tweets using a ranking algorithm and skipgrams.spa
dc.relation.referencesFisher, N. I., & Kordupleski, R. E. (2018). What is Wrong with Net Promoter Score. arXiv preprint arXiv:1806.10452.spa
dc.relation.referencesFodeh, S. J., Al-Garadi, M., Elsankary, O., Perrone, J., Becker, W., & Sarker, A. (2020). Utilizing a multi-class classification approach to detect therapeutic and recreational misuse of opioids on Twitter. Computers in Biology and Medicine, 104132.spa
dc.relation.referencesGelbukh, A. (2010). Procesamiento de lenguaje natural y sus aplicaciones. Komputer Sapiens, 1, 6-11.spa
dc.relation.referencesHenríquez, C., Pla, F., Hurtado, L. F., & Guzmán, J. (2017). Análisis de sentimientos a nivel de aspecto usando ontologías y aprendizaje automático. Procesamiento del Lenguaje Natural, (59), 49-56.spa
dc.relation.referencesHernández, M. B., & Gómez, J. M. (2013). Aplicaciones de procesamiento de lenguaje natural. Revista Politécnica, 32spa
dc.relation.referencesKorenius, T., Laurikkala, J., Järvelin, K., & Juhola, M. (2004, November). Stemming and lemmatization in the clustering of finnish text documents. In Proceedings of the thirteenth ACM international conference on Information and knowledge management (pp. 625-633).spa
dc.relation.referencesKumar, S., & Zymbler, M. (2019). A machine learning approach to analyze customer satisfaction from airline tweets. Journal of Big Data, 6(1), 1-16.spa
dc.relation.referencesMandal, P. C. (2014). Net promoter score: a conceptual analysis. International Journal of Management Concepts and Philosophy, 8(4), 209-219.spa
dc.relation.referencesMariñelarena-Dondena, L., Errecalde, M. L., & Solano, A. C. (2017). Extracción de conocimiento con técnicas de minería de textos aplicadas a la psicología. Revista Argentina de Ciencias del Comportamiento, 9(2), 65-76.spa
dc.relation.referencesMariñelarena-Dondena, L., Ferretti, E., Maragoudakis, M., Sapino, M., & Errecalde, M. L. (2017). Predicting depression: a comparative study of machine learning approaches based on language usage. Cuadernos de Neuropsicología/Panamerican Journal of Neuropsychology, 11(3).spa
dc.relation.referencesMedina-Merodio, J. A., Pablos-Heredero, C. D., Jiménez-Rodríguez, M. L., Marcos-Ortega, L. D., Barchino-Plata, R., Rodríguez-García, D., & Gómez-Aguado, D. (2014). Analysis of customer satisfaction using surveys with open questions. Dyna, 81(188), 92-99.spa
dc.relation.referencesMelnic, E. L. (2016). Techniques for measuring customers' satisfaction in Banks. Bulletin of the Transilvania University of Brasov. Economic Sciences. Series V, 9(1), 23.spa
dc.relation.referencesMesa Reyes, J. G. (2016). Procesamiento de lenguaje natural y su aplicación en servicios de hostelería.spa
dc.relation.referencesMoorthi, Y. L. R., & Mohan, B. C. (2017). Brand value proposition for bank customers in India. International Journal of Bank Marketing.spa
dc.relation.referencesMousavi, S. M., & Amiri Aghdaie, S. F. (2021). Identifying the Constructive Elements of “Value Proposition” and their Impact on Customers’ Satisfaction using Sentiment Analysis based on Text Mining. Journal of Business Management, 12(4), 1092-1116.spa
dc.relation.referencesMu, R., Zheng, Y., Zhang, K., & Zhang, Y. (2021). Research on Customer Satisfaction Based on Multidimensional Analysis. International Journal of Computational Intelligence Systems, 14(1), 605-616.spa
dc.relation.referencesMuktafin, E. H. (2021). Sentiments analysis of customer satisfaction in public services using K-nearest neighbors algorithm and natural language processing approach. Telkomnika, 19(1), 146-154.spa
dc.relation.referencesNazari, M., Shah Hosseini, M. A., & Tabatabaie Kalejahi, S. V. (2014). Impact of price perception factors on customer and price acceptance (Case study: MTN Irancell Company). Journal of Business Management, 6(3), 647-664.spa
dc.relation.referencesParedes-Valverde, M. A., Colomo-Palacios, R., Salas-Zárate, M. D. P., & Valencia-García, R. (2017). Sentiment analysis in Spanish for improvement of products and services: a deep learning approach. Scientific Programming, 2017.spa
dc.relation.referencesPark, J. (2020). Framework for sentiment-driven evaluation of customer satisfaction with cosmetics brands. IEEE Access, 8, 98526-98538.spa
dc.relation.referencesPark, M., McDonald, D., & Cha, M. (2013, June). Perception differences between the depressed and non-depressed users in twitter. In Proceedings of the International AAAI Conference on Web and Social Media (Vol. 7, No. 1).spa
dc.relation.referencesPérez, D., Alfonseca, E., Rodriguez, P., Gliozzo, A., Strapparava, C., & Magnini, B. (2005). About the effects of combining latent semantic analysis with natural language processing techniques for free-text assessment. Revista signos, 38(59), 325-343.spa
dc.relation.referencesReichheld, Frederick F. (diciembre 2003). “One Number You Need to Grow”. Harvard Business Review.spa
dc.relation.referencesRiaz, S., Fatima, M., Kamran, M., & Nisar, M. W. (2019). Opinion mining on large scale data using sentiment analysis and k-means clustering. Cluster Computing, 22(3), 7149-7164.spa
dc.relation.referencesSun, S., Luo, C., & Chen, J. (2017). A review of natural language processing techniques for opinion mining systems. Information fusion, 36, 10-25.spa
dc.relation.referencesTao, Y., Zhang, F., Shi, C., & Chen, Y. (2019). Social media data-based sentiment analysis of tourists’ air quality perceptions. Sustainability, 11(18), 5070.spa
dc.relation.referencesTarnowska, K. A., & Ras, Z. (2021). NLP-Based Customer Loyalty Improvement Recommender System (CLIRS2). Big Data and Cognitive Computing, 5(1), 4.spa
dc.relation.referencesVallez, M., & Pedraza, R. (2007). El Procesamiento del Lenguaje Natural en la Recuperación de Información Textual y áreas afines. Hipertext. net.spa
dc.relation.referencesVillagra, A., Guzmán, A., Pandolfi, D., & Leguizamón, G. (2009). Análisis de medidas no-supervisadas de calidad en clusters obtenidos por K-means y Particle Swarm Optimization. Ciencia y Tecnología.spa
dc.relation.referencesWijngaards, I., Burger, M., & van Exel, J. (2020). Correction: The promise of open survey questions—The validation of text-based job satisfaction measures. Plos one, 15(7), e0236900.spa
dc.relation.referencesZainuddin, N., & Selamat, A. (2014, September). Sentiment analysis using support vector machine. In 2014 international conference on computer, communications, and control technology (I4CT) (pp. 333-337). IEEE.spa
dc.relation.referencesCustomer.guru - Net Promoter Score for E-Shops and SaaS [En línea] https://customer.guru/ [último acceso: 22 Febrero 2022]spa
dc.relation.referencesJ. Chuang, CD Manning y J. Heer, Termite: Técnicas de visualización para evaluar modelos de temas textuales (2012), Departamento de Ciencias de la Computación de la Universidad de Stanfordspa
dc.relation.referencesJ. Chang et al, Lectura de hojas de té: cómo los humanos interpretan los modelos temáticos (2009), Sistemas de procesamiento de información neuronalspa
dc.relation.referencesRobertson, A. M., & Willett, P. (1998). Applications of n‐grams in textual information systems. Journal of Documentation.spa
dc.relation.referencesWelte, W. (1985). Lingüística moderna, terminología y bibliografía (Vol. 5). Gredos.spa
dc.relation.referencesRisch, J. (2016). Detecting Twitter topics using latent Dirichlet allocation.spa
dc.relation.referencesBlei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993-1022.spa
dc.relation.referencesHammoe, L. (2018). Detección de tópicos: utilizando el modelo LDA.spa
dc.relation.referencesVenegas, V. (2003). Análisis Semántico Latente: una panorámica de su desarrollo. Revista signos, 36(53), 121-138.spa
dc.relation.referencesVásquez, A. C. (2017). Clasificación de textos informáticos mediante indexación semántica latente. Perfiles de Ingeniería, 13(13), 109-122.spa
dc.relation.referencesLee, D. D., & Seung, H. S. (1999). Learning the parts of objects by non-negative matrix factorization. Nature, 401(6755), 788-791.spa
dc.relation.referencesVelásquez García, L. E. (2021). Modelamiento de tópicos aplicados al estudio de ataques de Ingeniería social (Bachelor's thesis, Quito, 2021).spa
dc.relation.referencesYan, X., Guo, J., Lan, Y., & Cheng, X. (2013, May). A biterm topic model for short texts. In Proceedings of the 22nd international conference on World Wide Web (pp. 1445-1456).spa
dc.relation.referencesHamzeian, D. (2021). Using Machine Learning Algorithms for Finding the Topics of COVID-19 Open Research Dataset Automatically (Master's thesis, University of Waterloo).spa
dc.relation.referencesMimno, D., Wallach, H., Talley, E., Leenders, M., & McCallum, A. (2011, July). Optimizing semantic coherence in topic models. In Proceedings of the 2011 conference on empirical methods in natural language processing (pp. 262-272).spa
dc.relation.referencesNewman, D., Chemudugunta, C., & Smyth, P. (2006, August). Statistical entity-topic models. InProceedings of the 12th ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 680-686).spa
dc.relation.referencesIpsos [En línea] https://www.ipsos.com/es-es/nosotros [último acceso: 22 Febrero 2022]spa
dc.relation.referencesSentiment-analysis-spanish. (2021, February 4). [En linea] https://pypi.org/project/sentiment-analysis-spanish/ [último acceso: 22 Febrero 2022]spa
dc.relation.referencesPang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends® in information retrieval, 2(1–2), 1-135.spa
dc.relation.referencesSaura, J. R., Reyes-Menendez, A., & Palos-Sanchez, P. (2019). Are black Friday deals worth it? Mining Twitter users’ sentiment and behavior response. Journal of Open Innovation: Technology, Market, and Complexity, 5(3), 58.spa
dc.relation.referencesArango Pastrana, C. A., & Osorio Andrade, C. F. (2021). Aislamiento social obligatorio: un análisis de sentimientos mediante machine learning. Suma de Negocios, 12(26), 1-13.spa
dc.relation.referencesGensim: topic modelling for humans [En línea] https://radimrehurek.com/gensim/ [último acceso: 22 Febrero 2022]spa
dc.relation.referencesscikit-learn: machine learning in Python — scikit-learn 1.0.2 documentation [En línea] https://scikit-learn.org/stable/ [último acceso: 22 Febrero 2022]spa
dc.relation.referencespyLDAvis — pyLDAvis 2.1.2 documentation [En línea] https://pyldavis.readthedocs.io/en/latest/readme.html [último acceso: 22 Febrero 2022]spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadoresspa
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::006 - Métodos especiales de computaciónspa
dc.subject.lembLenguajes naturalesspa
dc.subject.lembNatural languageseng
dc.subject.proposalProcesamiento de lenguaje naturalspa
dc.subject.proposalAnálisis de sentimientosspa
dc.subject.proposalModelado de tópicosspa
dc.subject.proposalAsignación latente de dirichletspa
dc.subject.proposalIndexación semántica latentespa
dc.subject.proposalFactorización de matriz no negativaspa
dc.subject.proposalNatural language processingeng
dc.subject.proposalSentiment analysiseng
dc.subject.proposalTopic modelingeng
dc.subject.proposalNet promoter scoreeng
dc.subject.proposalLatent dirichlet assignmenteng
dc.subject.proposalLatent semantic indexingeng
dc.subject.proposalNon-negative matrix factorizationeng
dc.titleIdentificación de factores a mejorar para aumentar la recomendación, análisis de NPS para clientes neutros a partir de procesamiento de lenguaje naturalspa
dc.title.translatedIdentification of factors to be improved to increase recommendation, NPS analysis for neutral customers based on natural language processingeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentEstudiantesspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentMaestrosspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1020475135.2022.pdf
Tamaño:
690.29 KB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería - Analítica

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.98 KB
Formato:
Item-specific license agreed upon to submission
Descripción: