Prototipo de modelo de aprendizaje automático para estimar la viabilidad de productos tecnológicos mediante la predicción de la satisfacción del consumidor

dc.contributor.advisorLeon Guzman, Elizabeth
dc.contributor.authorGonzález Díaz, Edgar Daniel
dc.contributor.orcidGonzález Díaz, Edgar Daniel [0009000947029859]
dc.contributor.orcidLeón Guzmán, Elizabeth [0009000434854976]
dc.contributor.researchgroupMidas: Grupo de Investigación en Minería de Datos
dc.date.accessioned2026-05-04T15:58:45Z
dc.date.available2026-05-04T15:58:45Z
dc.date.issued2025
dc.descriptionilustraciones a color, diagramasspa
dc.description.abstractEn este trabajo se propone y construye un prototipo de modelo predictor de viabilidad de productos tecnológicos, cuyo objetivo es transformar información textual estructurada en un indicador numérico. Este indicador es el resultado de la interpretación cuantitativa de la satisfacción del consumidor, expresada a través de reseñas de usuarios en el contexto del comercio electrónico, y está orientado a apoyar la planeación de productos tecnológicos, particularmente en etapas tempranas de análisis del entorno y caracterización del producto. El prototipo se fundamenta en un modelo de aprendizaje de máquina que analiza los componentes textuales presentes tanto en la información descriptiva de los productos como en las reseñas publicadas en línea, permitiendo estimar finalmente la satisfacción del consumidor como un indicador numérico. Como aproximaciones cuantificables para la construcción de este indicador, se emplean la calificación numérica otorgada por los usuarios y los votos de utilidad asociados a las reseñas. Para la construcción del prototipo, se inició con la adquisición de un conjunto de datos compuesto por información de productos y reseñas provenientes de la plataforma de comercio en línea Amazon. Sobre este conjunto se ejecutaron procesos de exploración, limpieza y transformación de datos para obtener un conjunto de entidades y atributos representativos de las percepciones de usuarios en internet. Por otro lado, a partir de las definiciones propuestas por diversos autores en el contexto del análisis de productos, se definió un conjunto de métricas que permiten la conversión de información semántica codificada en el indicador numérico propuesto. En función de la caracterización de dichas métricas objetivo, se construyó el prototipo de modelo de aprendizaje de máquina, el cual integra la codificación de información textual en vectores numéricos, la agrupación de productos similares para una comparación consistente de entidades y la selección de estrategias supervisadas y formuladas basadas en la calificación numérica de reseñas de usuario. Como resultado, el modelo seleccionado logró representar la viabilidad de un producto con un nivel de precisión de hasta 96%, de acuerdo con las interpretaciones de negocio analizadas. Finalmente, la estructura del prototipo fue seleccionada a partir de la evaluación de métricas de desempeño por modelo y la ejecución de flujos de validación manual. (Texto tomado de la fuente)spa
dc.description.abstractThis work proposes and develops a prototype of a predictive model for the viability of technological products, whose objective is to transform structured textual information into a numerical indicator. This indicator results from the quantitative interpretation of consumer satisfaction, expressed through user reviews in e-commerce contexts, and is intended to support technological product planning, particularly during early stages of environmental analysis and product characterization. The prototype is based on a machine learning model that analyzes textual components present in both product descriptions and online user reviews, ultimately enabling the estimation of consumer satisfaction as a numerical indicator. As quantifiable approximations for constructing this indicator, the model employs the numerical ratings assigned by users and the helpfulness votes associated with the reviews. For the construction of the prototype, a dataset composed of product information and reviews obtained from the Amazon e-commerce platform was collected. This dataset underwent exploration, cleaning, and transformation processes to derive a set of entities and attributes representative of user perceptions on the internet. Additionally, based on definitions proposed by various authors in the context of product analysis, a set of metrics was defined to enable the conversion of encoded semantic information into the proposed numerical indicator. According to the characterization of these target metrics, the machine learning prototype was constructed by integrating textual information encoding into numerical vectors, clustering of similar products to ensure consistent entity comparison, and the selection of supervised learning strategies formulated based on user review ratings. As a result, the selected model achieved up to 96% accuracy in representing product viability, according to the analyzed business interpretations. Finally, the structure of the prototype was determined based on the evaluation of performance metrics per model and the execution of manual validation workflows.eng
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería de Sistemas y Computación
dc.description.researchareaProcesamiento de lenguaje natural
dc.format.extent84 páginas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/89945
dc.language.isospa
dc.publisherUniversidad Nacional de Colombia
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotá
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.placeBogotá, Colombia
dc.publisher.programBogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación
dc.relation.referencesM. Cantamessa, V. Gatteschi, G. Perboli, y M. Rosano, “Startups’ Roads to Failure”, Sustainability, vol. 10, núm. 7, p. 2346, jul. 2018, doi: 10.3390/su10072346
dc.relation.referencesDeena, D. P. y Gupta, D. M., “A study on factors that contribute to the failure of startups”, International Journal of Aquatic Science, pp. 2634–2640, 2021
dc.relation.referencesU. Iyyaz Billah, “Reasons for failure of new products in the consumer goods industry”, Business Review, vol. 7, núm. 2, pp. 119–129, jul. 2012, doi: 10.54784/1990- 6587.1209
dc.relation.referencesA. Murray y V. Scuotto, “The Business Model Canvas”, Symphonya. Emerging Issues in Management, pp. 94–109, nov. 2016, doi: 10.4468/2015.3.13murray.scuotto
dc.relation.referencesP. Moessner, R. Haegle, L. Eiler, y K. Kloepfer, “Evaluate Market Potential of an Initial Product Concept With Jobs-to-Be-Done”, IEEE Eng. Manag. Rev., vol. 52, núm. 2, pp. 165–173, abr. 2024, doi: 10.1109/EMR.2024.3353618
dc.relation.referencesY. Hou, J. Li, Z. He, A. Yan, X. Chen, y J. McAuley, “Bridging Language and Items for Retrieval and Recommendation”, el 6 de marzo de 2024, arXiv: arXiv:2403.03952. doi: 10.48550/arXiv.2403.03952
dc.relation.referencesEggert, A., Thiesbrummel, C., y Deutscher, C., “Differential effects of product and service innovations on the financial performance of industrial firms”, Journal of Business Market Management, pp. 380–405, 2014
dc.relation.referencesS. A. Rijsdijk, E. J. Hultink, y A. Diamantopoulos, “Product intelligence: its conceptualization, measurement and impact on consumer satisfaction”, J. of the Acad. Mark. Sci., vol. 35, núm. 3, pp. 340–356, sep. 2007, doi: 10.1007/s11747-007-0040-6
dc.relation.referencesWirth, R. y Hipp, J., “CRISP-DM: Towards a standard process model for data mining”, en Proceedings of the 4th International Conference on Practical Applications of Knowledge Discovery and Data Mining, 2000
dc.relation.referencesD. Cer et al., “Universal Sentence Encoder”, el 12 de abril de 2018, arXiv: arXiv:1803.11175. doi: 10.48550/arXiv.1803.11175
dc.relation.referencesS. Karita et al., “A Comparative Study on Transformer vs RNN in Speech Applications”, en 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), dic. 2019, pp. 449–456. doi: 10.1109/ASRU46091.2019.9003750
dc.relation.referencesChaudhary, A., “Universal sentence encoder visually explained”, Amit Chaudhary Blog. Consultado: el 13 de septiembre de 2025. [En línea]. Disponible en: https://amitness.com/posts/universal-sentence-encoder/
dc.relation.referencesLinková, M. y Gurský, P., “Attributes extraction from product descriptions on e- shops”, en Proceedings of ITAT 2017, Hlavácová, J., 2017, pp. 23–26.70 Título de la tesis o trabajo de investigación
dc.relation.referencesS. Gallin y A. Portes, “Online shopping: How can algorithm performance expectancy enhance impulse buying?”, Journal of Retailing and Consumer Services, vol. 81, p. 103988, nov. 2024, doi: 10.1016/j.jretconser.2024.103988
dc.relation.referencesA. Chiche y B. Yitagesu, “Part of speech tagging: a systematic review of deep learning and machine learning approaches”, J Big Data, vol. 9, núm. 1, p. 10, ene. 2022, doi: 10.1186/s40537-022-00561-y
dc.relation.referencesS. V. Praveen, P. Gajjar, R. K. Ray, y A. Dutt, “Crafting clarity: Leveraging large language models to decode consumer reviews”, Journal of Retailing and Consumer Services, vol. 81, p. 103975, nov. 2024, doi: 10.1016/j.jretconser.2024.103975
dc.relation.referencesY. Wang, D. Y. Mo, y M. M. Tseng, “Mapping customer needs to design parameters in the front end of product design by applying deep learning”, CIRP Annals, vol. 67, núm. 1, pp. 145–148, 2018, doi: 10.1016/j.cirp.2018.04.018
dc.relation.referencesY. Jiao, Y. Yang, y H. Zhang, “Mapping High Dimensional Sparse Customer Requirements into Product Configurations”, IOP Conf. Ser.: Mater. Sci. Eng., vol. 261, p. 012022, oct. 2017, doi: 10.1088/1757-899X/261/1/012022
dc.relation.referencesY. Liu, Y. Wan, X. Shen, Z. Ye, y J. Wen, “Product Customer Satisfaction Measurement Based on Multiple Online Consumer Review Features”, Information, vol. 12, núm. 6, p. 234, may 2021, doi: 10.3390/info12060234
dc.relation.referencesEmilio, N., “What is Medallion architecture in a Data Lakehouse context?”
dc.relation.referencesR. Bandi, J. Amudhavel, y R. Karthik, “Machine Learning with PySpark - Review”, IJEECS, vol. 12, núm. 1, p. 102, oct. 2018, doi: 10.11591/ijeecs.v12.i1.pp102-106
dc.relation.referencesM. Abadi et al., “TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems”, el 16 de marzo de 2016, arXiv: arXiv:1603.04467. doi: 10.48550/arXiv.1603.04467
dc.relation.referencesTensorFlow, “TensorFlow Hub”, TensorFlow. Consultado: el 3 de noviembre de 2025. [En línea]. Disponible en: https://www.tensorflow.org/hub
dc.relation.referencesS. Mishra et al., “Principal Component Analysis”, Int. J. Livest. Res., p. 1, 2017, doi: 10.5455/ijlr.20170415115235
dc.relation.referencesO. Jafari, P. Maurya, P. Nagarkar, K. M. Islam, y C. Crushev, “A Survey on Locality Sensitive Hashing Algorithms and their Applications”, el 17 de febrero de 2021, arXiv: arXiv:2102.08942. doi: 10.48550/arXiv.2102.08942
dc.relation.referencesD. P. Kingma y J. Ba, “Adam: A Method for Stochastic Optimization”, el 30 de enero de 2017, arXiv: arXiv:1412.6980. doi: 10.48550/arXiv.1412.6980
dc.relation.referencesA. Mao, M. Mohri, y Y. Zhong, “Cross-Entropy Loss Functions: Theoretical Analysis and Applications”, el 20 de junio de 2023, arXiv: arXiv:2304.07288. doi: 10.48550/arXiv.2304.07288
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.licenseAtribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::006 - Métodos especiales de computación
dc.subject.lembAPRENDIZAJE AUTOMATICO (INTELIGENCIA ARTIFICIAL)spa
dc.subject.lembMachine learningeng
dc.subject.lembAPRENDIZAJE POR REFUERZO (APRENDIZAJE AUTOMATICO)spa
dc.subject.lembReinforcement learning (Machine learning)eng
dc.subject.lembESTUDIOS DE FACTIBILIDADspa
dc.subject.lembFeasibility studieseng
dc.subject.lembSATISFACCION DEL CONSUMIDORspa
dc.subject.lembConsumer satisfactioneng
dc.subject.lembPRONOSTICO DE LOS NEGOCIOSspa
dc.subject.lembBusiness forecastingeng
dc.subject.proposalComercio de productosspa
dc.subject.proposalIndicadores de satisfacción del clientespa
dc.subject.proposalViabilidad numérica de productosspa
dc.subject.proposalReseñas de usuariospa
dc.subject.proposalProduct commerceeng
dc.subject.proposalCustomer satisfaction indicatorseng
dc.subject.proposalNumerical product viabilityeng
dc.subject.proposalUser reviewseng
dc.titlePrototipo de modelo de aprendizaje automático para estimar la viabilidad de productos tecnológicos mediante la predicción de la satisfacción del consumidorspa
dc.title.translatedPrototype of machine learning model to estimate the viability of technological products through the prediction of consumer satisfactioneng
dc.typeTrabajo de grado - Maestría
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.contentImage
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dcterms.audience.professionaldevelopmentEstudiantes
dcterms.audience.professionaldevelopmentInvestigadores
dcterms.audience.professionaldevelopmentMaestros
dcterms.audience.professionaldevelopmentPúblico general
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1000833174.2026.pdf
Tamaño:
3.3 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería de Sistemas y Computación

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: