Prototipo de modelo de aprendizaje automático para estimar la viabilidad de productos tecnológicos mediante la predicción de la satisfacción del consumidor
| dc.contributor.advisor | Leon Guzman, Elizabeth | |
| dc.contributor.author | González Díaz, Edgar Daniel | |
| dc.contributor.orcid | González Díaz, Edgar Daniel [0009000947029859] | |
| dc.contributor.orcid | León Guzmán, Elizabeth [0009000434854976] | |
| dc.contributor.researchgroup | Midas: Grupo de Investigación en Minería de Datos | |
| dc.date.accessioned | 2026-05-04T15:58:45Z | |
| dc.date.available | 2026-05-04T15:58:45Z | |
| dc.date.issued | 2025 | |
| dc.description | ilustraciones a color, diagramas | spa |
| dc.description.abstract | En este trabajo se propone y construye un prototipo de modelo predictor de viabilidad de productos tecnológicos, cuyo objetivo es transformar información textual estructurada en un indicador numérico. Este indicador es el resultado de la interpretación cuantitativa de la satisfacción del consumidor, expresada a través de reseñas de usuarios en el contexto del comercio electrónico, y está orientado a apoyar la planeación de productos tecnológicos, particularmente en etapas tempranas de análisis del entorno y caracterización del producto. El prototipo se fundamenta en un modelo de aprendizaje de máquina que analiza los componentes textuales presentes tanto en la información descriptiva de los productos como en las reseñas publicadas en línea, permitiendo estimar finalmente la satisfacción del consumidor como un indicador numérico. Como aproximaciones cuantificables para la construcción de este indicador, se emplean la calificación numérica otorgada por los usuarios y los votos de utilidad asociados a las reseñas. Para la construcción del prototipo, se inició con la adquisición de un conjunto de datos compuesto por información de productos y reseñas provenientes de la plataforma de comercio en línea Amazon. Sobre este conjunto se ejecutaron procesos de exploración, limpieza y transformación de datos para obtener un conjunto de entidades y atributos representativos de las percepciones de usuarios en internet. Por otro lado, a partir de las definiciones propuestas por diversos autores en el contexto del análisis de productos, se definió un conjunto de métricas que permiten la conversión de información semántica codificada en el indicador numérico propuesto. En función de la caracterización de dichas métricas objetivo, se construyó el prototipo de modelo de aprendizaje de máquina, el cual integra la codificación de información textual en vectores numéricos, la agrupación de productos similares para una comparación consistente de entidades y la selección de estrategias supervisadas y formuladas basadas en la calificación numérica de reseñas de usuario. Como resultado, el modelo seleccionado logró representar la viabilidad de un producto con un nivel de precisión de hasta 96%, de acuerdo con las interpretaciones de negocio analizadas. Finalmente, la estructura del prototipo fue seleccionada a partir de la evaluación de métricas de desempeño por modelo y la ejecución de flujos de validación manual. (Texto tomado de la fuente) | spa |
| dc.description.abstract | This work proposes and develops a prototype of a predictive model for the viability of technological products, whose objective is to transform structured textual information into a numerical indicator. This indicator results from the quantitative interpretation of consumer satisfaction, expressed through user reviews in e-commerce contexts, and is intended to support technological product planning, particularly during early stages of environmental analysis and product characterization. The prototype is based on a machine learning model that analyzes textual components present in both product descriptions and online user reviews, ultimately enabling the estimation of consumer satisfaction as a numerical indicator. As quantifiable approximations for constructing this indicator, the model employs the numerical ratings assigned by users and the helpfulness votes associated with the reviews. For the construction of the prototype, a dataset composed of product information and reviews obtained from the Amazon e-commerce platform was collected. This dataset underwent exploration, cleaning, and transformation processes to derive a set of entities and attributes representative of user perceptions on the internet. Additionally, based on definitions proposed by various authors in the context of product analysis, a set of metrics was defined to enable the conversion of encoded semantic information into the proposed numerical indicator. According to the characterization of these target metrics, the machine learning prototype was constructed by integrating textual information encoding into numerical vectors, clustering of similar products to ensure consistent entity comparison, and the selection of supervised learning strategies formulated based on user review ratings. As a result, the selected model achieved up to 96% accuracy in representing product viability, according to the analyzed business interpretations. Finally, the structure of the prototype was determined based on the evaluation of performance metrics per model and the execution of manual validation workflows. | eng |
| dc.description.degreelevel | Maestría | |
| dc.description.degreename | Magíster en Ingeniería de Sistemas y Computación | |
| dc.description.researcharea | Procesamiento de lenguaje natural | |
| dc.format.extent | 84 páginas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Nacional de Colombia | spa |
| dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
| dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
| dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/89945 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Nacional de Colombia | |
| dc.publisher.branch | Universidad Nacional de Colombia - Sede Bogotá | |
| dc.publisher.faculty | Facultad de Ingeniería | |
| dc.publisher.place | Bogotá, Colombia | |
| dc.publisher.program | Bogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación | |
| dc.relation.references | M. Cantamessa, V. Gatteschi, G. Perboli, y M. Rosano, “Startups’ Roads to Failure”, Sustainability, vol. 10, núm. 7, p. 2346, jul. 2018, doi: 10.3390/su10072346 | |
| dc.relation.references | Deena, D. P. y Gupta, D. M., “A study on factors that contribute to the failure of startups”, International Journal of Aquatic Science, pp. 2634–2640, 2021 | |
| dc.relation.references | U. Iyyaz Billah, “Reasons for failure of new products in the consumer goods industry”, Business Review, vol. 7, núm. 2, pp. 119–129, jul. 2012, doi: 10.54784/1990- 6587.1209 | |
| dc.relation.references | A. Murray y V. Scuotto, “The Business Model Canvas”, Symphonya. Emerging Issues in Management, pp. 94–109, nov. 2016, doi: 10.4468/2015.3.13murray.scuotto | |
| dc.relation.references | P. Moessner, R. Haegle, L. Eiler, y K. Kloepfer, “Evaluate Market Potential of an Initial Product Concept With Jobs-to-Be-Done”, IEEE Eng. Manag. Rev., vol. 52, núm. 2, pp. 165–173, abr. 2024, doi: 10.1109/EMR.2024.3353618 | |
| dc.relation.references | Y. Hou, J. Li, Z. He, A. Yan, X. Chen, y J. McAuley, “Bridging Language and Items for Retrieval and Recommendation”, el 6 de marzo de 2024, arXiv: arXiv:2403.03952. doi: 10.48550/arXiv.2403.03952 | |
| dc.relation.references | Eggert, A., Thiesbrummel, C., y Deutscher, C., “Differential effects of product and service innovations on the financial performance of industrial firms”, Journal of Business Market Management, pp. 380–405, 2014 | |
| dc.relation.references | S. A. Rijsdijk, E. J. Hultink, y A. Diamantopoulos, “Product intelligence: its conceptualization, measurement and impact on consumer satisfaction”, J. of the Acad. Mark. Sci., vol. 35, núm. 3, pp. 340–356, sep. 2007, doi: 10.1007/s11747-007-0040-6 | |
| dc.relation.references | Wirth, R. y Hipp, J., “CRISP-DM: Towards a standard process model for data mining”, en Proceedings of the 4th International Conference on Practical Applications of Knowledge Discovery and Data Mining, 2000 | |
| dc.relation.references | D. Cer et al., “Universal Sentence Encoder”, el 12 de abril de 2018, arXiv: arXiv:1803.11175. doi: 10.48550/arXiv.1803.11175 | |
| dc.relation.references | S. Karita et al., “A Comparative Study on Transformer vs RNN in Speech Applications”, en 2019 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU), dic. 2019, pp. 449–456. doi: 10.1109/ASRU46091.2019.9003750 | |
| dc.relation.references | Chaudhary, A., “Universal sentence encoder visually explained”, Amit Chaudhary Blog. Consultado: el 13 de septiembre de 2025. [En línea]. Disponible en: https://amitness.com/posts/universal-sentence-encoder/ | |
| dc.relation.references | Linková, M. y Gurský, P., “Attributes extraction from product descriptions on e- shops”, en Proceedings of ITAT 2017, Hlavácová, J., 2017, pp. 23–26.70 Título de la tesis o trabajo de investigación | |
| dc.relation.references | S. Gallin y A. Portes, “Online shopping: How can algorithm performance expectancy enhance impulse buying?”, Journal of Retailing and Consumer Services, vol. 81, p. 103988, nov. 2024, doi: 10.1016/j.jretconser.2024.103988 | |
| dc.relation.references | A. Chiche y B. Yitagesu, “Part of speech tagging: a systematic review of deep learning and machine learning approaches”, J Big Data, vol. 9, núm. 1, p. 10, ene. 2022, doi: 10.1186/s40537-022-00561-y | |
| dc.relation.references | S. V. Praveen, P. Gajjar, R. K. Ray, y A. Dutt, “Crafting clarity: Leveraging large language models to decode consumer reviews”, Journal of Retailing and Consumer Services, vol. 81, p. 103975, nov. 2024, doi: 10.1016/j.jretconser.2024.103975 | |
| dc.relation.references | Y. Wang, D. Y. Mo, y M. M. Tseng, “Mapping customer needs to design parameters in the front end of product design by applying deep learning”, CIRP Annals, vol. 67, núm. 1, pp. 145–148, 2018, doi: 10.1016/j.cirp.2018.04.018 | |
| dc.relation.references | Y. Jiao, Y. Yang, y H. Zhang, “Mapping High Dimensional Sparse Customer Requirements into Product Configurations”, IOP Conf. Ser.: Mater. Sci. Eng., vol. 261, p. 012022, oct. 2017, doi: 10.1088/1757-899X/261/1/012022 | |
| dc.relation.references | Y. Liu, Y. Wan, X. Shen, Z. Ye, y J. Wen, “Product Customer Satisfaction Measurement Based on Multiple Online Consumer Review Features”, Information, vol. 12, núm. 6, p. 234, may 2021, doi: 10.3390/info12060234 | |
| dc.relation.references | Emilio, N., “What is Medallion architecture in a Data Lakehouse context?” | |
| dc.relation.references | R. Bandi, J. Amudhavel, y R. Karthik, “Machine Learning with PySpark - Review”, IJEECS, vol. 12, núm. 1, p. 102, oct. 2018, doi: 10.11591/ijeecs.v12.i1.pp102-106 | |
| dc.relation.references | M. Abadi et al., “TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems”, el 16 de marzo de 2016, arXiv: arXiv:1603.04467. doi: 10.48550/arXiv.1603.04467 | |
| dc.relation.references | TensorFlow, “TensorFlow Hub”, TensorFlow. Consultado: el 3 de noviembre de 2025. [En línea]. Disponible en: https://www.tensorflow.org/hub | |
| dc.relation.references | S. Mishra et al., “Principal Component Analysis”, Int. J. Livest. Res., p. 1, 2017, doi: 10.5455/ijlr.20170415115235 | |
| dc.relation.references | O. Jafari, P. Maurya, P. Nagarkar, K. M. Islam, y C. Crushev, “A Survey on Locality Sensitive Hashing Algorithms and their Applications”, el 17 de febrero de 2021, arXiv: arXiv:2102.08942. doi: 10.48550/arXiv.2102.08942 | |
| dc.relation.references | D. P. Kingma y J. Ba, “Adam: A Method for Stochastic Optimization”, el 30 de enero de 2017, arXiv: arXiv:1412.6980. doi: 10.48550/arXiv.1412.6980 | |
| dc.relation.references | A. Mao, M. Mohri, y Y. Zhong, “Cross-Entropy Loss Functions: Theoretical Analysis and Applications”, el 20 de junio de 2023, arXiv: arXiv:2304.07288. doi: 10.48550/arXiv.2304.07288 | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.license | Atribución-NoComercial-CompartirIgual 4.0 Internacional | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores | |
| dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::006 - Métodos especiales de computación | |
| dc.subject.lemb | APRENDIZAJE AUTOMATICO (INTELIGENCIA ARTIFICIAL) | spa |
| dc.subject.lemb | Machine learning | eng |
| dc.subject.lemb | APRENDIZAJE POR REFUERZO (APRENDIZAJE AUTOMATICO) | spa |
| dc.subject.lemb | Reinforcement learning (Machine learning) | eng |
| dc.subject.lemb | ESTUDIOS DE FACTIBILIDAD | spa |
| dc.subject.lemb | Feasibility studies | eng |
| dc.subject.lemb | SATISFACCION DEL CONSUMIDOR | spa |
| dc.subject.lemb | Consumer satisfaction | eng |
| dc.subject.lemb | PRONOSTICO DE LOS NEGOCIOS | spa |
| dc.subject.lemb | Business forecasting | eng |
| dc.subject.proposal | Comercio de productos | spa |
| dc.subject.proposal | Indicadores de satisfacción del cliente | spa |
| dc.subject.proposal | Viabilidad numérica de productos | spa |
| dc.subject.proposal | Reseñas de usuario | spa |
| dc.subject.proposal | Product commerce | eng |
| dc.subject.proposal | Customer satisfaction indicators | eng |
| dc.subject.proposal | Numerical product viability | eng |
| dc.subject.proposal | User reviews | eng |
| dc.title | Prototipo de modelo de aprendizaje automático para estimar la viabilidad de productos tecnológicos mediante la predicción de la satisfacción del consumidor | spa |
| dc.title.translated | Prototype of machine learning model to estimate the viability of technological products through the prediction of consumer satisfaction | eng |
| dc.type | Trabajo de grado - Maestría | |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.content | Image | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dcterms.audience.professionaldevelopment | Estudiantes | |
| dcterms.audience.professionaldevelopment | Investigadores | |
| dcterms.audience.professionaldevelopment | Maestros | |
| dcterms.audience.professionaldevelopment | Público general | |
| oaire.accessrights | http://purl.org/coar/access_right/c_abf2 |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 1000833174.2026.pdf
- Tamaño:
- 3.3 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis de Maestría en Ingeniería de Sistemas y Computación
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 5.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:

