Atribución-CompartirIgual 4.0 InternacionalRestrepo Calle, FelipeCorrea Lombana, Juan Manuel2025-11-262025-11-262025https://repositorio.unal.edu.co/handle/unal/89150ilustraciones a color, diagramasEn el dinámico entorno del comercio electrónico, el análisis competitivo de productos es un pilar estratégico, aunque su ejecución manual es ineficiente y propensa a errores debido a la heterogeneidad de la información. Este trabajo aborda la automatización de la comparación de artículos deportivos, específicamente calzado de running, extrayendo datos de múltiples plataformas de e-commerce. La contribución principal es un pipeline que implementa un paradigma de "extracción primero, comparación después". Se utiliza un Modelo de Lenguaje Grande (LLM) para transformar descripciones de producto no estructuradas en un conjunto normalizado de atributos técnicos clave, definidos mediante un consenso de expertos con el método Delphi. Posteriormente, sobre estas representaciones estructuradas, se aplican técnicas de embeddings y el algoritmo K-Vecinos más Cercanos (KNN) para cuantificar la similitud funcional e identificar productos equivalentes. Los resultados demuestran una reducción del tiempo de análisis superior al 99.9% en comparación con el proceso manual y una alta validación cualitativa por parte de expertos (4.35 sobre 5.0), validando la herramienta como un recurso eficaz para la inteligencia de negocio, la optimización de precios y la toma de decisiones estratégicas en el sector retail (Texto tomado de la fuente).In the dynamic e-commerce environment, competitive product analysis is a strategic pillar, although its manual execution is inefficient and error-prone due to information heterogeneity. This work addresses the automation of comparing sports goods, specifically running shoes, by extracting data from multiple e-commerce platforms. The main contribution is a pipeline that implements an "extract first, compare later" paradigm. A Large Language Model (LLM) is used to transform unstructured product descriptions into a normalized set of key technical attributes, defined through expert consensus using the Delphi method. Subsequently, on these structured representations, embedding techniques and the K-Nearest Neighbors (KNN) algorithm are applied to quantify functional similarity and identify equivalent products. The results show a reduction in analysis time of over 99.9% compared to the manual process and high qualitative validation from experts (4.35 out of 5.0), validating the tool as an effective resource for business intelligence, price optimization, and strategic decision-making in the retail sector.94 páginasapplication/pdfspahttp://creativecommons.org/licenses/by-sa/4.0/000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores000 - Ciencias de la computación, información y obras generales::003 - SistemasAnálisis automatizado de comparación de productos con técnicas de procesamiento de lenguaje natural para artículos deportivos extraídos de canales de comercio electrónicoTrabajo de grado - MaestríaUniversidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/info:eu-repo/semantics/openAccessLENGUAJES DE PROGRAMACION (COMPUTADORES ELECTRONICOS)Programming languages (electronic computers)PROCESAMIENTO ELECTRONICO DE DATOSElectronic data processingINTELIGENCIA ARTIFICIALArtificial intelligenceAPRENDIZAJE SUPERVISADO (APRENDIZAJE AUTOMATICO)Supervised learning (Machine learning)APRENDIZAJE AUTOMATICO (INTELIGENCIA ARTIFICIAL)Machine learningCOMERCIO ELECTRONICOElectronic commerceMERCADEO POR INTERNETInternet marketingEQUIPOS PARA DEPORTESSporting goodsLLMAnálisis CompetitivoExtracción de AtributosEquivalencia FuncionalLLM (Large Language Model)Competitive AnalysisAttribute ExtractionFunctional-EquivalenceAutomated product comparison analysis using natural language processing techniques for sporting goods extracted from E-commerce channels