Análisis automatizado de comparación de productos con técnicas de procesamiento de lenguaje natural para artículos deportivos extraídos de canales de comercio electrónico
Cargando...
Autores
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
En el dinámico entorno del comercio electrónico, el análisis competitivo de productos es un pilar estratégico, aunque su ejecución manual es ineficiente y propensa a errores debido a la heterogeneidad de la información. Este trabajo aborda la automatización de la comparación de artículos deportivos, específicamente calzado de running, extrayendo datos de múltiples plataformas de e-commerce. La contribución principal es un pipeline que implementa un paradigma de "extracción primero, comparación después". Se utiliza un Modelo de Lenguaje Grande (LLM) para transformar descripciones de producto no estructuradas en un conjunto normalizado de atributos técnicos clave, definidos mediante un consenso de expertos con el método Delphi. Posteriormente, sobre estas representaciones estructuradas, se aplican técnicas de embeddings y el algoritmo K-Vecinos más Cercanos (KNN) para cuantificar la similitud funcional e identificar productos equivalentes. Los resultados demuestran una reducción del tiempo de análisis superior al 99.9% en comparación con el proceso manual y una alta validación cualitativa por parte de expertos (4.35 sobre 5.0), validando la herramienta como un recurso eficaz para la inteligencia de negocio, la optimización de precios y la toma de decisiones estratégicas en el sector retail (Texto tomado de la fuente).
Abstract
In the dynamic e-commerce environment, competitive product analysis is a strategic pillar, although its manual execution is inefficient and error-prone due to information heterogeneity. This work addresses the automation of comparing sports goods, specifically running shoes, by extracting data from multiple e-commerce platforms. The main contribution is a pipeline that implements an "extract first, compare later" paradigm. A Large Language Model (LLM) is used to transform unstructured product descriptions into a normalized set of key technical attributes, defined through expert consensus using the Delphi method. Subsequently, on these structured representations, embedding techniques and the K-Nearest Neighbors (KNN) algorithm are applied to quantify functional similarity and identify equivalent products. The results show a reduction in analysis time of over 99.9% compared to the manual process and high qualitative validation from experts (4.35 out of 5.0), validating the tool as an effective resource for business intelligence, price optimization, and strategic decision-making in the retail sector.
Palabras clave propuestas
Descripción
ilustraciones a color, diagramas

