Estrategia eficiente para la mejora de las capacidades de modelos grandes de lenguaje (LLMs)
Cargando...
Autores
Velandia Gutiérrez, Julián Camilo
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
Los grandes modelos de lenguaje (LLMs) se han consolidado como un hito en el ámbito de la
inteligencia artificial y el procesamiento del lenguaje natural, pero su implementación a gran
escala se ve limitada por la necesidad de recursos computacionales elevados. Este trabajo propone
que a partir de un modelo base, se exploren y combinen técnicas de procesamiento y selección
cuidadosa de datos, entrenamiento y ajustes en la arquitectura, con el fin de mejorar la eficiencia
de los modelos en entornos con recursos restringidos y sobre una base de conocimiento delimitada.
El enfoque metodológico incluyó la definición de criterios para la elaboración de conjuntos de
datos confiables, la experimentación controlada con diferentes configuraciones y la evaluación
sistemática de las variantes resultantes en términos de capacidad, versatilidad, tiempo de respuesta
y seguridad. Finalmente, se llevaron a cabo pruebas comparativas, midiendo el desempeño de las
variantes desarrolladas y validando la eficacia de las estrategias propuestas (Texto tomado de la fuente).
Abstract
Large language models (LLMs) have emerged as a milestone in the field of artificial intelligence and natural language processing. However, their large-scale deployment remains constrained by the high computational resources they require. This work proposes that, starting from a base model, a combination of techniques—including careful data processing and selection, training strategies, and architectural adjustments—can be explored to improve model efficiency in resource-constrained environments and within a defined knowledge scope.
The methodological approach involved defining criteria for building reliable datasets, conducting controlled experiments with various configurations, and systematically evaluating the resulting model variants in terms of capacity, versatility, response time, and safety. Finally, comparative tests were carried out to measure the performance of the developed variants and validate the effectiveness of the proposed strategies.
Descripción
ilustraciones, diagramas, tablas