Maestría en Ingeniería - Analítica
URI permanente para esta colecciónhttps://repositorio.unal.edu.co/handle/unal/82559
Examinar
Envíos recientes
Item type: Ítem , Advancing healthcare analytics : a thematic review of machine learning, health informatics, and real-world data applications(Universidad Nacional de Colombia, 2025-09-13) Arias Rios, María Isabel; Velásquez Henao, Juan David; Arias Rios, Maria Isabel [https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001828551]This study aims to map the conceptual and methodological landscape of healthcare analytics by identifying dominant thematic clusters, synthesizing key trends, and outlining translational challenges and research opportunities in the field. To achieve this, 2,281 Scopus-indexed publications were analyzed using unsupervised text mining and clustering techniques, with a focus on identifying recurring themes, methodological innovations, and gaps in the healthcare analytics literature across clinical, administrative, and public health contexts. The analysis revealed eight dominant themes: intelligent systems for predictive healthcare, patientcentered health analytics, adaptive AI for clinical insights, demographic health analytics, digital mental health surveillance, ethical analytics for health surveillance, personalized care through data analytics, and AI-driven insights for outbreak response. Together, these clusters illustrate an ongoing transition toward real-time, multimodal, and ethically grounded analytics ecosystems. However, the field continues to face persistent challenges, such as data interoperability, algorithmic opacity, standardization of evaluation practices, and demographic bias. The review also underscores emerging priorities that are likely to shape the next phase of development, including explainable AI, federated learning, and context-aware modeling, alongside ethical considerations related to data privacy and digital equity. From a practical perspective, key recommendations include the co-design of solutions with healthcare professionals, greater investment in infrastructure, and the deployment of real-time clinical decision support systems. Overall, healthcare analytics is positioned as a foundational pillar of learning health systems, carrying significant implications for translational research and the advancement of precision health. (Tomado de la fuente)Item type: Ítem , Método para identificar y caracterizar variantes del SARS-CoV-2 mediante algoritmos de aprendizaje de máquinas y simulaciones moleculares(Universidad Nacional de Colombia, 2024-04-15) López Carvajal, María Stella; Branch Bedoya, John William; Hernández Ortíz, Juan Pablo; https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001956104; López Carvajal, Maria Stella [0000-0003-3053-1278]; Branch Bedoya, John William [0000-0002-0378-028X]; Hernández Ortíz, Juan Pablo [0000-0003-0404-9947]; Gidia: Grupo de Investigación YyDesarrollo en Inteligencia ArtificialLa vigilancia genómica del SARS-CoV-2 ha permitido la identificación de variantes de interés y de preocupación a nivel mundial, relevantes para el manejo de salud pública, el mejoramiento de pruebas de diagnóstico y el diseño de las vacunas. Aproximadamente 16 millones de secuencias del virus han sido reportadas a la fecha, un número de instancias varios ordenes de magnitud superior a las decenas de miles de secuencias que han podido ser analizadas con árboles filogenéticos usando estrategias de paralelización computacional. El aprendizaje automático constituye una alternativa para el procesamiento de grandes conjuntos de datos y la identificación de patrones en el genoma viral, características que pueden ser aprovechadas para la identificación de variantes y el reconocimiento de linajes emergentes. En el presente trabajo se construyó una herramienta para la identificación de variantes del SARS-CoV-2 a partir de la obtención y procesamiento automático de secuencias del virus, transformaciones numéricas de los datos y aprendizaje no supervisado. Además, se incorporaron herramientas bioinformáticas para el modelado y la caracterización de proteínas codificadas por los genomas representativos de los linajes identificados. (Tomado de la fuente)Item type: Ítem , Predicción de sobrecostos en proyectos de construcción de edificación (uso no residencial) empleando una técnica de Machine Learning. Caso de estudio: Capital Project Schedules and Budgets(Universidad Nacional de Colombia, 2025) Ospina Castañeda, Andrés Felipe; Espinosa Bedoya, Albeiro; Rojas López, Miguel David; Ospina Castañeda, Andres Felipe [0002208300]; Rojas Lopez, Miguel David [0000252352]; Espinosa Bedoya, Albeiro [EGp0-AIAAAAJ&hl]; Espinosa Bedoya, Albeiro [0000-0001-7292-987X]; Rojas López, Miguel David [0000-0002-3531-4910]; Centro de Investigación y Consultoría Organizacional-Cinco-El presente estudio propone un modelo predictivo basado en técnicas de Machine Learning para anticipar sobrecostos en proyectos de construcción de edificación de uso no residencial, tomando como caso de estudio la base de datos “Capital Project Schedules and Budgets” de la School Construction Authority (SCA) de Nueva York. La investigación surge ante la necesidad de superar las limitaciones de los enfoques tradicionales en la gestión de riesgos en costos. A partir del enfoque CRISP-DM, se llevó a cabo un proceso estructurado que incluyó la comprensión del negocio, análisis exploratorio de datos, selección de variables relevantes, transformación de datos y entrenamiento de modelos predictivos. Se evaluaron cuatro algoritmos: Linear Regression, Random Forest Regressor, Multi Layer Perceptron Regressor, y Gradient Boosting Regressor, siendo este último el de mejor desempeño, alcanzando un coeficiente de determinación (R²) de 0.9824, con un error cuadrático medio (MSE) de 309.699.558 y un error absoluto medio (MAE) de 3.887. El análisis identificó que las variables más influyentes en los sobrecostos fueron de tipo financiero, destacándose el presupuesto total del proyecto, el gasto real estimado a la fecha y el presupuesto final estimado. En contraste, variables categóricas como el tipo de proyecto o la fase constructiva mostraron baja significancia estadística. Asimismo, la validación del modelo mediante K-Fold Cross Validation confirmó su capacidad de generalización, sin indicios de sobreajuste. (Tomado de la fuente)Item type: Ítem , Generación de contenido educativo integrando modelos de difusión y estilos de aprendizaje(Universidad Nacional de Colombia, 2025-08-28) Arenas Tamayo, Luis Miguel; Bolaños Martínez, Freddy; Arango Zuluaga, Eliana Isabel; LhTcFwQAAAAJ; Arenas Tamayo, Luis Miguel [0009-0003-7214-6025]; Bolaños Martínez, Freddy [0000-0002-3123-5481]; Arango Zuluaga, Eliana Isabel [0000-0002-0947-3694]; Luis-Arenas-Tamayo-2Esta tesis surge a partir del reciente auge y las crecientes capacidades de la inteligencia artificial generativa, en particular de los modelos de difusión generadores de imágenes, como herramienta para complementar contenidos pedagógicos considerando los estilos de aprendizaje como insumo. Para ello, se desarrolló una herramienta web utilizando el framework Django, servicios nube de AWS y ComfyUI, estructurada en dos etapas, una etapa de identificación, que adapta un cuestionario de estilos de aprendizaje mediante imágenes generadas, y una etapa de inferencia, en la cual se generan imágenes a demanda por parte de los participantes para la evaluación de cuatro modelos de difusión. En ambas etapas se aplicaron preguntas de percepción utilizando la escala Likert, validadas mediante el Coeficiente de Cronbach de 0.836 y 0.721 respectivamente. Los resultados evidenciaron que, en la etapa de identificación, el 60% de las respuestas fueron clasificadas como altas, el 23.78% como bajas y el 16.22% como medias. En la etapa de inferencia, se observó una leve disminución en la proporción de respuestas altas 47.83%, mientras que las respuestas medias y bajas aumentaron a 30.98% y 21.20%, respectivamente. Adicionalmente, se incorporó el análisis de los estilos de aprendizaje preferentes de los participantes, revelando patrones significativos en la percepción según cada estilo. En general, los participantes con estilos VIS (visual), REF (reflexivo), SEN (sensitivo) y ACT (activo) tendieron a otorgar calificaciones altas en ambas etapas. Los modelos de difusión fueron evaluados también mediante el CLIP Score, evidenciando preferencias diferenciadas según el estilo de aprendizaje. El modelo DALLE 3 fue el más preferido en términos generales, mientras que los participantes con estilo visual mostraron una inclinación positiva hacia Stable Diffusion XL y Stable Diffusion 3.5. Estos hallazgos indican que la percepción de utilidad o calidad de las imágenes generadas varía de acuerdo con el estilo de aprendizaje predominante, lo cual tiene implicaciones relevantes para la personalización de herramientas educativas basadas en inteligencia artificial generativa. (Tomado de la fuente)Item type: Ítem , Análisis computacional del receptor de manosa CD206 y componentes de la pared celular de Mycobacterium leprae, PGL-1 y manosa(Universidad Nacional de Colombia, 2024) Montoya Pareja, Juan Pablo; Hernández Ortiz, Juan Pablo; Botero Mejía, Maria Luisa; Hernández Ortiz, Juan Pablo [0000-0003-0404-9947]Esta tesis presenta un análisis computacional exhaustivo del receptor de manosa CD206 y su interacción con componentes clave de la pared celular de Mycobacterium leprae, específicamente el glicolípido fenólico-1 (PGL-1) y la manosa. Empleando una combinación de técnicas de modelado molecular, incluyendo dinámica molecular, docking molecular y simulaciones de complejos receptor-ligando, el estudio proporciona una comprensión detallada de la estructura, dinámica y mecanismos de reconocimiento molecular del receptor CD206. La investigación se estructuró en tres fases principales: dinámica molecular del receptor CD206 en sus estados conformacionales abierto y cerrado, así como del cuarto dominio de reconocimiento de carbohidratos (CRD4) aislado; docking molecular entre el receptor y los ligandos PGL-1 y manosa; y dinámica molecular de los complejos receptor-ligando resultantes. Los hallazgos clave incluyen la identificación de un posible mecanismo de “captura y liberación” basado en la alternancia entre estados conformacionales, la confirmación de la especificidad del receptor hacia la manosa, la elucidación del papel del dominio CRD4 en la unión de ligandos, y la caracterización de las diferencias en la dinámica de interacción entre el receptor y los ligandos. El estudio reveló una preferencia consistente del receptor por la manosa sobre PGL-1, con energías de unión más favorables en el estado cerrado del receptor. Además, se observaron cambios conformacionales inducidos por la unión de ligandos, que podrían ser cruciales para la función biológica del receptor. Estos resultados tienen implicaciones significativas para el entendimiento de los mecanismos de reconocimiento de patógenos en el sistema inmune innato y abren nuevas vías para el diseño de estrategias terapéuticas dirigidas a modular la actividad del receptor CD206 en el contexto de enfermedades infecciosas, particularmente la lepra. La integración de múltiples técnicas computacionales en este trabajo ha permitido una caracterización detallada de un sistema biológico complejo, demostrando el poder de los enfoques in silico en la investigación biomédica moderna. Los hallazgos de esta tesis no solo contribuyen al conocimiento fundamental de las interacciones receptor-ligando en el sistema inmune, sino que también proporcionan una base sólida para futuras investigaciones experimentales y computacionales en este campo, con potenciales aplicaciones en el desarrollo de nuevas terapias y en la comprensión más profunda de las interacciones patógeno-huésped. (Tomado de la fuente)Item type: Ítem , Análisis de los factores asociados a la deserción estudiantil en la Facultad de Minas de la Universidad Nacional de Colombia(Universidad Nacional de Colombia, 2025-08-20) Cross Arroyave, Yurladys; Villa Garzón, Fernán Alonso; Cross Arroyave, Yurladys [0000000318663091]; Villa Garzón Fernán A. [0000000238636106]; Gidia: Grupo de Investigación YyDesarrollo en Inteligencia ArtificialEl presente trabajo analiza los factores asociados a la deserción estudiantil en la Facultad de Minas de la Universidad Nacional de Colombia, sede Medellín, mediante la aplicación de técnicas de Learning Analytics (LA). El objetivo principal es identificar las causas predominantes y fundamentar estrategias para su mitigación a través de decisiones basadas en datos. Para ello, se adoptó el marco metodológico CRISP-DM, recopilando y procesando información del Sistema de Información Académica, abarcando un período de 28 semestres (2010-2023). Los datos fueron integrados, limpiados y anonimizados, lo que permitió la construcción de un tablero de control interactivo para visualizar indicadores clave de deserción. El análisis se centró en tres dimensiones: variables académicas: rendimiento y promedio ponderado acumulado (PPA); variables socioeconómicas: estrato y tipo de colegio de procedencia; y, variables contextuales: características de los programas académicos y sedes. Los resultados evidencian que el 75% de las deserciones ocurren durante los primeros cuatro semestres, con picos críticos en el primero (15.4%) y el cuarto (32.4%). Entre los factores determinantes destacan las dificultades académicas, la adaptación al entorno universitario y la falta de orientación vocacional. Estos hallazgos subrayan la necesidad de implementar intervenciones tempranas que aborden los riesgos desde las etapas iniciales de la formación. La aplicación de LA resulta fundamental para identificar patrones de comportamiento estudiantil y facilitar la toma de decisiones oportunas. Asimismo, el estudio revela la importancia de fortalecer el acompañamiento académico y socioemocional, así como de diseñar estrategias personalizadas que respondan a las particularidades institucionales y a los perfiles estudiantiles. La integración de datos históricos cuantitativos mediante herramientas interactivas, como tableros de control, proporciona un marco analítico robusto. Este enfoque no solo permite una comprensión integral del fenómeno, sino también el diseño de acciones sostenibles para reducir la deserción. (Texto tomado de la fuente)Item type: Ítem , Modelo para predicción de la demanda potencial basado en Machine Learning aplicado en una empresa del sector textil y moda colombiano – caso de estudio aplicado al mercado de California(Universidad Nacional de Colombia, 2025) Serrano Casas, Edinson Manuel; Espinosa Bedoya, AlbeiroEl desafío para predecir la demanda de las compañías del sector textil moda constituye un aspecto fundamental para incrementar el volumen de ventas con un adecuado manejo del inventario. En este contexto, las compañías pueden acceder a ventajas competitivas que soporten el constante cambio del mercado global. Esta investigación aborda dicho desafío desarrollando un método de predicción de la demanda empleando técnicas de aprendizaje de máquinas. A través de un conjunto de datos representativo, que incluye información detallada sobre las ventas e inventario de una compañía del sector textil moda en el canal de comercio electrónico, se ajustan técnicas de aprendizaje de máquina, utilizando un enfoque de redes neuronales recurrentes, específicamente LSTM, y XGBoost. Los resultados obtenidos demuestran que el método propuesto alcanza una precisión general del 80,3%, demostrando su habilidad para predecir la demanda. La investigación aporta al campo del comercio electrónico de las empresas del sector textil moda con presencia en el mercado de Estados Unidos de América un enfoque predictivo que se centra en la precisión y la generalización. Este enfoque de generalización implica que el modelo no está restringido a un conjunto de datos específico o a condiciones de mercado particulares, sino que puede ajustarse y mantener su precisión ante los cambios dinámicos que presenta el comercio electrónico. (Tomado de la fuente)Item type: Ítem , Aplicación de modelo híbrido en sistemas de recomendación en ecommerce utilizando inteligencia artificial(Universidad Nacional de Colombia, 2025-07-18) Bolivar, Juan Esteban; Guzmán Luna, Jaime AlbertoEl comercio electrónico ha experimentado un crecimiento exponencial en los últimos años, impulsado en gran medida por la transformación digital acelerada tras la pandemia de COVID-19. Factores como los confinamientos y el aumento de la confianza en las plataformas digitales han incentivado a las empresas a optimizar sus estrategias tecnológicas para mantenerse competitivas. En este contexto, la implementación de sistemas de recomendación se ha convertido en una herramienta clave para mejorar la experiencia de compra, permitiendo a las plataformas ofrecer productos y servicios personalizados según las preferencias de los usuarios. Para lograr recomendaciones precisas y relevantes, es fundamental el uso de técnicas avanzadas de análisis de datos y algoritmos de inteligencia artificial. Los modelos híbridos de recomendación, que combinan enfoques basados en contenido, filtrado colaborativo y aprendizaje profundo, han demostrado ser altamente efectivos al mejorar la precisión de las sugerencias y la satisfacción del usuario. La integración de estos modelos permite aprovechar grandes volúmenes de datos y patrones de comportamiento, optimizando la personalización y aumentando la fidelización del cliente. Este estudio explora la aplicación de un modelo híbrido en sistemas de recomendación en e-commerce, analizando su impacto en la precisión de las sugerencias y la experiencia del usuario. Además, se investiga el uso de técnicas de inteligencia artificial, como redes neuronales y modelos de aprendizaje automático, para mejorar la eficiencia y efectividad de las recomendaciones. (Tomado de la fuente)Item type: Ítem , Optimización del pronóstico de ventas en Dislicores : evaluación y selección de modelos de series temporales, aprendizaje automático y técnicas avanzadas(Universidad Nacional de Colombia, 2025-07-20) Espitia Humanez, Wilson Fernando; Torres Madroñero, María ConstanzaDislicores es una empresa colombiana líder en la distribución y comercialización de bebidas alcohólicas y no alcohólicas, siendo su portafolio principal los vinos (tintos, blancos, rosados y espumosos), licores (whisky, ginebra, rones y tequilas), cervezas y bebidas sin alcohol. Además, complementa su oferta con alimentos como pasabocas, dulces y alimentos madurados, fortaleciendo y complementando su propuesta de consumo masivo. El objetivo de este estudio es mejorar la precisión de los pronósticos de demanda, mediante la evaluación y comparación de modelos avanzados de predicción. Para ello, se implementan seis modelos: Promedio Móvil Simple, Regresión Lineal, Holt-Winters, MSTL con Regresión Polinómica, XGBoost y LightGBM, utilizando datos históricos del periodo 2020-2024. Siguiente la metodología CRISP-DM, se realizaron procesos de limpieza de datos, análisis exploratorio y evaluación de desempeño empleando métricas como MAE%, SESGO%, SCORE% y RMSE% sobre las 232 referencias clave (Pareto). El modelo seleccionado se integrará en un pipeline automatizado y escalable dentro del servicio en nube de Amazon Web Services (AWS). Finalmente, los resultados se implementaron en Qlik Sense, facilitando el análisis y toma de decisiones estratégicas basadas en datos confiables y de fácil acceso. Esta solución pretende contribuir a una gestión y seguimiento más eficiente de la demanda, optimizando la planificación operativa y fortalecer la competitividad de Dislicores en el mercado nacional. (Tomado de la fuente)Item type: Ítem , Visualización de datos categóricos empleando métodos de reducción de dimensionalidad enfocados en datos socioeconómicos(Universidad Nacional de Colombia, 2025) Oliveros Duran, Daniel Alejandro; Branch Bedoya, John Willian; Iral Palomino, RenéEn el contexto actual, la disponibilidad creciente de herramientas para el análisis y la visualización estadística ha facilitado significativamente la exploración de datos y sus relaciones. No obstante, el incremento exponencial en la complejidad y el volumen de los datos plantea desafíos considerables, especialmente en el tratamiento de variables categóricas. Estas variables exhiben desafíos particulares en términos de representación gráfica, integración en modelos analíticos y en la interpretación de los resultados. Entre los principales desafíos que se destacan se encuentran la alta cardinalidad, que genera combinaciones complejas y dificulta el análisis individual de cada categoría, así como el incremento de la dimensionalidad derivado de técnicas de codificación como el one-hot encoding. El propósito de este estudio es desarrollar un procedimiento de visualización para datos categóricos con alta cardinalidad y dimensionalidad. Para lograr este objetivo, se propone un enfoque que abarca el procesamiento y la selección de variables categóricas, con el propósito de facilitar la aplicación de técnicas de reducción de dimensionalidad. Posteriormente, se determinará un método de visualización adecuado para representar el conjunto de datos reducido, de manera que sea posible analizar las relaciones entre las variables categóricas en un espacio de menor dimensión. (Tomado de la fuente)Item type: Ítem , Analítica predictiva y desarrollo de un modelo cuantitativo para estudio y segmentación del mercado farmacéutico para patologías de alto costo(Universidad Nacional de Colombia, 2025-06-23) Trillos Paredes, Jose Antonio; Olaya Morales, Yris; Trillos Paredes, Jose Antonio [0009-0007-6723-9867]Actualmente, Colombia enfrenta importantes retos en su sistema de salud, especialmente en la gestión eficiente de los recursos, la cobertura y la administración de los prestadores de servicios. Dentro de este contexto, el sector farmacéutico, encargado de la comercialización de medicamentos, enfrenta desafíos específicos debido a la limitada cobertura del sistema y la falta de sistemas de información robustos. Para garantizar un acceso adecuado a las terapias según las necesidades de la población, surge la necesidad de analizar la información del mercado de medicamentos de alto costo y del sistema de salud colombiano, con el objetivo de respaldar la toma de decisiones de manera analítica y fundamentada. Este trabajo propone la aplicación de modelos de aprendizaje automático y técnicas de minería de datos para abordar dichas necesidades, centrándose en la construcción de un modelo de clusterización inspirado en la metodología RFM (Recency, Frequency, Monetary) (Hughes, 1996), adaptada al contexto del sector farmacéutico. Para ello, se ajustaron los parámetros clásicos del modelo RFM, reemplazando la dimensión de recencia por los días de inventario de cada cliente y frecuencia por variaciones en las compras, mientras que la dimensión valor monetario se mantuvo para representar el valor económico asociado. Esta adaptación permitió capturar mejor la dinámica de compra de los clientes en función de su estabilidad de inventario y su impacto financiero. Los resultados de la clasificación son el resultado de un proceso estructurado que inició con la recopilación y consolidación de una base de datos de 110,322 registros correspondientes a transacciones comerciales realizadas durante un año. Posteriormente, se realizó un proceso de pretratamiento de los datos, que incluyó la limpieza, normalización y transformación de las variables para garantizar su calidad y coherencia. A continuación, se emplearon técnicas de clusterización no supervisada para segmentar a los clientes en grupos homogéneos, utilizando los algoritmos K-Means, Gaussian Mixture Model (GMM) y Aglomerativo (Hierarchical Clustering). La validación de los modelos se realizó mediante la comparación de la métrica WCSS (Within-Cluster Sum of Squares) adaptada a las características de cada algoritmo, permitiendo seleccionar el modelo con la mejor cohesión interna. Como resultado, el algoritmo K-Means mostró el mejor desempeño, evidenciado por un menor valor de WCSS de 5.93, lo que garantiza una mayor compactación de los clusters y, por ende, una segmentación más precisa. Finalmente, el modelo entrenado permitió clasificar a los clientes en función de su comportamiento histórico de compra y predecir su posible evolución futura, facilitando la identificación de segmentos con diferentes perfiles de riesgo financiero. Esta clasificación ofrece una herramienta práctica para la toma de decisiones comerciales basadas en datos, permitiendo implementar estrategias diferenciadas para cada grupo y optimizar la gestión del mercado de medicamentos de alto costo en Colombia. La metodología desarrollada es escalable y puede adaptarse a otras patologías, consolidando así una solución replicable para distintos contextos dentro del sector farmacéutico. (Tomado de la fuente)Item type: Ítem , Modelo de gestión de recursos para la optimización de proyectos integrando técnicas de Inteligencia Artificial(Universidad Nacional de Colombia, 2025) Herrera Arredondo, Carolina; Jiménez Builes, Jovani AlbertoLa gestión de recursos es una parte fundamental de la gestión de proyectos, pues gracias a ella los gestores, mediante planificaciones determinan previamente qué recursos requieren para la ejecución de un proyecto, partiendo desde una identificación rigurosa de necesidades y siendo éstas cuantificadas por medio de la estimación del presupuesto requerido para su ejecución. En este caso, al ser el presupuesto un recurso limitado, es necesario realizar formulaciones precisas que permitan la optimización del capital y minimicen el riesgo de incurrir en sobrecostos o el incumplimiento de los objetivos. Este trabajo aplica técnicas de analítica de datos e inteligencia artificial para predecir el presupuesto total de proyectos de investigación a partir de características propias de estos. Una vez ejecutados los seis modelos seleccionados, Random Forest mostró el mejor desempeño para predecir el costo total de un proyecto. El modelo seleccionado se reconoce como una herramienta estratégica de apoyo que puede ser integrada para la toma de decisiones en la optimización de recursos en proyectos. (Tomado de la fuente)Item type: Ítem , SAULO - Modelo de inteligencia artificial generativa para optimizar la producción de aguacate Hass, mediante LLMs y datos locales reales de la unidad productiva(Universidad Nacional de Colombia, 2025-06-22) Sánchez Arango, Andrés Felipe; Torres Madroñero, María Constanza; Gidia: Grupo de Investigación YyDesarrollo en Inteligencia ArtificialColombia es el tercer productor mundial de aguacate Hass, con proyección de crecimiento del 36% en las próximas décadas. Sin embargo, el modelo agrícola del país presenta un bajo nivel técnico en la fertilización de suelos, lo que ha llevado a un uso excesivo de fertilizantes. Entre 2002 y 2016, el consumo de nitrógeno, fósforo y potasio (N-P-K) en Colombia fue 4.3 veces superior al promedio global, generando desequilibrios en la producción, impactos ambientales y altos sobrecostos. Esta investigación propone SAULO – Agrónomo digital apalancado por Inteligencia Artificial Generativa para Optimizar la Producción de Aguacate Hass, un modelo basado en Modelos de Lenguaje Generativos (LLMs) para optimizar la fertilización del cultivo aprovechando los datos locales de unidades productivas. El estudio se desarrolla en una unidad productiva piloto en Colombia, donde se implementará una plataforma con una base de datos Neo4j, optimizada para manejar grafos y relaciones semánticas. SAULO emplea agentes inteligentes que interpretan datos en lenguaje natural (NL) y generan recomendaciones sobre fertilización, riego y control de plagas. El diseño metodológico sigue un enfoque pro-code, integrando LLMs con recuperación aumentada de información (RAG) para mejorar la precisión y contextualización de las respuestas. La evaluación del modelo se realiza evidenciando la capacidad de SAULO para responder preguntas específicas de la unidad productiva sin generar alucinaciones, manteniendo siempre el contexto y la veracidad de los datos entregados al usuario. El impacto esperado de este desarrollo incluye la reducción del desperdicio de insumos, mayor eficiencia en la toma de decisiones agronómicas y una plataforma escalable para la agricultura de precisión. (Tomado de la fuente)Item type: Ítem , Un método para generación de mapas mentales a partir de un dataset de artículos científicos en el contexto de calidad de software mediante técnicas de machine learning(Universidad Nacional de Colombia, 2025) Tobón Villegas, Angela María; Espinosa Bedoya, AlbeiroEn los últimos años, el análisis de grandes volúmenes de texto ha ganado relevancia en diversas disciplinas, especialmente con el avance de las técnicas de machine learning y el procesamiento de lenguaje natural. En particular, la investigación sobre calidad de software ha generado una gran cantidad de artículos científicos que, debido a su complejidad y volumen, dificultan la comprensión rápida y la identificación de las ideas clave. Una posible solución a este problema es el uso de herramientas automáticas que ayuden a visualizar las relaciones entre los conceptos clave de manera más accesible. En este estudio, se propone un enfoque para generar mapas mentales a partir de un conjunto de artículos científicos relacionados con la calidad de software, utilizando un modelo de lenguaje grande (LLM) como técnica principal. El objetivo es crear representaciones gráficas que permitan identificar las conexiones y temas principales de manera eficiente, simplificando la comprensión del contenido. Para lograr este objetivo, se llevó a cabo una revisión de la literatura para identificar las mejores técnicas de análisis de texto y generación de representaciones jerárquicas. Se decidió optar por el uso de un modelo de lenguaje grande (LLM) debido a su capacidad sobresaliente para procesar grandes volúmenes de texto y capturar relaciones semánticas complejas. Los LLM, entrenados en variados corpus de texto, tienen la capacidad de identificar patrones y extraer conceptos clave con alta precisión, lo que los convierte en una opción ideal para generar mapas mentales detallados y efectivos. En este caso, se implementó un código en Python utilizando el modelo Gemini-1.5-Flash, que, en su versión gratuita disponible en el momento del estudio, permitió realizar múltiples iteraciones para ajustar el modelo y obtener resultados más precisos. Los resultados demostraron que la alternativa propuesta es una herramienta eficaz para la generación de mapas mentales, con un resultado promedio de 88%. La capacidad del modelo para realizar múltiples iteraciones de manera eficiente, utilizando recursos computacionales limitados, abre la posibilidad de explorar otras herramientas de grandes modelos de lenguaje (LLM) y evaluar su desempeño en tareas de análisis cuantitativo de información en otros dominios, como la investigación académica o la ingeniería de software. (Tomado de la fuente)Item type: Ítem , Método de autoaprendizaje basado en machine learning aplicado a la dieta de un individuo con colitis ulcerativa. Caso de estudio: paciente Juan Pablo Aguirre Martínez(Universidad Nacional de Colombia, 2025-06-09) Aguirre Martínez, Juan Pablo; Espinosa Bedoya, Albeiro; Juan Pablo Aguirre Martínez; https://www.researchgate.net/profile/Juan-Pablo-Aguirre-Martinez; Calidad de SoftwareLa Colitis Ulcerativa (CU), es una Enfermedad Inflamatoria Intestinal (EII), crónica que afecta a aproximadamente 1 de cada 1000 personas en el mundo. Esta condición autoinmune provoca inflamación y úlceras en el colon, desencadenando síntomas como diarrea, sangrado, dolor y fatiga, reduciendo significativamente la calidad de vida. La severidad puede oscilar entre leve a grave, e incluso puede ser potencialmente mortal. Si bien no existe una cura, la nutrición personalizada es clave en el manejo de los síntomas. Este trabajo propone un método basado en técnicas de autoaprendizaje y Machine Learning para ajustar la alimentación de individuos con CU, tomando como caso de estudio al paciente Juan Pablo Aguirre Martínez. La justificación de este radica en la falta de literatura previa sobre la aplicación de sistemas de Machine Learning a la dieta de personas con CU. La metodología incluye la construcción de un conjunto de datos, la revisión y evaluación de técnicas de Machine Learning. Precisamente, se consideró la capacidad del modelo para procesar datos temporales y aprender de manera continua, lo que llevó a la elección del modelo LSTM. Se espera que el método propuesto contribuya al desarrollo de una herramienta innovadora que mejore la calidad de vida de personas con CU y fomente la exploración de nuevas soluciones en el ámbito de la medicina. (Tomado de la fuente)Item type: Ítem , Análisis del comportamiento de precios de contratos de energía eléctrica para el mercado regulado en Colombia(Universidad Nacional de Colombia, 2024-11-01) Cuartas Montoya, Juan Camilo; Velásquez Henao, Juan David; Franco Cardona, Carlos Jaime; Cuartas Montoya, Juan CamiloEl mercado de energía colombiano ha evolucionado significativamente desde su creación, esforzándose por alcanzar transparencia, eficiencia y precios justos para todos los usuarios. Este mercado está dividido en demanda regulada, que incluye a usuarios residenciales, y demanda no regulada, que abarca la industria, usuarios de alto consumo y alumbrado público. Para satisfacer esta demanda, se han implementado diversos mecanismos en el Mercado de Energía Mayorista (MEM). En este trabajo, se propone analizar las variables que influyen en la formación de precios de los contratos para el mercado regulado y examinar los comportamientos de los agentes del mercado, utilizando diversas técnicas estadísticas que permiten identificar y comprender patrones en los datos, tales como métricas de dispersión, centralidad y tendencia central, así como métodos de agrupamiento y análisis de la variabilidad, distribución y relación entre variables. El análisis revela que hasta el año 2020, los precios promedio de contratos para agentes sin situación de control eran superiores, pero esta tendencia se invierte a partir de 2021 con la implementación del Sistema de Información de Convocatorias Públicas (SICEP), sugiriendo que la regulación ha influido en los precios. La anticipación en la negociación de contratos reduce significativamente los precios promedio ponderados, destacando la importancia de la planificación. Los precios de contratos sin situación de control presentan mayor variabilidad, mientras que los de contratos con situación de control son más estables. Los agentes con alta participación en el mercado tienen precios más estables y por lo tanto, menor riesgo financiero. El precio de bolsa con 24 meses de anticipación impacta significativamente en los precios de los contratos, a diferencia de la volatilidad del precio de bolsa y fenómenos climáticos como El Niño y La Niña. La capacidad total de generación de energía es más determinante que la entrada de proyectos de generación renovable en la fijación de precios. Finalmente, la distribución de precios de los contratos varía según la capacidad de generación y la exposición en bolsa del agente, ya sea vendedor o comprador. Los agentes con baja participación en la capacidad de generación tienden a obtener precios más altos. Además, se observan fluctuaciones significativas en los precios a lo largo del tiempo debido a la exposición en bolsa, sin una tendencia constante. (Tomado de la fuente)Item type: Ítem , Clasificación de transacciones ACH para mantener movimientos financieros dentro de la compañía empleando técnicas de inteligencia artificial(Universidad Nacional de Colombia, 2025-04) Caro Zapata, Laura Maria; Branch Bedoya, Jhon William; Gidia: Grupo de Investigación YyDesarrollo en Inteligencia ArtificialEste trabajo de maestría se enfoca en el análisis de las transacciones ACH (Automated Clearing House) en el sector bancario colombiano, con el objetivo de identificar patrones que permitan desarrollar estrategias comerciales para retener capital dentro de la institución. Dado el creciente uso de servicios financieros digitales y la facilidad con la que los clientes pueden transferir fondos entre bancos, se hace necesario comprender las dinámicas transaccionales que afectan la liquidez bancaria. Mediante técnicas de inteligencia artificial, como bosques aleatorios, máquinas de soporte vectorial (SVM) y aumento de gradiente extremo (XGBoost), se realiza un análisis predictivo de las transacciones ACH. Los resultados destacan el potencial del modelo XGBoost para predecir movimientos, lo que permite anticipar comportamientos de los clientes y diseñar productos financieros personalizados. El estudio contribuye a la formulación de estrategias que optimicen la retención de fondos y mejoren la competitividad del banco en un entorno financiero cada vez más digitalizado. Las recomendaciones propuestas buscan fortalecer la relación con los clientes y maximizar la eficiencia operativa. (Tomado de la fuente)Item type: Ítem , Método para la clasificación del tipo de vehículo y el número de placa según las clasificaciones del cobro de peaje en Colombia, empleando técnicas de inteligencia artificial(Universidad Nacional de Colombia, 2024-12) Ocampo Montoya, Sebastian; Branch Bedoya, John Willian; Ballesteros, John Robert; Gidia: Grupo de Investigación YyDesarrollo en Inteligencia ArtificialEl presente trabajo aborda la problemática de la congestión vehicular en los peajes de Colombia, donde las demoras generan altos costos logísticos y un impacto negativo en el medio ambiente. A pesar de los avances en infraestructura vial, los sistemas de cobro actuales, basados principalmente en efectivo o en el uso limitado del sistema TAG, resultan insuficientes para manejar el creciente volumen de tráfico. Este estudio propone un método para la clasificación vehicular y el reconocimiento de matrículas utilizando técnicas de inteligencia artificial, con el fin de mejorar la eficiencia en los sistemas de peaje. Se desarrolló una metodología basada en video-analítica y reconocimiento óptico de caracteres (OCR), que permite la identificación automática del tipo de vehículo y su placa, de acuerdo con las clasificaciones de cobro vigentes en Colombia. A través del uso de redes neuronales convolucionales (CNN) y modelos preentrenados como MobileNet y ResNet, se logró un desempeño adecuado en la clasificación de vehículos, siendo ResNet el modelo con mayor precisión. Adicionalmente, se identificaron áreas de mejora en el reconocimiento de matrículas, lo que sugiere que una mayor cantidad de datos y ajustes en las técnicas utilizadas podrían optimizar el sistema. Este trabajo plantea la posibilidad de implementar cobros de peaje completamente automáticos, mejorando la movilidad y reduciendo los tiempos de espera y el impacto ambiental.Item type: Ítem , Predicción de precios del mercado agrícola en Colombia : aplicación de modelos de aprendizaje automático y minería de datos para la toma de decisiones en la agricultura(Universidad Nacional de Colombia, 2024-10-23) Sánchez Conde, Oscar Leonel; Ovalle Carranza, Demetrio Arturo; Gidia: Grupo de Investigación YyDesarrollo en Inteligencia ArtificialLa presente investigación se centra en la aplicación de modelos de aprendizaje automático y minería de datos para la toma de decisiones en la agricultura colombiana, con un enfoque particular en la predicción de precios del mercado agrícola. En un contexto donde la agricultura enfrenta desafíos significativos debido a la variabilidad climática, fluctuaciones de mercado y cambios en las políticas, el uso de técnicas avanzadas de análisis se vuelve crucial para optimizar la producción y maximizar los ingresos de los agricultores. El estudio comienza con una revisión exhaustiva del marco teórico relacionado con el aprendizaje automático, incluyendo modelos de regresión lineal y no lineal, así como técnicas de aprendizaje supervisado y no supervisado. Se exploran diferentes algoritmos de machine learning, tales como redes neuronales, árboles de decisión y modelos basados en soporte vectorial. La investigación también aborda la importancia del análisis exploratorio de datos (EDA) y el preprocesamiento de datos, elementos esenciales para asegurar la calidad y relevancia de los modelos predictivos. A través de un diseño metodológico riguroso, se seleccionaron herramientas y tecnologías adecuadas para el análisis. Se caracterizó una base de datos que incluye variables climáticas, económicas y geográficas relevantes para el sector agrícola. El modelo predictivo propuesto se validó mediante comparaciones con otros enfoques existentes, demostrando su eficacia en términos de precisión y escalabilidad. Los resultados obtenidos indican que los modelos basados en técnicas avanzadas no solo mejoran la precisión en la predicción de precios, sino que también ofrecen a los agricultores información valiosa para la toma de decisiones estratégicas. Este trabajo contribuye significativamente al campo de la inteligencia artificial aplicada a la agricultura, proporcionando un marco útil para futuras investigaciones y aplicaciones prácticas. Finalmente, se discuten las limitaciones del estudio y se sugieren direcciones para investigaciones futuras que podrían incluir el uso de datos en tiempo real y el desarrollo de sistemas más integrados que consideren diversas variables que afectan al sector agrícola. (Tomado de la fuente)Item type: Ítem , Análisis dinámico de la sostenibilidad en una empresa de investigación de mercados : un estudio de caso(Universidad Nacional de Colombia - Sede Medellín, 2025-03-15) Córdoba Mena, Verónica; Arango Aramburo, SantiagoEste estudio de caso tiene como objetivo analizar de manera dinámica la sostenibilidad de una empresa colombiana de investigación de mercados (EIM) de tamaño mediano, explorando desde una perspectiva teórico-práctica cómo las estrategias emplean las capacidades dinámicas sostenibles para generar ventajas competitivas. Al emplear la metodología de modelado de dinámica de sistemas, se establece el problema, se formula la hipótesis dinámica y se elabora un modelo básico de la estructura operativa para el análisis de la organización. Esto posibilitó comprender cómo diversas estrategias pueden impulsar el estancamiento o consolidación de la posición competitiva, teniendo en cuenta la capacidad de la organización para responder a las variaciones en las circunstancias del mercado. En última instancia, se concluye que las estrategias dirigidas hacia la sostenibilidad empresarial tienen el potencial de generar ventajas competitivas sostenibles, si las capacidades de monitoreo, adaptación y transformación desarrolladas le permitan a la empresa gestionar de manera adecuada los cambios del mercado. (Tomado de la fuente)