Agente multimodal basado en LLM y RAG para el diagnóstico del tizón tardío (Phytophthora infestans) en Tomate (Solanum lycopersicum)

Cargando...
Miniatura

Editor

Document language:

Español

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Documentos PDF

Resumen

El tizón tardío (Phytophthora infestans) es una enfermedad devastadora para el cultivo de tomate que impone severos riesgos a su producción, requiriendo una identificación rápida y certera. Este proyecto aborda dicha problemática mediante el desarrollo e implementación de un agente de diagnóstico multimodal, diseñado como una herramienta tecnológica avanzada para asistir en la detección y manejo oportuno de esta patología. Para materializar esta solución, el sistema integra visión por computador y recuperación de información, orquestados mediante una arquitectura de flujo de grafos (LangGraph). El núcleo visual consta de una Red Neuronal Convolucional (CNN) personalizada para la clasificación de imágenes, mientras que el componente cognitivo emplea un sistema de Generación Aumentada por Recuperación (RAG) fundamentado en un corpus agronómico especializado. Esta integración permite ejecutar una estrategia de recuperación estratificada que adapta las respuestas técnicas al perfil del usuario (Campesino, Técnico o Urgencia), gestionada a través de una interfaz web con memoria conversacional y un algoritmo de severidad multifactorial. Los resultados validan la robustez del desarrollo: el clasificador visual alcanzó una exactitud del 97.62% en el conjunto de prueba independiente. Por su parte, la evaluación del módulo RAG confirmó un diseño de alta fiabilidad, logrando una calidad de ranking sobresaliente. Se estableció un balance estratégico que privilegia la seguridad de la información sobre la cantidad de resultados. En conclusión, el proyecto demuestra la viabilidad técnica de fusionar evidencia visual y textual para ofrecer diagnósticos precisos, verificados y contextualmente adaptados. (Texto tomado de la fuente)

Abstract

Late blight (Phytophthora infestans) is a devastating disease for tomato crops that poses severe risks to production, requiring rapid and accurate identification. This project addresses this challenge through the development and implementation of a multimodal diagnostic agent, designed as an advanced technological tool to assist in the detection and timely management of this pathology. To realize this solution, the system integrates computer vision and information retrieval, orchestrated through a graph flow architecture (LangGraph). The visual core comprises a custom Convolutional Neural Network (CNN) for image classification, while the cognitive component employs a Retrieval-Augmented Generation (RAG) system grounded in a specialized agronomic corpus. This integration enables the execution of a stratified retrieval strategy that adapts technical responses to the user profile (Farmer, Technician, or Emergency), managed through a web interface featuring conversational memory and a multi-factorial severity algorithm. The results validate the robustness of the development: the visual classifier achieved an accuracy of 97.62% on the independent test set. Furthermore, the evaluation of the RAG module confirmed a high-reliability design, achieving outstanding ranking quality. A strategic balance was established that prioritizes information safety over the quantity of results. In conclusion, the project demonstrates the technical feasibility of fusing visual and textual evidence to offer precise, verified, and contextually adapted diagnoses

Descripción

ilustraciones a color, diagramas, fotografías

Palabras clave

Citación