Reconocimiento 4.0 InternacionalSandoval Usme, Carlos EduardoRiaño Reyes, Diana Catalina2026-02-032026-02-032025https://repositorio.unal.edu.co/handle/unal/89373Ilustraciones, diagramas, gráficosEl jet tagging, una tarea de clasificación crucial en la física de altas energías, se ha beneficiado cada vez más de la aplicación del deep learning. Mientras que los enfoques anteriores han representado los jets como imágenes o secuencias, los métodos modernos aprovechan las representaciones de nubes de partículas invariantes a la permutación con arquitecturas como el Particle Transformer (ParT). Este trabajo presenta una investigación del modelo ParT, comenzando con un análisis exploratorio de datos (EDA) de las características a nivel de jet y de partícula, seguido del entrenamiento del modelo adaptado a los recursos computacionales disponibles y una rigurosa evaluación de su rendimiento. El análisis revela que el rendimiento superior de arquitecturas como ParT no depende únicamente de la complejidad del modelo, sino que se ve significativamente potenciado por la integración de características informadas por la física. Esto subraya la importancia primordial de la calidad de las características y el conocimiento específico del dominio para garantizar que los modelos de deep learning puedan capturar eficazmente las relaciones físicas subyacentes en tareas de alta discriminación. La ingeniería de features es el factor más crítico, elevando el potencial de descubrimiento en más de un 300 % para jets de heavy flavor. Seguidamente, la arquitectura del modelo es decisiva, con ParT mejorando el descubrimiento en un 60 % en promedio. El tamaño del dataset tiene un impacto secundario. (Texto tomado de la fuente)Jet tagging, a critical classification task in high-energy physics, has increasingly benefited from the application of deep learning. While previous approaches have represented jets as images or sequences, modern methods leverage permutation-invariant particle cloud representations with architectures like the Particle Transformer (ParT). This work presents an investigation of the ParT model, beginning with an exploratory data analysis (EDA) of jet and particle-level features, followed by model training adapted to available computational resources and a rigorous performance evaluation. The analysis reveals that the superior performance of architectures like ParT is not solely dependent on the complexity of the model but is significantly enhanced by the integration of physics-informed features. This underscores the paramount importance of feature quality and domain-specific knowledge in ensuring that deep learning models can effectively capture the underlying physical relationships in high-discrimination tasks. Comprehensive feature engineering is the most critical performance driver, elevating discovery potential by over 300\% for heavy-flavor jets. Model architecture is the second decisive factor; the ParT model increases the average discovery potential by 60\%. In comparison, dataset size has a secondary, more modest impact.xiii, 73 páginasapplication/pdfenghttp://creativecommons.org/licenses/by/4.0/530 - Física::539 - Física moderna000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadoresDeep learning for top taggingTrabajo de grado - MaestríaUniversidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/info:eu-repo/semantics/openAccessRedes neuronales (Computadores)Neural networks (Computer science)HEPDeep LearningAttention mechanismsStatistical learningJet taggingFísica de partículasEtiquetado de jetsAprendizaje ProfundoMecanismos de atenciónAprendizaje estadísticoAprendizaje automático para etiquetado de quarks TopAprendizaje profundo (Inteligencia artificial)Física de partículasColisiones (Física nuclear)