Deep learning for top tagging

Riaño Reyes, Diana Catalina

Deep learning for top tagging

Archivos

Tesis de Maestría en Estadística (6.4 MB)

Autores

Riaño Reyes, Diana Catalina

Director

Sandoval Usme, Carlos Eduardo

Tipo de contenido

Trabajo de grado - Maestría

Document language:

Inglés

Fecha

2025

Documentos PDF

Resumen

El jet tagging, una tarea de clasificación crucial en la física de altas energías, se ha beneficiado cada vez más de la aplicación del deep learning. Mientras que los enfoques anteriores han representado los jets como imágenes o secuencias, los métodos modernos aprovechan las representaciones de nubes de partículas invariantes a la permutación con arquitecturas como el Particle Transformer (ParT). Este trabajo presenta una investigación del modelo ParT, comenzando con un análisis exploratorio de datos (EDA) de las características a nivel de jet y de partícula, seguido del entrenamiento del modelo adaptado a los recursos computacionales disponibles y una rigurosa evaluación de su rendimiento. El análisis revela que el rendimiento superior de arquitecturas como ParT no depende únicamente de la complejidad del modelo, sino que se ve significativamente potenciado por la integración de características informadas por la física. Esto subraya la importancia primordial de la calidad de las características y el conocimiento específico del dominio para garantizar que los modelos de deep learning puedan capturar eficazmente las relaciones físicas subyacentes en tareas de alta discriminación. La ingeniería de features es el factor más crítico, elevando el potencial de descubrimiento en más de un 300 % para jets de heavy flavor. Seguidamente, la arquitectura del modelo es decisiva, con ParT mejorando el descubrimiento en un 60 % en promedio. El tamaño del dataset tiene un impacto secundario. (Texto tomado de la fuente)

Abstract

Jet tagging, a critical classification task in high-energy physics, has increasingly benefited from the application of deep learning. While previous approaches have represented jets as images or sequences, modern methods leverage permutation-invariant particle cloud representations with architectures like the Particle Transformer (ParT). This work presents an investigation of the ParT model, beginning with an exploratory data analysis (EDA) of jet and particle-level features, followed by model training adapted to available computational resources and a rigorous performance evaluation. The analysis reveals that the superior performance of architectures like ParT is not solely dependent on the complexity of the model but is significantly enhanced by the integration of physics-informed features. This underscores the paramount importance of feature quality and domain-specific knowledge in ensuring that deep learning models can effectively capture the underlying physical relationships in high-discrimination tasks. Comprehensive feature engineering is the most critical performance driver, elevating discovery potential by over 300\% for heavy-flavor jets. Model architecture is the second decisive factor; the ParT model increases the average discovery potential by 60\%. In comparison, dataset size has a secondary, more modest impact.

Palabras clave propuestas

HEP; Deep Learning; Attention mechanisms; Statistical learning; Jet tagging; Física de partículas; Etiquetado de jets; Aprendizaje Profundo; Mecanismos de atención; Aprendizaje estadístico

Descripción

Ilustraciones, diagramas, gráficos

URI

https://repositorio.unal.edu.co/handle/unal/89373

Colecciones

Maestría en Ciencias - Estadística

Página completa del ítem

Deep learning for top tagging

Archivos

Autores

Director

Tipo de contenido

Document language:

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Resumen

Abstract

Palabras clave propuestas

Descripción

Palabras clave

Citación

URI

Colecciones