Deep learning for top tagging
Cargando...
Autores
Director
Tipo de contenido
Document language:
Inglés
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
El jet tagging, una tarea de clasificación crucial en la física de altas energías, se ha beneficiado cada vez más de la aplicación del deep learning. Mientras que los enfoques anteriores han representado los jets como imágenes o secuencias, los métodos modernos aprovechan las representaciones de nubes de partículas invariantes a la permutación con arquitecturas como el Particle Transformer (ParT).
Este trabajo presenta una investigación del modelo ParT, comenzando con un análisis exploratorio de datos (EDA) de las características a nivel de jet y de partícula, seguido del entrenamiento del modelo adaptado a los recursos computacionales disponibles y una rigurosa evaluación de su rendimiento. El análisis revela que el rendimiento superior de arquitecturas como ParT no depende únicamente de la complejidad del modelo, sino que se ve significativamente potenciado por la integración de características informadas por la física. Esto subraya la importancia primordial de la calidad de las características y el conocimiento específico del dominio para garantizar que los modelos de deep learning puedan capturar eficazmente las relaciones físicas subyacentes en tareas de alta discriminación. La ingeniería de features es el factor más crítico, elevando el potencial de descubrimiento en más de un 300 % para jets de heavy flavor. Seguidamente, la arquitectura del modelo es decisiva, con ParT mejorando el descubrimiento en un 60 % en promedio. El tamaño del dataset tiene un impacto secundario. (Texto tomado de la fuente)
Abstract
Jet tagging, a critical classification task in high-energy physics, has increasingly benefited from the application of deep learning. While previous approaches have represented jets as images or sequences, modern methods leverage permutation-invariant particle cloud representations with architectures like the Particle Transformer (ParT). This work presents an investigation of the ParT model, beginning with an exploratory data analysis (EDA) of jet and particle-level features, followed by model training adapted to available computational resources and a rigorous performance evaluation. The analysis reveals that the superior performance of architectures like ParT is not solely dependent on the complexity of the model but is significantly enhanced by the integration of physics-informed features. This underscores the paramount importance of feature quality and domain-specific knowledge in ensuring that deep learning models can effectively capture the underlying physical relationships in high-discrimination tasks. Comprehensive feature engineering is the most critical performance driver, elevating discovery potential by over 300\% for heavy-flavor jets. Model architecture is the second decisive factor; the ParT model increases the average discovery potential by 60\%. In comparison, dataset size has a secondary, more modest impact.
Palabras clave propuestas
Descripción
Ilustraciones, diagramas, gráficos

