Desarrollo de un algoritmo para detección de anomalías con base en estimación de densidad basada en kernels, matrices de densidad y medidas cuánticas
Author
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2023Metadata
Show full item recordSummary
Esta tesis presenta un algoritmo innovador diseñado para realizar detección de anomalías en diversos conjuntos de datos. Este método, denominado Anomaly Detection through Density Matrices and Fourier Features (AD-DMKDE), integra estimación de densidad basada en kernels (en inglés Kernel Density Estimation o KDE) y aprendizaje de máquina (conocida como Machine Learning en inglés) con las matrices de densidad y la medición cuántica, dos prometedores conceptos provenientes del campo de la computación cuántica. Se establecen las bases teóricas y metodológicas que sustentan este método; asimismo, se presentan los detalles de su desarrollo e implementación. Se realiza una comparación sistemática del algoritmo propuesto contra doce métodos variados de detección de anomalías; AD-DMKDE muestra un rendimiento competitivo al ser aplicado sobre una selección de veinticuatro conjuntos de datos. Se establecen las fortalezas y limitaciones del algoritmo propuesto y, a partir del análisis estadístico de su rendimiento, se enuncian una serie de conclusiones y posibles líneas de trabajo futuro. (Texto tomado d la fuente)Abstract
This thesis presents a novel algorithm designed to perform anomaly detection on multiple data sets. This method, called Anomaly Detection through Density Matrices and Fourier Features (AD-DMKDE), integrates Kernel Density Estimation (KDE) and Machine Learning with density matrices and quantum measurement, two promising concepts from quantum computing. The theoretical and methodological foundations that support this method are established, along with the details of its development and implementation. A systematic comparison of the proposed algorithm with twelve state-of-the-art anomaly detection methods is presented, and AD-DMKDE demonstrates competitive performance when applied on twenty-four benchmark data sets. The strengths and limitations of the proposed algorithm are identified, and based on a statistical analysis of its performance, a series of conclusions and possible lines of future work are stated.Keywords
Collections
