Detección de anomalías en series temporales multivariantes (MTS) basada en métodos de estimación de la densidad.

Cargando...
Miniatura

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Documentos PDF

Resumen

La detección de anomalías en series temporales multivariantes (MTS) es fundamental para la identificación temprana de comportamientos inusuales en datos secuenciales de múltiples variables. Esta trabajo de grado propone un enfoque basado en métodos de estimación de densidad, que permite modelar de forma probabilística la distribución de datos normales y detectar desviaciones significativas como anomalías. Se implementa un modelo de detección de anomalías en series temporales multivariantes basado en métodos de estimación de densidad, y se evalúa exclusivamente sobre el dataset Server Machine Dataset (SMD), el cual proporciona registros reales de múltiples máquinas con diferentes configuraciones operativas. Este conjunto permite validar el modelo en escenarios con alta dimensionalidad, datos desbalanceados y comportamiento variable entre contextos. Los resultados se analizan usando métricas estándar AUC-PR y F1-score. Se diseñó un experimento comparativo frente a métodos del estado del arte, mostrando ventajas en contextos con alta dimensionalidad y datos desbalanceados. Los resultados sugieren que la estimación de densidad permite capturar mejor los patrones normales y mejorar la detección de desviaciones significativas en datos multivariantes. (Texto tomado de la fuente)

Abstract

Anomaly detection in multivariate time series (MTS) is essential for identifying atypical behaviors in complex systems. This thesis proposes an approach based on density estimation methods, which probabilistically model the distribution of normal data to detect significant deviations as anomalies. A multivariate time series anomaly detection model based on density estimation methods is implemented, and it is evaluated exclusively on the Server Machine Dataset (SMD). This dataset contains real-world measurements from multiple machines with diverse operational characteristics, providing a challenging and realistic environment to assess the model’s generalization capabilities. The evaluation focuses on high-dimensional data, class imbalance, and variability across machine types. Results are analyzed using standard metrics such as precision, recall, and F1-score. The proposed approach is expected to outperform traditional models in terms of robustness and generalization, contributing to the advancement of unsupervised techniques for anomaly detection in real-world scenarios.

Descripción

Ilustraciones, gráficos

Palabras clave

Citación