Detección de anomalías en series de tiempo utilizando métodos no supervisados
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2025-03-04Metadata
Show full item recordSummary
Este trabajo de investigación se enfoca en el análisis y la comparación de diversos modelos no supervisados para la detección de anomalías en series temporales. Estas series son generadas a partir de patrones estacionales simulados y la introducción de anomalías utilizando cadenas de Markov. Las series temporales combinan comportamientos cíclicos y componentes estacionales, empleando funciones de coseno ajustadas y valores generados a partir de distribuciones de Poisson. Las anomalías son inyectadas mediante una matriz de transición que altera el comportamiento esperado de la serie, simulando eventos raros o atípicos. Este enfoque permite generar datos que imitan situaciones reales en las que las anomalías son eventos poco frecuentes y difíciles de predecir. Los modelos evaluados incluyen Isolation Forest, Autoencoders y K-Nearest Neighbors (KNN), los cuales fueron seleccionados por su eficacia en diferentes contextos de detección de anomalías. Cada uno de estos modelos se sometió a una evaluación exhaustiva utilizando métricas como la precisión, el recall, el F1-score, la exactitud, así como las tasas de falsos positivos y negativos. Los resultados obtenidos muestran que los Autoencoders son particularmente efectivos para detectar anomalías complejas y no lineales, mientras que el Isolation Forest sobresale en la identificación de outliers en conjuntos de datos con alta dimensionalidad. Por otro lado, el K-Nearest Neighbors (KNN) demostró ser útil en la detección de anomalías en entornos con menor dimensionalidad y patrones de proximidad bien definidos, donde las anomalías se caracterizan por estar alejadas de los puntos normales. (Texto tomado de la fuente)Abstract
This research focuses on the analysis and comparison of various unsupervised models for anomaly detection in time series data. These series are generated from simulated seasonal patterns and the introduction of anomalies using Markov chains. The time series combine cyclical behaviors and seasonal components, using adjusted cosine functions and values generated from Poisson distributions. Anomalies are injected through a transition matrix that alters the expected behavior of the series, simulating rare or atypical events. This approach allows for the generation of data that mimic real-world situations where anomalies are infrequent and difficult to predict. The evaluated models include Isolation Forest, Autoencoders, and K-Nearest Neighbors (KNN), which were selected for their effectiveness in different anomaly detection contexts. Each of these models underwent a comprehensive evaluation using metrics such as precision, recall, F1-score, accuracy, as well as false positive and false negative rates. The results show that Autoencoders are particularly effective in detecting complex and non-linear anomalies, while Isolation Forest excels at identifying outliers in high-dimensional datasets. On the other hand, K-Nearest Neighbors (KNN) proved to be useful for detecting anomalies in lower-dimensional environments and welldefined proximity patterns, where anomalies are characterized by being far from normal data pointsKeywords
Collections
