Del día 22 al 26 de junio, el equipo de gestores del Repositorio Institucional UNAL, estará en receso de actividades administrativas. Durante estos días, puede seguir depositando sus trabajos de grado en la plataforma con normalidad. Retomaremos la publicación de los documentos en estricto orden de llegada tan pronto regresemos de nuestro receso. ¡Gracias por su comprensión!

Modelo de clasificación de indicadores de compromiso de malware para asistencia en procesos de análisis de amenazas

Cargando...
Miniatura

Editor

Document language:

Español

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Documentos PDF

Resumen

El análisis de red en ciberseguridad implica la revisión continua de las alertas generadas por diferentes herramientas perimetrales en la infraestructura. El objetivo es evitar que amenazas como el malware generado por atacantes, comprometan el sistema; la cantidad de detecciones que se pueden generar tiende a ser superior a la capacidad de operación de los equipos. Es por esto que resulta de utilidad validar si los eventos son falsos positivos, o amenazas reales. En este trabajo se diseña un modelo de aprendizaje automático con el objetivo de optimizar el análisis de red en ciberseguridad mediante la clasificación de indicadores de compromiso (IOC) de distribución de malware frente a falsos positivos. La validación de eventos requiere identificar IOC activos para prevenir el compromiso de la integridad, confidencialidad y disponibilidad de la información. El estudio se centra en características de red generadas a partir de una colección de dominios/IPs clasificados por analistas de amenazas y enriquecidos con información tanto privada, como de fuentes externas. Se llevó a cabo un análisis exploratorio de datos y un proceso de entrenamiento de 15 modelos de clasificación. Luego, sobre los tres modelos con mejor desempeño, se realizó una optimización de hiperparámetros; el modelo final obtenido demuestra una exactitud superior al 80% y una tasa de recuperación (recall) cercana al 90% en la detección de IOCs de distribución de malware. (Texto tomado de la fuente)

Abstract

Network analysis in cybersecurity requires the continuous review of alerts generated by the perimetral tools. The objective of this is to prevent threats generated by attackers, such as malware, ever compromising the system; the amount of detections commonly generated tend to be superior to the operationalized capabilities of the teams. This is why it becomes useful to verify whether an event is a false positive or a real threat. This work designs a machine learning model with the goal of optimizing the network analysis through Indicators of compromise (IOC) discrimination, from malware distribution to false positives. Event validation requires a proper identification of active IOCs to prevent the compromise of confidentiality, integrity and availability of the information. This study is centered on network features generated through a collection of domains/IP addresses manually curated by cyber threat intel analysts and enriched with private and OSINT data. EDA was performed, and then 15 classification models were trained. Then, the top 3 performers were selected for hyper-parameter optimization; the final model displays over 80% accuracy and close to 90% recall in the detection of active IOCs distributing malware.

Descripción

ilustraciones a color, diagramas

Palabras clave

Citación