Detección de phishing en etapa de detección temprana utilizando características relacionadas a la marca afectada

Barreiro Herrera, Daniel Alejandro

Tesis de Maestría en Ingeniería de Sistemas y Computación (3.832Mb)

Autor

Barreiro Herrera, Daniel Alejandro

Director

Camargo Mendoza, Jorge Eliecer

Tipo de contenido

Trabajo de grado - Maestría

Idioma del documento

Español

Fecha de publicación

2023

@misc{unal_84259, author = {Barreiro Herrera Daniel Alejandro}, title = {Detección de phishing en etapa de detección temprana utilizando características relacionadas a la marca afectada}, year = {2023}, abstract = {El phishing es uno de los ataques cibernéticos sufridos por los usuarios de servicios transaccionales a través de Internet, si bien existe investigación enfocada en detectar ataques de phishing y la literatura muestra resultados con alta efectividad en detección, estos estudios no permiten enfatizar en qué etapa de detección se actúa. Teniendo en cuenta la revisión sistemática de literatura realizada previamente en Barreiro2022, se presenta una descripción general actualizada de la detección de phishing, en este estudio se identificó que el 83% de literatura consultada se centró en la fase de mitigación, donde la metodología funciona de manera reactiva utilizando características estáticas que brindan alta precisión pero fallan en el modelo con el tiempo. Es así como en el presente documento se detallará la implementación de un modelo computacional de detección de phishing basado en la extracción de características de la marca afectada, el cual permita actuar en la etapa de prevención del ataque. Se realiza un análisis exploratorio de datasets de phishing para tres marcas, posteriormente se seleccionan las características de marca y se detallará los detalles de diseño e implementación de los modelos para las tres marcas seleccionadas, probando diferentes modelos de aprendizaje de maquina y analizando el comportamiento de sus características. Finalmente, se analizarán resultados y se presentarán conclusiones para enfatizar la importancia de usar información de marca y mezclar diferentes enfoques para mejorar la detección de etapas tempranas. La contribución de este trabajo se centra en establecer una aproximación diferente que permite construir el modelo adecuado para cada marca, incentivando futuras investigaciones y futuros trabajos relacionados para considerar sus modelos más allá de la alta precisión, y plantear cómo estos pueden proporcionar soluciones eficientes que se pueden integrar en entornos de producción reales para proteger a los usuarios. (Texto tomado de la fuente)}, url = {https://repositorio.unal.edu.co/handle/unal/84259} }TY - GEN T1 - Detección de phishing en etapa de detección temprana utilizando características relacionadas a la marca afectada AU - Barreiro Herrera, Daniel Alejandro Y1 - 2023 UR - https://repositorio.unal.edu.co/handle/unal/84259 PB - Universidad Nacional de Colombia AB - El phishing es uno de los ataques cibernéticos sufridos por los usuarios de servicios transaccionales a través de Internet, si bien existe investigación enfocada en detectar ataques de phishing y la literatura muestra resultados con alta efectividad en detección, estos estudios no permiten enfatizar en qué etapa de detección se actúa. Teniendo en cuenta la revisión sistemática de literatura realizada previamente en Barreiro2022, se presenta una descripción general actualizada de la detección de phishing, en este estudio se identificó que el 83% de literatura consultada se centró en la fase de mitigación, donde la metodología funciona de manera reactiva utilizando características estáticas que brindan alta precisión pero fallan en el modelo con el tiempo. Es así como en el presente documento se detallará la implementación de un modelo computacional de detección de phishing basado en la extracción de características de la marca afectada, el cual permita actuar en la etapa de prevención del ataque. Se realiza un análisis exploratorio de datasets de phishing para tres marcas, posteriormente se seleccionan las características de marca y se detallará los detalles de diseño e implementación de los modelos para las tres marcas seleccionadas, probando diferentes modelos de aprendizaje de maquina y analizando el comportamiento de sus características. Finalmente, se analizarán resultados y se presentarán conclusiones para enfatizar la importancia de usar información de marca y mezclar diferentes enfoques para mejorar la detección de etapas tempranas. La contribución de este trabajo se centra en establecer una aproximación diferente que permite construir el modelo adecuado para cada marca, incentivando futuras investigaciones y futuros trabajos relacionados para considerar sus modelos más allá de la alta precisión, y plantear cómo estos pueden proporcionar soluciones eficientes que se pueden integrar en entornos de producción reales para proteger a los usuarios. (Texto tomado de la fuente) ER -

Resumen

El phishing es uno de los ataques cibernéticos sufridos por los usuarios de servicios transaccionales a través de Internet, si bien existe investigación enfocada en detectar ataques de phishing y la literatura muestra resultados con alta efectividad en detección, estos estudios no permiten enfatizar en qué etapa de detección se actúa. Teniendo en cuenta la revisión sistemática de literatura realizada previamente en Barreiro2022, se presenta una descripción general actualizada de la detección de phishing, en este estudio se identificó que el 83% de literatura consultada se centró en la fase de mitigación, donde la metodología funciona de manera reactiva utilizando características estáticas que brindan alta precisión pero fallan en el modelo con el tiempo. Es así como en el presente documento se detallará la implementación de un modelo computacional de detección de phishing basado en la extracción de características de la marca afectada, el cual permita actuar en la etapa de prevención del ataque. Se realiza un análisis exploratorio de datasets de phishing para tres marcas, posteriormente se seleccionan las características de marca y se detallará los detalles de diseño e implementación de los modelos para las tres marcas seleccionadas, probando diferentes modelos de aprendizaje de maquina y analizando el comportamiento de sus características. Finalmente, se analizarán resultados y se presentarán conclusiones para enfatizar la importancia de usar información de marca y mezclar diferentes enfoques para mejorar la detección de etapas tempranas. La contribución de este trabajo se centra en establecer una aproximación diferente que permite construir el modelo adecuado para cada marca, incentivando futuras investigaciones y futuros trabajos relacionados para considerar sus modelos más allá de la alta precisión, y plantear cómo estos pueden proporcionar soluciones eficientes que se pueden integrar en entornos de producción reales para proteger a los usuarios. (Texto tomado de la fuente)

Abstract

Phishing is one of the cyber attacks suffered by users of transactional services over the Internet, although there is research focused on detecting phishing attacks and the literature shows highly effective results in detection, these studies do not allow emphasize at what stage of detection is acted on. Taking into account the systematic review of literature previously carried out in Barreiro2022, an updated general description of phishing detection is presented, in this study, it was identified that 83% of the selected literature focused on the mitigation phase, where the methodology works reactively using static features that provide high accuracy but fail in the model over time. This is how this document will detail the implementation of a phishing detection computational model based on the extraction of characteristics of the affected brand and that also allows acting in the attack prevention stage. An exploratory analysis of phishing datasets for three brands is carried out, then the brand characteristics are selected and the details of the design and implementation of the models for the three selected brands will be detailed, testing different machine learning models and analyzing the feature's performance. Finally, results will be analyzed and conclusions will be presented to emphasize the importance of using brand information and mixing different approaches to improve early-stage detection. The contribution of this work is focused on establishing another approach for building the best solution for each brand, encouraging future research and future related work to consider their models beyond high precision, and proposing how these models can provide efficient solutions that can be integrated into production environments to protect the users.

Palabras clave

Phishing ; Detección ; Marca ; Proactividad ; Etapa temprana ; Phishing ; Detection ; Brand ; Early stage ; Proactivity ; Phishing ;

URI

https://repositorio.unal.edu.co/handle/unal/84259

Colecciones

Maestría en Ingeniería - Sistemas y Computación [311]

Atribución-NoComercial 4.0 Internacional

Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito