Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado : caso de estudio del proceso de facturación

dc.contributor.advisorPerdomo Charry, Oscar Julián
dc.contributor.authorCoronado Cabarcas, Yarelmis
dc.contributor.researchgroupMindlab
dc.date.accessioned2025-12-18T13:42:12Z
dc.date.available2025-12-18T13:42:12Z
dc.date.issued2025
dc.descriptionilustraciones a color, diagramasspa
dc.description.abstractEste trabajo presenta un marco metodológico optimizado para auditoría continua en empresas de servicios públicos, con énfasis en el proceso de facturación, mediante el uso de aprendizaje supervisado. El proyecto surgió ante la necesidad de mejorar la detección de anomalías y riesgos operativos que, bajo enfoques tradicionales, son detectados de forma tardía, afectando la eficiencia y la confiabilidad del proceso auditor. Para ello, se diseñó e implementó un marco estructurado en siete fases, desde el diagnóstico inicial de madurez hasta la retroalimentación del modelo, aplicando metodologías CRISP-DM, COSO-ERM y principios de automatización analítica. Tras una revisión comparativa de modelos de machine learning, se seleccionó Random Forest por su robustez ante datos desbalanceados y su capacidad para capturar patrones no lineales. El modelo fue entrenado y validado con datos ofuscados de facturación, alcanzando un F1-score de 0.61 en la detección de anomalías. Posteriormente, se aplicó a un nuevo conjunto de datos simulados, identificando más de 29 mil alertas de comportamiento atípico, lo que evidenció su potencial como herramienta de apoyo para auditorías automatizadas. Los resultados validan la aplicabilidad del marco propuesto y destacan la importancia de integrar enfoques de inteligencia artificial en los sistemas de control interno del sector público (Texto tomado de la fuente).spa
dc.description.abstractThis thesis presents an optimized methodological framework for continuous auditing in public service companies, focusing on the billing process, through the use of supervised learning. The project addresses the need to improve the detection of anomalies and operational risks, which under traditional approaches are identified too late, affecting audit efficiency and reliability. A structured framework was designed and implemented in seven phases, from initial maturity diagnosis to model feedback, applying CRISP-DM methodology, COSO-ERM, and principles of analytical automation. Following a comparative review of machine learning models, Random Forest was selected due to its robustness against imbalanced data and its ability to capture nonlinear patterns. The model was trained and validated using anonymized billing data, achieving an F1-score of 0.61 in anomaly detection. It was then applied to a new set of simulated data, identifying over 29,000 records with atypical behavior, demonstrating its potential as a support tool for automated audits. The results confirm the applicability of the proposed framework and highlight the relevance of integrating artificial intelligence approaches into internal control systems in the public sector.eng
dc.description.degreelevelMaestría
dc.description.degreenameMagister en Ingeniería de Sistemas y Computación
dc.description.methodsEnfoque aplicado y cuantitativo con diseño exploratorio–descriptivo. Se integraron COSO ERM y COBIT 2019, la metodología CRISP-DM y principios de Auditoría Ágil. Se construyó un marco para auditoría continua basado en aprendizaje supervisado, aplicando modelos de machine learning (Random Forest) sobre datos reales de facturación, con validación mediante métricas como precisión, recall, F1-Score y AUC.
dc.description.researchareaAprendizaje de Máquina
dc.description.technicalinfoLa implementación se desarrolló en Python, empleando librerías como pandas, NumPy, scikit-learn y Matplotlib. El procesamiento y preparación de datos siguió la metodología CRISP-DM, utilizando técnicas de limpieza, transformación y selección de variables. El modelo principal correspondió a un Random Forest Classifier, evaluado mediante métricas como accuracy, precision, recall, F1-Score y AUC. Los datos provienen del proceso de facturación y fueron procesados en entornos Jupyter Notebook y PySpark para pruebas de escalabilidad. El sistema genera un archivo de salida con alertas priorizadas para auditoría continua.spa
dc.description.technicalinfoThe implementation was developed in Python, using libraries such as pandas, NumPy, scikit-learn, and Matplotlib. Data processing and preparation followed the CRISP-DM methodology, applying techniques for data cleaning, transformation, and feature selection. The main model was a Random Forest Classifier, evaluated using metrics such as accuracy, precision, recall, F1-score, and AUC. The data originated from the billing process and were processed in Jupyter Notebook and PySpark environments for scalability testing. The system generates an output file with prioritized alerts to support continuous auditing.eng
dc.format.extent83 páginas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/89229
dc.language.isospa
dc.publisherUniversidad Nacional de Colombia
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotá
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.placeBogotá, Colombia
dc.publisher.programBogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación
dc.relation.referencesAbiola, O., & Sunday, A. (2020). Machine learning techniques in auditing: A review. Journal of Accounting and Financial Management, 6(2), 34–44.
dc.relation.referencesAppelbaum, D. A. (2016). Securing big data provenance for auditors: The big data provenance black box as reliable evidence. Journal of Emerging Technologies in Accounting, 13(1), 17–36. https://doi.org/10.2308/jeta-51473
dc.relation.referencesBakumenko, A., & Elragal, A. (2022). Detecting anomalies in financial data using machine learning algorithms. Systems, 10(5), 130. https://doi.org/10.3390/systems10050130
dc.relation.referencesBruce, B., & Schneier, B. (2015). Applied cryptography: Protocols, algorithms and source code in C (20th anniversary ed.). Wiley.
dc.relation.referencesCICA/AICPA. (1999). CICA/AICPA research study on continuous auditing. En M. A. Vasarhelyi, M. G. Alles, & A. Kogan (Eds.), Continuous auditing: Theory and application. Canadian Institute of Chartered Accountants.
dc.relation.referencesCOSO. (2013). Internal Control – Integrated Framework. Committee of Sponsoring Organizations of the Treadway Commission.
dc.relation.referencesCOSO. (2017). Enterprise Risk Management – Integrating with Strategy and Performance. Committee of Sponsoring Organizations of the Treadway Commission.
dc.relation.referencesCruz, L. (2019). Auditoría y análisis de datos en empresas de servicios públicos. Universidad Nacional de Colombia.
dc.relation.referencesDai, J., & Vasarhelyi, M. A. (2016a). Toward blockchain-based accounting and assurance. Journal of Information Systems, 30(3), 5–21. https://doi.org/10.2308/isys-10416
dc.relation.referencesDai, J., & Vasarhelyi, M. A. (2016b). Toward a real-time audit: Continuous auditing and data analytics. Journal of Information Systems, 30(2), 153–165. https://doi.org/10.2308/isys-10456
dc.relation.referencesEl Emam, K. (2013). Guide to the De-Identification of Personal Health Information. CRC Press.
dc.relation.referencesEulerich, M., & Kalinichenko, A. (2018). The current state and future directions of continuous auditing research: An analysis of the existing literature. Journal of Information Systems, 32(3), 31–51. https://doi.org/10.2308/isys-51813
dc.relation.referencesZhang, C. (Abigail), Cho, S., & Vasarhelyi, M. (2022). Explainable Artificial Intelligence (XAI) in auditing. International Journal of Accounting Information Systems, 46, 100572. https://doi.org/10.1016/j.accinf.2022.100572
dc.relation.referencesGkoulalas-Divanis, A., & Loukides, G. (2011). Medical data privacy handbook. Springer.
dc.relation.referencesHemati, H., Schreyer, M., & Borth, D. (2021). Continual learning for unsupervised anomaly detection in continuous auditing of financial accounting data. arXiv preprint. https://doi.org/10.48550/arXiv.2112.13215
dc.relation.referencesInstitute of Internal Auditors (IIA). (2017). Global Perspectives and Insights: Agile Auditing. IIA.
dc.relation.referencesInstitute of Internal Auditors (IIA). (2020). International Professional Practices Framework (IPPF). The Institute of Internal Auditors.
dc.relation.referencesISACA. (2019). COBIT 2019 Framework: Governance and Management Objectives. ISACA.
dc.relation.referencesKirkos, E. (2021). An overview of fraud detection using data mining techniques. Procedia Computer Science, 170, 698–703. https://doi.org/10.1016/j.procs.2020.03.108
dc.relation.referencesKokina, J., & Davenport, T. H. (2017). The emergence of artificial intelligence: How automation is changing auditing. Journal of Emerging Technologies in Accounting, 14(1), 115–122.
dc.relation.referencesMoeller, R. (2016). Brink's modern internal auditing: A common body of knowledge. Wiley.
dc.relation.referencesPedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830.
dc.relation.referencesSamarati, P., & Sweeney, L. (1998). Protecting privacy when disclosing information: k-anonymity and its enforcement through generalization and suppression. Technical Report, SRI International.
dc.relation.referencesSchreyer, M., Sattarov, T., Borth, D., Dengel, A., & Reimer, B. (2017). Detection of anomalies in large scale accounting data using deep autoencoder networks. arXiv preprint. https://doi.org/10.48550/arXiv.1709.05254
dc.relation.referencesSmith, R. (2020). Big data challenges in modern auditing. International Journal of Auditing, 24(2), 85–101.
dc.relation.referencesSun, L., Zhang, Y., & Yu, P. S. (2018). Machine learning techniques for auditing: A survey and future directions. IEEE Transactions on Knowledge and Data Engineering, 30(4), 728–746.
dc.relation.referencesSun, Y., Li, J., Lu, M., & Guo, Z. (2024). Study of the impact of the Big Data era on accounting and auditing. arXiv preprint. https://arxiv.org/abs/2403.07180
dc.relation.referencesRivera León, F. A. (2017). Análisis del trabajo en las prácticas de auditoría en las empresas de servicios públicos en Lima Metropolitana. Gestión en el Tercer Milenio, 19(38), 51–60. https://doi.org/10.15381/gtm.v19i38.13788
dc.relation.referencesValencia-Duque, L., Mejía Serna, C., & Marulanda, C. (2018). Modelos predictivos para control de fraude en servicios públicos. Universidad Nacional de Colombia.
dc.relation.referencesVasarhelyi, M. A., & Halper, F. B. (1991). The continuous audit of online systems. Auditing: A Journal of Practice & Theory, 10(1), 110–125.
dc.relation.referencesZhang, J., Yang, X., & Appelbaum, D. (2015). Toward effective big data analysis in continuous auditing. Accounting Horizons, 29(2), 469–476. https://doi.org/10.2308/acch-51070
dc.relation.referencesZhou, Y., & Kapoor, G. (2011). Detecting evolutionary financial statement fraud. Decision Support Systems, 50(3), 570–575. https://doi.org/10.1016/j.dss.2010.08.007
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.ddc620 - Ingeniería y operaciones afines::629 - Otras ramas de la ingeniería
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::005 - Programación, programas, datos de computación
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
dc.subject.lembAUDITORIA DE SISTEMASspa
dc.subject.lembElectronic data processing - Auditingeng
dc.subject.lembAPRENDIZAJE SUPERVISADO (APRENDIZAJE AUTOMATICO)spa
dc.subject.lembSupervised learning (Machine learning)eng
dc.subject.lembAPRENDIZAJE AUTOMATICO (INTELIGENCIA ARTIFICIAL)spa
dc.subject.lembMachine learningeng
dc.subject.lembMINERIA DE DATOSspa
dc.subject.lembData miningeng
dc.subject.lembTECNOLOGIA OLAPspa
dc.subject.lembOLAP technologyeng
dc.subject.proposalAuditoría continuaspa
dc.subject.proposalAprendizaje supervisadospa
dc.subject.proposalServicios públicosspa
dc.subject.proposalDetección de anomalíasspa
dc.subject.proposalMachine learningeng
dc.subject.proposalFacturaciónspa
dc.subject.proposalRandom Foresteng
dc.subject.proposalContinuous auditingeng
dc.subject.proposalSupervised learningeng
dc.subject.proposalPublic utilitieseng
dc.subject.proposalAnomaly detectioneng
dc.subject.proposalBillingeng
dc.titleOptimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado : caso de estudio del proceso de facturaciónspa
dc.title.translatedOptimization of continuous auditing in public utilities through a methodological framework based on supervised learning : case study of the billing processeng
dc.typeTrabajo de grado - Maestría
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dcterms.audience.professionaldevelopmentInvestigadores
dcterms.audience.professionaldevelopmentPúblico general
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
FINAL TRABAJO DE GRADO Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado Caso de estudio del proceso de facturación..pdf
Tamaño:
1.01 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería de Sistemas y Computación

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: