Optimización de la auditoría continua  en empresas de servicios públicos  mediante un marco metodológico  basado en aprendizaje supervisado : caso de estudio del proceso de  facturación

Coronado Cabarcas, Yarelmis

Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado : caso de estudio del proceso de facturación

dc.contributor.advisor	Perdomo Charry, Oscar Julián
dc.contributor.author	Coronado Cabarcas, Yarelmis
dc.contributor.researchgroup	Mindlab
dc.date.accessioned	2025-12-18T13:42:12Z
dc.date.available	2025-12-18T13:42:12Z
dc.date.issued	2025
dc.description	ilustraciones a color, diagramas	spa
dc.description.abstract	Este trabajo presenta un marco metodológico optimizado para auditoría continua en empresas de servicios públicos, con énfasis en el proceso de facturación, mediante el uso de aprendizaje supervisado. El proyecto surgió ante la necesidad de mejorar la detección de anomalías y riesgos operativos que, bajo enfoques tradicionales, son detectados de forma tardía, afectando la eficiencia y la confiabilidad del proceso auditor. Para ello, se diseñó e implementó un marco estructurado en siete fases, desde el diagnóstico inicial de madurez hasta la retroalimentación del modelo, aplicando metodologías CRISP-DM, COSO-ERM y principios de automatización analítica. Tras una revisión comparativa de modelos de machine learning, se seleccionó Random Forest por su robustez ante datos desbalanceados y su capacidad para capturar patrones no lineales. El modelo fue entrenado y validado con datos ofuscados de facturación, alcanzando un F1-score de 0.61 en la detección de anomalías. Posteriormente, se aplicó a un nuevo conjunto de datos simulados, identificando más de 29 mil alertas de comportamiento atípico, lo que evidenció su potencial como herramienta de apoyo para auditorías automatizadas. Los resultados validan la aplicabilidad del marco propuesto y destacan la importancia de integrar enfoques de inteligencia artificial en los sistemas de control interno del sector público (Texto tomado de la fuente).	spa
dc.description.abstract	This thesis presents an optimized methodological framework for continuous auditing in public service companies, focusing on the billing process, through the use of supervised learning. The project addresses the need to improve the detection of anomalies and operational risks, which under traditional approaches are identified too late, affecting audit efficiency and reliability. A structured framework was designed and implemented in seven phases, from initial maturity diagnosis to model feedback, applying CRISP-DM methodology, COSO-ERM, and principles of analytical automation. Following a comparative review of machine learning models, Random Forest was selected due to its robustness against imbalanced data and its ability to capture nonlinear patterns. The model was trained and validated using anonymized billing data, achieving an F1-score of 0.61 in anomaly detection. It was then applied to a new set of simulated data, identifying over 29,000 records with atypical behavior, demonstrating its potential as a support tool for automated audits. The results confirm the applicability of the proposed framework and highlight the relevance of integrating artificial intelligence approaches into internal control systems in the public sector.	eng
dc.description.degreelevel	Maestría
dc.description.degreename	Magister en Ingeniería de Sistemas y Computación
dc.description.methods	Enfoque aplicado y cuantitativo con diseño exploratorio–descriptivo. Se integraron COSO ERM y COBIT 2019, la metodología CRISP-DM y principios de Auditoría Ágil. Se construyó un marco para auditoría continua basado en aprendizaje supervisado, aplicando modelos de machine learning (Random Forest) sobre datos reales de facturación, con validación mediante métricas como precisión, recall, F1-Score y AUC.
dc.description.researcharea	Aprendizaje de Máquina
dc.description.technicalinfo	La implementación se desarrolló en Python, empleando librerías como pandas, NumPy, scikit-learn y Matplotlib. El procesamiento y preparación de datos siguió la metodología CRISP-DM, utilizando técnicas de limpieza, transformación y selección de variables. El modelo principal correspondió a un Random Forest Classifier, evaluado mediante métricas como accuracy, precision, recall, F1-Score y AUC. Los datos provienen del proceso de facturación y fueron procesados en entornos Jupyter Notebook y PySpark para pruebas de escalabilidad. El sistema genera un archivo de salida con alertas priorizadas para auditoría continua.	spa
dc.description.technicalinfo	The implementation was developed in Python, using libraries such as pandas, NumPy, scikit-learn, and Matplotlib. Data processing and preparation followed the CRISP-DM methodology, applying techniques for data cleaning, transformation, and feature selection. The main model was a Random Forest Classifier, evaluated using metrics such as accuracy, precision, recall, F1-score, and AUC. The data originated from the billing process and were processed in Jupyter Notebook and PySpark environments for scalability testing. The system generates an output file with prioritized alerts to support continuous auditing.	eng
dc.format.extent	83 páginas
dc.format.mimetype	application/pdf
dc.identifier.instname	Universidad Nacional de Colombia	spa
dc.identifier.reponame	Repositorio Institucional Universidad Nacional de Colombia	spa
dc.identifier.repourl	https://repositorio.unal.edu.co/	spa
dc.identifier.uri	https://repositorio.unal.edu.co/handle/unal/89229
dc.language.iso	spa
dc.publisher	Universidad Nacional de Colombia
dc.publisher.branch	Universidad Nacional de Colombia - Sede Bogotá
dc.publisher.faculty	Facultad de Ingeniería
dc.publisher.place	Bogotá, Colombia
dc.publisher.program	Bogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación
dc.relation.references	Abiola, O., & Sunday, A. (2020). Machine learning techniques in auditing: A review. Journal of Accounting and Financial Management, 6(2), 34–44.
dc.relation.references	Appelbaum, D. A. (2016). Securing big data provenance for auditors: The big data provenance black box as reliable evidence. Journal of Emerging Technologies in Accounting, 13(1), 17–36. https://doi.org/10.2308/jeta-51473
dc.relation.references	Bakumenko, A., & Elragal, A. (2022). Detecting anomalies in financial data using machine learning algorithms. Systems, 10(5), 130. https://doi.org/10.3390/systems10050130
dc.relation.references	Bruce, B., & Schneier, B. (2015). Applied cryptography: Protocols, algorithms and source code in C (20th anniversary ed.). Wiley.
dc.relation.references	CICA/AICPA. (1999). CICA/AICPA research study on continuous auditing. En M. A. Vasarhelyi, M. G. Alles, & A. Kogan (Eds.), Continuous auditing: Theory and application. Canadian Institute of Chartered Accountants.
dc.relation.references	COSO. (2013). Internal Control – Integrated Framework. Committee of Sponsoring Organizations of the Treadway Commission.
dc.relation.references	COSO. (2017). Enterprise Risk Management – Integrating with Strategy and Performance. Committee of Sponsoring Organizations of the Treadway Commission.
dc.relation.references	Cruz, L. (2019). Auditoría y análisis de datos en empresas de servicios públicos. Universidad Nacional de Colombia.
dc.relation.references	Dai, J., & Vasarhelyi, M. A. (2016a). Toward blockchain-based accounting and assurance. Journal of Information Systems, 30(3), 5–21. https://doi.org/10.2308/isys-10416
dc.relation.references	Dai, J., & Vasarhelyi, M. A. (2016b). Toward a real-time audit: Continuous auditing and data analytics. Journal of Information Systems, 30(2), 153–165. https://doi.org/10.2308/isys-10456
dc.relation.references	El Emam, K. (2013). Guide to the De-Identification of Personal Health Information. CRC Press.
dc.relation.references	Eulerich, M., & Kalinichenko, A. (2018). The current state and future directions of continuous auditing research: An analysis of the existing literature. Journal of Information Systems, 32(3), 31–51. https://doi.org/10.2308/isys-51813
dc.relation.references	Zhang, C. (Abigail), Cho, S., & Vasarhelyi, M. (2022). Explainable Artificial Intelligence (XAI) in auditing. International Journal of Accounting Information Systems, 46, 100572. https://doi.org/10.1016/j.accinf.2022.100572
dc.relation.references	Gkoulalas-Divanis, A., & Loukides, G. (2011). Medical data privacy handbook. Springer.
dc.relation.references	Hemati, H., Schreyer, M., & Borth, D. (2021). Continual learning for unsupervised anomaly detection in continuous auditing of financial accounting data. arXiv preprint. https://doi.org/10.48550/arXiv.2112.13215
dc.relation.references	Institute of Internal Auditors (IIA). (2017). Global Perspectives and Insights: Agile Auditing. IIA.
dc.relation.references	Institute of Internal Auditors (IIA). (2020). International Professional Practices Framework (IPPF). The Institute of Internal Auditors.
dc.relation.references	ISACA. (2019). COBIT 2019 Framework: Governance and Management Objectives. ISACA.
dc.relation.references	Kirkos, E. (2021). An overview of fraud detection using data mining techniques. Procedia Computer Science, 170, 698–703. https://doi.org/10.1016/j.procs.2020.03.108
dc.relation.references	Kokina, J., & Davenport, T. H. (2017). The emergence of artificial intelligence: How automation is changing auditing. Journal of Emerging Technologies in Accounting, 14(1), 115–122.
dc.relation.references	Moeller, R. (2016). Brink's modern internal auditing: A common body of knowledge. Wiley.
dc.relation.references	Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830.
dc.relation.references	Samarati, P., & Sweeney, L. (1998). Protecting privacy when disclosing information: k-anonymity and its enforcement through generalization and suppression. Technical Report, SRI International.
dc.relation.references	Schreyer, M., Sattarov, T., Borth, D., Dengel, A., & Reimer, B. (2017). Detection of anomalies in large scale accounting data using deep autoencoder networks. arXiv preprint. https://doi.org/10.48550/arXiv.1709.05254
dc.relation.references	Smith, R. (2020). Big data challenges in modern auditing. International Journal of Auditing, 24(2), 85–101.
dc.relation.references	Sun, L., Zhang, Y., & Yu, P. S. (2018). Machine learning techniques for auditing: A survey and future directions. IEEE Transactions on Knowledge and Data Engineering, 30(4), 728–746.
dc.relation.references	Sun, Y., Li, J., Lu, M., & Guo, Z. (2024). Study of the impact of the Big Data era on accounting and auditing. arXiv preprint. https://arxiv.org/abs/2403.07180
dc.relation.references	Rivera León, F. A. (2017). Análisis del trabajo en las prácticas de auditoría en las empresas de servicios públicos en Lima Metropolitana. Gestión en el Tercer Milenio, 19(38), 51–60. https://doi.org/10.15381/gtm.v19i38.13788
dc.relation.references	Valencia-Duque, L., Mejía Serna, C., & Marulanda, C. (2018). Modelos predictivos para control de fraude en servicios públicos. Universidad Nacional de Colombia.
dc.relation.references	Vasarhelyi, M. A., & Halper, F. B. (1991). The continuous audit of online systems. Auditing: A Journal of Practice & Theory, 10(1), 110–125.
dc.relation.references	Zhang, J., Yang, X., & Appelbaum, D. (2015). Toward effective big data analysis in continuous auditing. Accounting Horizons, 29(2), 469–476. https://doi.org/10.2308/acch-51070
dc.relation.references	Zhou, Y., & Kapoor, G. (2011). Detecting evolutionary financial statement fraud. Decision Support Systems, 50(3), 570–575. https://doi.org/10.1016/j.dss.2010.08.007
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.rights.license	Atribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.ddc	620 - Ingeniería y operaciones afines::629 - Otras ramas de la ingeniería
dc.subject.ddc	000 - Ciencias de la computación, información y obras generales::005 - Programación, programas, datos de computación
dc.subject.ddc	000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
dc.subject.lemb	AUDITORIA DE SISTEMAS	spa
dc.subject.lemb	Electronic data processing - Auditing	eng
dc.subject.lemb	APRENDIZAJE SUPERVISADO (APRENDIZAJE AUTOMATICO)	spa
dc.subject.lemb	Supervised learning (Machine learning)	eng
dc.subject.lemb	APRENDIZAJE AUTOMATICO (INTELIGENCIA ARTIFICIAL)	spa
dc.subject.lemb	Machine learning	eng
dc.subject.lemb	MINERIA DE DATOS	spa
dc.subject.lemb	Data mining	eng
dc.subject.lemb	TECNOLOGIA OLAP	spa
dc.subject.lemb	OLAP technology	eng
dc.subject.proposal	Auditoría continua	spa
dc.subject.proposal	Aprendizaje supervisado	spa
dc.subject.proposal	Servicios públicos	spa
dc.subject.proposal	Detección de anomalías	spa
dc.subject.proposal	Machine learning	eng
dc.subject.proposal	Facturación	spa
dc.subject.proposal	Random Forest	eng
dc.subject.proposal	Continuous auditing	eng
dc.subject.proposal	Supervised learning	eng
dc.subject.proposal	Public utilities	eng
dc.subject.proposal	Anomaly detection	eng
dc.subject.proposal	Billing	eng
dc.title	Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado : caso de estudio del proceso de facturación	spa
dc.title.translated	Optimization of continuous auditing in public utilities through a methodological framework based on supervised learning : case study of the billing process	eng
dc.type	Trabajo de grado - Maestría
dc.type.coar	http://purl.org/coar/resource_type/c_bdcc
dc.type.coarversion	http://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.content	Text
dc.type.driver	info:eu-repo/semantics/masterThesis
dc.type.redcol	http://purl.org/redcol/resource_type/TM
dc.type.version	info:eu-repo/semantics/acceptedVersion
dcterms.audience.professionaldevelopment	Investigadores
dcterms.audience.professionaldevelopment	Público general
oaire.accessrights	http://purl.org/coar/access_right/c_abf2

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: FINAL TRABAJO DE GRADO Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado Caso de estudio del proceso de facturación..pdf
Tamaño:: 1.01 MB
Formato:: Adobe Portable Document Format
Descripción:: Tesis de Maestría en Ingeniería de Sistemas y Computación

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 5.74 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Maestría en Ingeniería - Sistemas y Computación