Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado : caso de estudio del proceso de facturación
| dc.contributor.advisor | Perdomo Charry, Oscar Julián | |
| dc.contributor.author | Coronado Cabarcas, Yarelmis | |
| dc.contributor.researchgroup | Mindlab | |
| dc.date.accessioned | 2025-12-18T13:42:12Z | |
| dc.date.available | 2025-12-18T13:42:12Z | |
| dc.date.issued | 2025 | |
| dc.description | ilustraciones a color, diagramas | spa |
| dc.description.abstract | Este trabajo presenta un marco metodológico optimizado para auditoría continua en empresas de servicios públicos, con énfasis en el proceso de facturación, mediante el uso de aprendizaje supervisado. El proyecto surgió ante la necesidad de mejorar la detección de anomalías y riesgos operativos que, bajo enfoques tradicionales, son detectados de forma tardía, afectando la eficiencia y la confiabilidad del proceso auditor. Para ello, se diseñó e implementó un marco estructurado en siete fases, desde el diagnóstico inicial de madurez hasta la retroalimentación del modelo, aplicando metodologías CRISP-DM, COSO-ERM y principios de automatización analítica. Tras una revisión comparativa de modelos de machine learning, se seleccionó Random Forest por su robustez ante datos desbalanceados y su capacidad para capturar patrones no lineales. El modelo fue entrenado y validado con datos ofuscados de facturación, alcanzando un F1-score de 0.61 en la detección de anomalías. Posteriormente, se aplicó a un nuevo conjunto de datos simulados, identificando más de 29 mil alertas de comportamiento atípico, lo que evidenció su potencial como herramienta de apoyo para auditorías automatizadas. Los resultados validan la aplicabilidad del marco propuesto y destacan la importancia de integrar enfoques de inteligencia artificial en los sistemas de control interno del sector público (Texto tomado de la fuente). | spa |
| dc.description.abstract | This thesis presents an optimized methodological framework for continuous auditing in public service companies, focusing on the billing process, through the use of supervised learning. The project addresses the need to improve the detection of anomalies and operational risks, which under traditional approaches are identified too late, affecting audit efficiency and reliability. A structured framework was designed and implemented in seven phases, from initial maturity diagnosis to model feedback, applying CRISP-DM methodology, COSO-ERM, and principles of analytical automation. Following a comparative review of machine learning models, Random Forest was selected due to its robustness against imbalanced data and its ability to capture nonlinear patterns. The model was trained and validated using anonymized billing data, achieving an F1-score of 0.61 in anomaly detection. It was then applied to a new set of simulated data, identifying over 29,000 records with atypical behavior, demonstrating its potential as a support tool for automated audits. The results confirm the applicability of the proposed framework and highlight the relevance of integrating artificial intelligence approaches into internal control systems in the public sector. | eng |
| dc.description.degreelevel | Maestría | |
| dc.description.degreename | Magister en Ingeniería de Sistemas y Computación | |
| dc.description.methods | Enfoque aplicado y cuantitativo con diseño exploratorio–descriptivo. Se integraron COSO ERM y COBIT 2019, la metodología CRISP-DM y principios de Auditoría Ágil. Se construyó un marco para auditoría continua basado en aprendizaje supervisado, aplicando modelos de machine learning (Random Forest) sobre datos reales de facturación, con validación mediante métricas como precisión, recall, F1-Score y AUC. | |
| dc.description.researcharea | Aprendizaje de Máquina | |
| dc.description.technicalinfo | La implementación se desarrolló en Python, empleando librerías como pandas, NumPy, scikit-learn y Matplotlib. El procesamiento y preparación de datos siguió la metodología CRISP-DM, utilizando técnicas de limpieza, transformación y selección de variables. El modelo principal correspondió a un Random Forest Classifier, evaluado mediante métricas como accuracy, precision, recall, F1-Score y AUC. Los datos provienen del proceso de facturación y fueron procesados en entornos Jupyter Notebook y PySpark para pruebas de escalabilidad. El sistema genera un archivo de salida con alertas priorizadas para auditoría continua. | spa |
| dc.description.technicalinfo | The implementation was developed in Python, using libraries such as pandas, NumPy, scikit-learn, and Matplotlib. Data processing and preparation followed the CRISP-DM methodology, applying techniques for data cleaning, transformation, and feature selection. The main model was a Random Forest Classifier, evaluated using metrics such as accuracy, precision, recall, F1-score, and AUC. The data originated from the billing process and were processed in Jupyter Notebook and PySpark environments for scalability testing. The system generates an output file with prioritized alerts to support continuous auditing. | eng |
| dc.format.extent | 83 páginas | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | Universidad Nacional de Colombia | spa |
| dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
| dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
| dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/89229 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Nacional de Colombia | |
| dc.publisher.branch | Universidad Nacional de Colombia - Sede Bogotá | |
| dc.publisher.faculty | Facultad de Ingeniería | |
| dc.publisher.place | Bogotá, Colombia | |
| dc.publisher.program | Bogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación | |
| dc.relation.references | Abiola, O., & Sunday, A. (2020). Machine learning techniques in auditing: A review. Journal of Accounting and Financial Management, 6(2), 34–44. | |
| dc.relation.references | Appelbaum, D. A. (2016). Securing big data provenance for auditors: The big data provenance black box as reliable evidence. Journal of Emerging Technologies in Accounting, 13(1), 17–36. https://doi.org/10.2308/jeta-51473 | |
| dc.relation.references | Bakumenko, A., & Elragal, A. (2022). Detecting anomalies in financial data using machine learning algorithms. Systems, 10(5), 130. https://doi.org/10.3390/systems10050130 | |
| dc.relation.references | Bruce, B., & Schneier, B. (2015). Applied cryptography: Protocols, algorithms and source code in C (20th anniversary ed.). Wiley. | |
| dc.relation.references | CICA/AICPA. (1999). CICA/AICPA research study on continuous auditing. En M. A. Vasarhelyi, M. G. Alles, & A. Kogan (Eds.), Continuous auditing: Theory and application. Canadian Institute of Chartered Accountants. | |
| dc.relation.references | COSO. (2013). Internal Control – Integrated Framework. Committee of Sponsoring Organizations of the Treadway Commission. | |
| dc.relation.references | COSO. (2017). Enterprise Risk Management – Integrating with Strategy and Performance. Committee of Sponsoring Organizations of the Treadway Commission. | |
| dc.relation.references | Cruz, L. (2019). Auditoría y análisis de datos en empresas de servicios públicos. Universidad Nacional de Colombia. | |
| dc.relation.references | Dai, J., & Vasarhelyi, M. A. (2016a). Toward blockchain-based accounting and assurance. Journal of Information Systems, 30(3), 5–21. https://doi.org/10.2308/isys-10416 | |
| dc.relation.references | Dai, J., & Vasarhelyi, M. A. (2016b). Toward a real-time audit: Continuous auditing and data analytics. Journal of Information Systems, 30(2), 153–165. https://doi.org/10.2308/isys-10456 | |
| dc.relation.references | El Emam, K. (2013). Guide to the De-Identification of Personal Health Information. CRC Press. | |
| dc.relation.references | Eulerich, M., & Kalinichenko, A. (2018). The current state and future directions of continuous auditing research: An analysis of the existing literature. Journal of Information Systems, 32(3), 31–51. https://doi.org/10.2308/isys-51813 | |
| dc.relation.references | Zhang, C. (Abigail), Cho, S., & Vasarhelyi, M. (2022). Explainable Artificial Intelligence (XAI) in auditing. International Journal of Accounting Information Systems, 46, 100572. https://doi.org/10.1016/j.accinf.2022.100572 | |
| dc.relation.references | Gkoulalas-Divanis, A., & Loukides, G. (2011). Medical data privacy handbook. Springer. | |
| dc.relation.references | Hemati, H., Schreyer, M., & Borth, D. (2021). Continual learning for unsupervised anomaly detection in continuous auditing of financial accounting data. arXiv preprint. https://doi.org/10.48550/arXiv.2112.13215 | |
| dc.relation.references | Institute of Internal Auditors (IIA). (2017). Global Perspectives and Insights: Agile Auditing. IIA. | |
| dc.relation.references | Institute of Internal Auditors (IIA). (2020). International Professional Practices Framework (IPPF). The Institute of Internal Auditors. | |
| dc.relation.references | ISACA. (2019). COBIT 2019 Framework: Governance and Management Objectives. ISACA. | |
| dc.relation.references | Kirkos, E. (2021). An overview of fraud detection using data mining techniques. Procedia Computer Science, 170, 698–703. https://doi.org/10.1016/j.procs.2020.03.108 | |
| dc.relation.references | Kokina, J., & Davenport, T. H. (2017). The emergence of artificial intelligence: How automation is changing auditing. Journal of Emerging Technologies in Accounting, 14(1), 115–122. | |
| dc.relation.references | Moeller, R. (2016). Brink's modern internal auditing: A common body of knowledge. Wiley. | |
| dc.relation.references | Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830. | |
| dc.relation.references | Samarati, P., & Sweeney, L. (1998). Protecting privacy when disclosing information: k-anonymity and its enforcement through generalization and suppression. Technical Report, SRI International. | |
| dc.relation.references | Schreyer, M., Sattarov, T., Borth, D., Dengel, A., & Reimer, B. (2017). Detection of anomalies in large scale accounting data using deep autoencoder networks. arXiv preprint. https://doi.org/10.48550/arXiv.1709.05254 | |
| dc.relation.references | Smith, R. (2020). Big data challenges in modern auditing. International Journal of Auditing, 24(2), 85–101. | |
| dc.relation.references | Sun, L., Zhang, Y., & Yu, P. S. (2018). Machine learning techniques for auditing: A survey and future directions. IEEE Transactions on Knowledge and Data Engineering, 30(4), 728–746. | |
| dc.relation.references | Sun, Y., Li, J., Lu, M., & Guo, Z. (2024). Study of the impact of the Big Data era on accounting and auditing. arXiv preprint. https://arxiv.org/abs/2403.07180 | |
| dc.relation.references | Rivera León, F. A. (2017). Análisis del trabajo en las prácticas de auditoría en las empresas de servicios públicos en Lima Metropolitana. Gestión en el Tercer Milenio, 19(38), 51–60. https://doi.org/10.15381/gtm.v19i38.13788 | |
| dc.relation.references | Valencia-Duque, L., Mejía Serna, C., & Marulanda, C. (2018). Modelos predictivos para control de fraude en servicios públicos. Universidad Nacional de Colombia. | |
| dc.relation.references | Vasarhelyi, M. A., & Halper, F. B. (1991). The continuous audit of online systems. Auditing: A Journal of Practice & Theory, 10(1), 110–125. | |
| dc.relation.references | Zhang, J., Yang, X., & Appelbaum, D. (2015). Toward effective big data analysis in continuous auditing. Accounting Horizons, 29(2), 469–476. https://doi.org/10.2308/acch-51070 | |
| dc.relation.references | Zhou, Y., & Kapoor, G. (2011). Detecting evolutionary financial statement fraud. Decision Support Systems, 50(3), 570–575. https://doi.org/10.1016/j.dss.2010.08.007 | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.ddc | 620 - Ingeniería y operaciones afines::629 - Otras ramas de la ingeniería | |
| dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::005 - Programación, programas, datos de computación | |
| dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores | |
| dc.subject.lemb | AUDITORIA DE SISTEMAS | spa |
| dc.subject.lemb | Electronic data processing - Auditing | eng |
| dc.subject.lemb | APRENDIZAJE SUPERVISADO (APRENDIZAJE AUTOMATICO) | spa |
| dc.subject.lemb | Supervised learning (Machine learning) | eng |
| dc.subject.lemb | APRENDIZAJE AUTOMATICO (INTELIGENCIA ARTIFICIAL) | spa |
| dc.subject.lemb | Machine learning | eng |
| dc.subject.lemb | MINERIA DE DATOS | spa |
| dc.subject.lemb | Data mining | eng |
| dc.subject.lemb | TECNOLOGIA OLAP | spa |
| dc.subject.lemb | OLAP technology | eng |
| dc.subject.proposal | Auditoría continua | spa |
| dc.subject.proposal | Aprendizaje supervisado | spa |
| dc.subject.proposal | Servicios públicos | spa |
| dc.subject.proposal | Detección de anomalías | spa |
| dc.subject.proposal | Machine learning | eng |
| dc.subject.proposal | Facturación | spa |
| dc.subject.proposal | Random Forest | eng |
| dc.subject.proposal | Continuous auditing | eng |
| dc.subject.proposal | Supervised learning | eng |
| dc.subject.proposal | Public utilities | eng |
| dc.subject.proposal | Anomaly detection | eng |
| dc.subject.proposal | Billing | eng |
| dc.title | Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado : caso de estudio del proceso de facturación | spa |
| dc.title.translated | Optimization of continuous auditing in public utilities through a methodological framework based on supervised learning : case study of the billing process | eng |
| dc.type | Trabajo de grado - Maestría | |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dcterms.audience.professionaldevelopment | Investigadores | |
| dcterms.audience.professionaldevelopment | Público general | |
| oaire.accessrights | http://purl.org/coar/access_right/c_abf2 |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- FINAL TRABAJO DE GRADO Optimización de la auditoría continua en empresas de servicios públicos mediante un marco metodológico basado en aprendizaje supervisado Caso de estudio del proceso de facturación..pdf
- Tamaño:
- 1.01 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis de Maestría en Ingeniería de Sistemas y Computación
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 5.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:

