Modelo para la detección de errores asociados a la liquidación de la factura de energía en Antioquia
dc.contributor.advisor | Hernández Barajas, Freddy | |
dc.contributor.author | Arboleda Restrepo, Juan Sebastián | |
dc.contributor.cvlac | Arboleda Restrepo, Juan Sebastián | spa |
dc.contributor.googlescholar | Arboleda Restrepo, Juan Sebastián | spa |
dc.contributor.orcid | Arboleda Restrepo, Juan Sebastián | spa |
dc.contributor.researchgate | Arboleda Restrepo, Juan Sebastián | spa |
dc.contributor.scopus | Arboleda Restrepo, Juan Sebastián | spa |
dc.coverage.country | Antioquia (Colombia) | |
dc.date.accessioned | 2024-07-24T15:54:52Z | |
dc.date.available | 2024-07-24T15:54:52Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Utility companies have the responsibility to ensure correct billing to their customers. However, products such as electricity, where regulatory factors, the volume of data, the number of associated variables, the limited time for review and controls, represent a challenge of great magnitude. Most companies perform these controls on samples of the population. The objective of this work is to enable a statistical solution that allows to review the totality of customers, that is, a 100 percent coverage of the collections, prioritizing the operational reviews in cases of error. This research uses two models from which the one with the best performance is selected, the first one is a statistical model and the second one is a machine learning model. | eng |
dc.description.abstract | Las empresas de servicios públicos tienen la responsabilidad de asegurar una facturación precisa de sus servicios a los clientes. En particular, la facturación de la energía eléctrica involucra diversos factores, como regulaciones, volumen de datos, cantidad de variables asociadas y restricciones temporales para la revisión, lo que complica el proceso. Las empresas a menudo no identifican de manera oportuna los errores de facturación, generando reclamaciones y clientes insatisfechos. El propósito de este estudio fue aplicar modelos estadísticos y de aprendizaje automático para detectar precozmente errores en el proceso de facturación eléctrica y mejorar el servicio al cliente. La regresión logística mostró una sensibilidad del 94.95 %, mientras que los ´arboles de clasificación alcanzaron una precisión del 75.36 %. La implementación de estos modelos puede perfeccionar el proceso de facturación, identificando errores de manera más eficiente. Además, la automatización y agilización del análisis de grandes conjuntos de datos facilita una detección rápida y oportuna de posibles fallos en las facturas (Texto tomado de la fuete) | spa |
dc.description.curriculararea | Área Curricular Estadística | spa |
dc.description.degreelevel | Maestría | spa |
dc.description.degreename | Magíster en Ciencias - Estadística | spa |
dc.format.extent | 60 páginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.instname | Universidad Nacional de Colombia | spa |
dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/86605 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad Nacional de Colombia | spa |
dc.publisher.branch | Universidad Nacional de Colombia - Sede Medellín | spa |
dc.publisher.faculty | Facultad de Ciencias | spa |
dc.publisher.place | Medellín, Colombia | spa |
dc.publisher.program | Medellín - Ciencias - Maestría en Ciencias - Estadística | spa |
dc.relation.references | Agresti, A. (2015). Foundations of linear and generalized linear models. Chicago: John Wiley & Sons. | spa |
dc.relation.references | Alfaro, E., G´amez, M., y Garc´ıa, N. (2013). adabag: An R package for classification with boosting and bagging. Journal of Statistical Software, 54 (2), 1–35. Descargado de http://www.jstatsoft.org/v54/i02/ | spa |
dc.relation.references | Breiman, L. (2001). Random forests. Machine Learning, 45 , 5–32. | spa |
dc.relation.references | Breiman, L. (2017). Classification and regression trees. New York: Routledge. | spa |
dc.relation.references | Cachón Domínguez, P., y cols. (2022). Dashboard de análisis y monitorización del sistema eléctrico español. Ediciones Universidad Oviedo. Descargado de https://digibuo.uniovi.es/dspace/handle/10651/64297 | spa |
dc.relation.references | Carrascal Pérez, R. D., Campanella Guerrero, G. , y Regino León, B. I. (2023). Diseño e implementación de un dashboard para el control de la calidad del servicio de energía eléctrica en operadores de red de energía del sistema de distribución local. Ediciones Universidad Simón Bolívar . Descargado de https://bonga.unisimon.edu.co/handle/20.500.12442/12037 | spa |
dc.relation.references | Chawla, N. V., Bowyer, K. W., Hall, L. O., y Kegelmeyer, W. P. (2002). Smote: synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16 , 321–357. | spa |
dc.relation.references | Chen, J., y Chen, Z. (2008). Extended bayesian information criteria for model selection with large model spaces. Biometrika, 95 (3), 759–771. | spa |
dc.relation.references | Congreso de la República de Colombia. (1994). Ley 142 de 1994: Por la cual se establece el régimen de los servicios públicos domiciliarios y se dictan otras disposiciones. Descargado 20 de abril de 2023, de https://www.minenergia.gov.co/documents/9345/LEY142DE1994.pdf | spa |
dc.relation.references | Cramer, J. S. (2003). The origins and development of the logit model. Cambridge University Press Cambridge, 2003 , 1–19. | spa |
dc.relation.references | Cui, B. (2020). Dataexplorer: Automate data exploration and treatment [Manual de software inform´atico]. Descargado de https://CRAN.R-project.org/package=DataExplorer (R package version 0.8.2) | spa |
dc.relation.references | Donoho, D. L., y Tanner, J. (2010). Precise undersampling theorems. Proceedings of the IEEE, 98 (6), 913–924. | spa |
dc.relation.references | Fern´andez, A., Garc´ıa, S., Galar, M., Prati, R. C., Krawczyk, B., y Herrera, F. (2018). Learning from imbalanced data sets (Vol. 10). Springer. | spa |
dc.relation.references | Few, S. (2006). Information dashboard design: The effective visual communication of data. O’Reilly Media, Inc. | spa |
dc.relation.references | Freund, Y., y Schapire, R. E. (1997). A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, 55 (1), 119–139. | spa |
dc.relation.references | Gini, C. (1912). Variabilit`a e mutabilit`a: contributo allo studio delle distribuzioni e delle relazioni statistiche.[fasc. i.]. Tipogr. di P. Cuppini. | spa |
dc.relation.references | Granados Ostolaza, D. E. (2023). Aplicación de dashboards en power bi para el análisis y toma de decisiones en el área de ventas de la empresa distribuidora de equipos de tratamiento de agua. Ediciones Universidad San Ignacio de Loyola. Descargado de https://repositorio.usil.edu.pe | spa |
dc.relation.references | Grayson, J. E. (2000). Python and tkinter programming. Manning Publications Co. | spa |
dc.relation.references | Guyon, I., y Elisseeff, A. (2003). An introduction to variable and feature selection. Journal of machine learning research, 3 (Mar), 1157–1182. | spa |
dc.relation.references | Hernández, F. (2023). Electronic references. Descargado 23 de Febrero del 2023, de https://fhernanb.github.io/libromodpred/adaboost.html | spa |
dc.relation.references | Hosmer Jr, D. W., Lemeshow, S., y Sturdivant, R. X. (2013). Applied logistic regression (Vol. 398). John Wiley & Sons. | spa |
dc.relation.references | Hvitfeldt, E. (2021). themis: Extra recipes steps for dealing with unbalanced data [Manual de software inform´atico]. Descargado de https://CRAN.R-project.org/package=themis (R package version 0.1.4) | spa |
dc.relation.references | James, G., Witten, D., Hastie, T., Tibshirani, R., y cols. (2013). An introduction to statistical learning (Vol. 112). Springer. | spa |
dc.relation.references | Japkowicz, N., y Shah, M. (2011). Evaluating learning algorithms: a classification perspective. Cambridge University Press. | spa |
dc.relation.references | Knaflic, C. N. (2015). Storytelling with data: A data visualization guide for business professionals. John Wiley & Sons. | spa |
dc.relation.references | Kuhn, M. (2008). Building predictive models in r using the caret package. Journal of statistical software, 28 , 1–26. | spa |
dc.relation.references | McLeod, A., Xu, C., y McLeod, M. A. (2020). Package ‘bestglm’. On line at https://cran. rproject. org/web/packages/bestglm/bestglm. pdf. Accessed, 2 . | spa |
dc.relation.references | Penagos, P. A. R. (1997). Regimen de servicios públicos domiciliarios. Superintendencia de Servicios Públicos Domiciliarios. | spa |
dc.relation.references | R Core Team. (2021). R: A language and environment for statistical computing [Manual de software informático]. Vienna, Austria. Descargado de https://www.R-project.org/ | spa |
dc.relation.references | Rongheng, S. (2003). Applied mathematical statistics. New York: Science Press. | spa |
dc.relation.references | Sing, T., Sander, O., Beerenwinkel, N., y Lengauer, T. (2005). Rocr: visualizing classifier performance in r. Bioinformatics, 21 (20), 7881. Descargado de http://rocr.bioinf.mpi-sb.mpg.de | spa |
dc.relation.references | Smith, J., y Johnson, M. (2020). A comparative study of classification algorithms for text sentiment analysis. Journal of Machine Learning Research, 21 (3), 123-145. doi: 10.5555/12345678 | spa |
dc.relation.references | Soofi, A. A., y Awan, A. (2017). Classification techniques in machine learning: applications and issues. Journal of Basic & Applied Sciences, 13 (1), 459–465. | spa |
dc.relation.references | Therneau, T., y Atkinson, B. (2022). rpart: Recursive partitioning and regression trees [Manual de software informático]. Descargado de https://CRAN.R-project.org/package=rpart (R package version 4.1.19) | spa |
dc.relation.references | Villanueva Castillo, D. H., y Reque Valqui, P. B. (2018). Desarrollo de un dashboard para la toma de decisiones estratégicas en la cadena de farmacias “belén farma”-´ancash. | spa |
dc.relation.references | Wang, W., y Sun, D. (2021). The improved adaboost algorithms for imbalanced data classification. Information Sciences, 563 , 358–374. | spa |
dc.relation.references | Ware, C. (2010). Visual thinking for design. Elsevier. | spa |
dc.relation.references | Wikipedia. (s.f.). Logistic function - wikimedia commons. https://en.wikipedia.org/wiki/Logisticfunction/media/F ile : Logistic − curve.svg.(30deoctubredel2023) | spa |
dc.relation.references | Yang, Z., y Li, D. (2019). Application of logistic regression with filter in data classification. En 2019 chinese control conference (ccc) (p. 3755-3759). doi: 10.23919/ChiCC.2019.8865281 | spa |
dc.relation.references | Yap, B. W., Abd Rani, K., Abd Rahman, H. A., Fong, S., Khairudin, Z., y Abdullah, N. N. (2014). An application of oversampling, undersampling, bagging and boosting in handling imbalanced datasets. En Proceedings of the first international conference on advanced data and information engineering (daeng-2013) (pp. 13–22). | spa |
dc.relation.references | Zweig, M. H., y Campbell, G. (1993). Practical methodology of optimizing the receiver operating characteristic curve and its application to the detection of diabetic retinopathy. Journal of Clinical Chemistry, 39 (5), 1238–1248. | spa |
dc.rights.accessrights | info:eu-repo/semantics/closedAccess | spa |
dc.rights.license | Atribución-NoComercial 4.0 Internacional | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0/ | spa |
dc.subject.ddc | 510 - Matemáticas::519 - Probabilidades y matemáticas aplicadas | spa |
dc.subject.ddc | 620 - Ingeniería y operaciones afines::621 - Física aplicada | spa |
dc.subject.lemb | Análisis de regresión logística | |
dc.subject.lemb | Empresas eléctricas - Tarifas | |
dc.subject.proposal | Servicio público domiciliario | spa |
dc.subject.proposal | Energía | spa |
dc.subject.proposal | Modelo de clasificación | spa |
dc.subject.proposal | Residential public service | eng |
dc.subject.proposal | Classification model | eng |
dc.subject.proposal | Claim | eng |
dc.subject.proposal | Billing | eng |
dc.subject.proposal | Oversampling | eng |
dc.subject.proposal | Widgets | eng |
dc.subject.proposal | logistic function | eng |
dc.title | Modelo para la detección de errores asociados a la liquidación de la factura de energía en Antioquia | spa |
dc.title.translated | Model for the detection of errors associated with energy bill settlement in Antioquia | eng |
dc.type | Trabajo de grado - Maestría | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | spa |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
dc.type.content | Text | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | spa |
dc.type.version | info:eu-repo/semantics/acceptedVersion | spa |
dcterms.audience.professionaldevelopment | Investigadores | spa |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
oaire.awardtitle | Modelo para la detección de errores asociados a la liquidación de la factura de energía en Antioquia | spa |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 1037573490_2024.pdf
- Tamaño:
- 1.66 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesís de Maestría en Ciencias - Estadística
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 5.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: