Modelo para la detección de errores asociados a la liquidación de la factura de energía en Antioquia

dc.contributor.advisorHernández Barajas, Freddy
dc.contributor.authorArboleda Restrepo, Juan Sebastián
dc.contributor.cvlacArboleda Restrepo, Juan Sebastiánspa
dc.contributor.googlescholarArboleda Restrepo, Juan Sebastiánspa
dc.contributor.orcidArboleda Restrepo, Juan Sebastiánspa
dc.contributor.researchgateArboleda Restrepo, Juan Sebastiánspa
dc.contributor.scopusArboleda Restrepo, Juan Sebastiánspa
dc.coverage.countryAntioquia (Colombia)
dc.date.accessioned2024-07-24T15:54:52Z
dc.date.available2024-07-24T15:54:52Z
dc.date.issued2024
dc.description.abstractUtility companies have the responsibility to ensure correct billing to their customers. However, products such as electricity, where regulatory factors, the volume of data, the number of associated variables, the limited time for review and controls, represent a challenge of great magnitude. Most companies perform these controls on samples of the population. The objective of this work is to enable a statistical solution that allows to review the totality of customers, that is, a 100 percent coverage of the collections, prioritizing the operational reviews in cases of error. This research uses two models from which the one with the best performance is selected, the first one is a statistical model and the second one is a machine learning model.eng
dc.description.abstractLas empresas de servicios públicos tienen la responsabilidad de asegurar una facturación precisa de sus servicios a los clientes. En particular, la facturación de la energía eléctrica involucra diversos factores, como regulaciones, volumen de datos, cantidad de variables asociadas y restricciones temporales para la revisión, lo que complica el proceso. Las empresas a menudo no identifican de manera oportuna los errores de facturación, generando reclamaciones y clientes insatisfechos. El propósito de este estudio fue aplicar modelos estadísticos y de aprendizaje automático para detectar precozmente errores en el proceso de facturación eléctrica y mejorar el servicio al cliente. La regresión logística mostró una sensibilidad del 94.95 %, mientras que los ´arboles de clasificación alcanzaron una precisión del 75.36 %. La implementación de estos modelos puede perfeccionar el proceso de facturación, identificando errores de manera más eficiente. Además, la automatización y agilización del análisis de grandes conjuntos de datos facilita una detección rápida y oportuna de posibles fallos en las facturas (Texto tomado de la fuete)spa
dc.description.curricularareaÁrea Curricular Estadísticaspa
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias - Estadísticaspa
dc.format.extent60 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/86605
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellínspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeMedellín, Colombiaspa
dc.publisher.programMedellín - Ciencias - Maestría en Ciencias - Estadísticaspa
dc.relation.referencesAgresti, A. (2015). Foundations of linear and generalized linear models. Chicago: John Wiley & Sons.spa
dc.relation.referencesAlfaro, E., G´amez, M., y Garc´ıa, N. (2013). adabag: An R package for classification with boosting and bagging. Journal of Statistical Software, 54 (2), 1–35. Descargado de http://www.jstatsoft.org/v54/i02/spa
dc.relation.referencesBreiman, L. (2001). Random forests. Machine Learning, 45 , 5–32.spa
dc.relation.referencesBreiman, L. (2017). Classification and regression trees. New York: Routledge.spa
dc.relation.referencesCachón Domínguez, P., y cols. (2022). Dashboard de análisis y monitorización del sistema eléctrico español. Ediciones Universidad Oviedo. Descargado de https://digibuo.uniovi.es/dspace/handle/10651/64297spa
dc.relation.referencesCarrascal Pérez, R. D., Campanella Guerrero, G. , y Regino León, B. I. (2023). Diseño e implementación de un dashboard para el control de la calidad del servicio de energía eléctrica en operadores de red de energía del sistema de distribución local. Ediciones Universidad Simón Bolívar . Descargado de https://bonga.unisimon.edu.co/handle/20.500.12442/12037spa
dc.relation.referencesChawla, N. V., Bowyer, K. W., Hall, L. O., y Kegelmeyer, W. P. (2002). Smote: synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16 , 321–357.spa
dc.relation.referencesChen, J., y Chen, Z. (2008). Extended bayesian information criteria for model selection with large model spaces. Biometrika, 95 (3), 759–771.spa
dc.relation.referencesCongreso de la República de Colombia. (1994). Ley 142 de 1994: Por la cual se establece el régimen de los servicios públicos domiciliarios y se dictan otras disposiciones. Descargado 20 de abril de 2023, de https://www.minenergia.gov.co/documents/9345/LEY142DE1994.pdfspa
dc.relation.referencesCramer, J. S. (2003). The origins and development of the logit model. Cambridge University Press Cambridge, 2003 , 1–19.spa
dc.relation.referencesCui, B. (2020). Dataexplorer: Automate data exploration and treatment [Manual de software inform´atico]. Descargado de https://CRAN.R-project.org/package=DataExplorer (R package version 0.8.2)spa
dc.relation.referencesDonoho, D. L., y Tanner, J. (2010). Precise undersampling theorems. Proceedings of the IEEE, 98 (6), 913–924.spa
dc.relation.referencesFern´andez, A., Garc´ıa, S., Galar, M., Prati, R. C., Krawczyk, B., y Herrera, F. (2018). Learning from imbalanced data sets (Vol. 10). Springer.spa
dc.relation.referencesFew, S. (2006). Information dashboard design: The effective visual communication of data. O’Reilly Media, Inc.spa
dc.relation.referencesFreund, Y., y Schapire, R. E. (1997). A decision-theoretic generalization of on-line learning and an application to boosting. Journal of Computer and System Sciences, 55 (1), 119–139.spa
dc.relation.referencesGini, C. (1912). Variabilit`a e mutabilit`a: contributo allo studio delle distribuzioni e delle relazioni statistiche.[fasc. i.]. Tipogr. di P. Cuppini.spa
dc.relation.referencesGranados Ostolaza, D. E. (2023). Aplicación de dashboards en power bi para el análisis y toma de decisiones en el área de ventas de la empresa distribuidora de equipos de tratamiento de agua. Ediciones Universidad San Ignacio de Loyola. Descargado de https://repositorio.usil.edu.pespa
dc.relation.referencesGrayson, J. E. (2000). Python and tkinter programming. Manning Publications Co.spa
dc.relation.referencesGuyon, I., y Elisseeff, A. (2003). An introduction to variable and feature selection. Journal of machine learning research, 3 (Mar), 1157–1182.spa
dc.relation.referencesHernández, F. (2023). Electronic references. Descargado 23 de Febrero del 2023, de https://fhernanb.github.io/libromodpred/adaboost.htmlspa
dc.relation.referencesHosmer Jr, D. W., Lemeshow, S., y Sturdivant, R. X. (2013). Applied logistic regression (Vol. 398). John Wiley & Sons.spa
dc.relation.referencesHvitfeldt, E. (2021). themis: Extra recipes steps for dealing with unbalanced data [Manual de software inform´atico]. Descargado de https://CRAN.R-project.org/package=themis (R package version 0.1.4)spa
dc.relation.referencesJames, G., Witten, D., Hastie, T., Tibshirani, R., y cols. (2013). An introduction to statistical learning (Vol. 112). Springer.spa
dc.relation.referencesJapkowicz, N., y Shah, M. (2011). Evaluating learning algorithms: a classification perspective. Cambridge University Press.spa
dc.relation.referencesKnaflic, C. N. (2015). Storytelling with data: A data visualization guide for business professionals. John Wiley & Sons.spa
dc.relation.referencesKuhn, M. (2008). Building predictive models in r using the caret package. Journal of statistical software, 28 , 1–26.spa
dc.relation.referencesMcLeod, A., Xu, C., y McLeod, M. A. (2020). Package ‘bestglm’. On line at https://cran. rproject. org/web/packages/bestglm/bestglm. pdf. Accessed, 2 .spa
dc.relation.referencesPenagos, P. A. R. (1997). Regimen de servicios públicos domiciliarios. Superintendencia de Servicios Públicos Domiciliarios.spa
dc.relation.referencesR Core Team. (2021). R: A language and environment for statistical computing [Manual de software informático]. Vienna, Austria. Descargado de https://www.R-project.org/spa
dc.relation.referencesRongheng, S. (2003). Applied mathematical statistics. New York: Science Press.spa
dc.relation.referencesSing, T., Sander, O., Beerenwinkel, N., y Lengauer, T. (2005). Rocr: visualizing classifier performance in r. Bioinformatics, 21 (20), 7881. Descargado de http://rocr.bioinf.mpi-sb.mpg.despa
dc.relation.referencesSmith, J., y Johnson, M. (2020). A comparative study of classification algorithms for text sentiment analysis. Journal of Machine Learning Research, 21 (3), 123-145. doi: 10.5555/12345678spa
dc.relation.referencesSoofi, A. A., y Awan, A. (2017). Classification techniques in machine learning: applications and issues. Journal of Basic & Applied Sciences, 13 (1), 459–465.spa
dc.relation.referencesTherneau, T., y Atkinson, B. (2022). rpart: Recursive partitioning and regression trees [Manual de software informático]. Descargado de https://CRAN.R-project.org/package=rpart (R package version 4.1.19)spa
dc.relation.referencesVillanueva Castillo, D. H., y Reque Valqui, P. B. (2018). Desarrollo de un dashboard para la toma de decisiones estratégicas en la cadena de farmacias “belén farma”-´ancash.spa
dc.relation.referencesWang, W., y Sun, D. (2021). The improved adaboost algorithms for imbalanced data classification. Information Sciences, 563 , 358–374.spa
dc.relation.referencesWare, C. (2010). Visual thinking for design. Elsevier.spa
dc.relation.referencesWikipedia. (s.f.). Logistic function - wikimedia commons. https://en.wikipedia.org/wiki/Logisticfunction/media/F ile : Logistic − curve.svg.(30deoctubredel2023)spa
dc.relation.referencesYang, Z., y Li, D. (2019). Application of logistic regression with filter in data classification. En 2019 chinese control conference (ccc) (p. 3755-3759). doi: 10.23919/ChiCC.2019.8865281spa
dc.relation.referencesYap, B. W., Abd Rani, K., Abd Rahman, H. A., Fong, S., Khairudin, Z., y Abdullah, N. N. (2014). An application of oversampling, undersampling, bagging and boosting in handling imbalanced datasets. En Proceedings of the first international conference on advanced data and information engineering (daeng-2013) (pp. 13–22).spa
dc.relation.referencesZweig, M. H., y Campbell, G. (1993). Practical methodology of optimizing the receiver operating characteristic curve and its application to the detection of diabetic retinopathy. Journal of Clinical Chemistry, 39 (5), 1238–1248.spa
dc.rights.accessrightsinfo:eu-repo/semantics/closedAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc510 - Matemáticas::519 - Probabilidades y matemáticas aplicadasspa
dc.subject.ddc620 - Ingeniería y operaciones afines::621 - Física aplicadaspa
dc.subject.lembAnálisis de regresión logística
dc.subject.lembEmpresas eléctricas - Tarifas
dc.subject.proposalServicio público domiciliariospa
dc.subject.proposalEnergíaspa
dc.subject.proposalModelo de clasificaciónspa
dc.subject.proposalResidential public serviceeng
dc.subject.proposalClassification modeleng
dc.subject.proposalClaimeng
dc.subject.proposalBillingeng
dc.subject.proposalOversamplingeng
dc.subject.proposalWidgetseng
dc.subject.proposallogistic functioneng
dc.titleModelo para la detección de errores asociados a la liquidación de la factura de energía en Antioquiaspa
dc.title.translatedModel for the detection of errors associated with energy bill settlement in Antioquiaeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa
oaire.awardtitleModelo para la detección de errores asociados a la liquidación de la factura de energía en Antioquiaspa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1037573490_2024.pdf
Tamaño:
1.66 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesís de Maestría en Ciencias - Estadística

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: