Una propuesta de modelo para la determinación de la probabilidad de recaudo del impuesto vehicular en Antioquia
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2023Metadata
Show full item recordSummary
La implementación de tecnologías emergentes y modelos para el soporte de decisiones, como la priorización en los procesos de fiscalización, constituye uno de los retos identificados en la administración tributaria. Con el fin de profundizar en el análisis de datos, surge la necesidad de implementar herramientas que permitan una mayor comprensión. En este sentido, se ha desarrollado un modelo para determinar la probabilidad de recaudo del impuesto vehicular en el departamento de Antioquia. Al revisar la literatura existente, se encontró que se emplean modelos de clasificación y regresión para abordar esta problemática. Después de comprender el contexto empresarial y los datos relevantes, se ha diseñado un modelo robusto que proporciona datos probabilísticos para cada contribuyente. Los resultados indican que el modelo basado en Bosques Aleatorios (Random Forest), un algoritmo de aprendizaje supervisado que permite hacer regresión sobre una variable dependiente a partir de una o más variables independientes, muestra las mejores métricas entre los modelos evaluados y responde de manera más efectiva a las necesidades específicas del problema. (Texto tomado de la fuente)Abstract
The implementation of emerging technologies and decision support models, such as prioritization in examination processes, constitutes one of the identified challenges in tax administration. In order to enhance data analysis, there is a need to deploy tools that provide deeper insights. Accordingly, a model has been developed to determine the probability of vehicle tax collection in the department of Antioquia. The literature review reveals the utilization of classification and regression models for this purpose. After comprehending the business context and key data insights, a robust model has been designed to generate probabilistic data for each taxpayer. It is concluded that the Random Forest model, a supervised learning algorithm that allows regression on a dependent variable from one or more independent variables, exhibits superior metrics compared to the evaluated models and best addresses the specific requirements of the problem.Keywords
Physical description
ilustraciones, diagramas
Collections
