Aplicación de técnicas de analítica de datos para identificar los factores que afectan la participación ciudadana en Medellín

dc.contributor.advisorOlaya Morales, Yris
dc.contributor.authorLópez Buitrago, Juan Pablo
dc.contributor.orcid0000-0001-5210-4731spa
dc.coverage.cityMedellín, Colombiaspa
dc.date.accessioned2022-11-02T15:39:14Z
dc.date.available2022-11-02T15:39:14Z
dc.date.issued2022-08-02
dc.descriptionilustaciones, diagramasspa
dc.description.abstractTeniendo en marcha la tercera medición del Índice de Participación Ciudadana, y aprovechando la experiencia consolidada a lo largo de los años en el cálculo e interpretación de los indicadores, una de las premisas obtenidas para la presente medición era la necesidad de dar un paso más en esta dirección. Teniendo esto como punto de partida, se propuso la exploración de herramientas de Analítica y Ciencia de Datos para garantizar un mejor aprovechamiento de los datos almacenados producto de las diferentes mediciones, y a la vez generar valor y conocimiento a partir de los datos que faciliten el ejercicio de toma de decisiones. Como resultado, se construyó un modelo de Aprendizaje Automatizado a partir del algoritmo Random Forest Classifier. Con el objetivo de identificar las variables que más influyen en el puntaje final del IPCM se utilizaron herramientas de Feature Importance, dando lugar a inferencias, conclusiones y recomendaciones que brindarán una base sólida e informada para la elaboración de programas, proyectos y políticas públicas orientadas a mejorar el ejercicio de la participación en Medellín. (Texto tomado de la fuente)spa
dc.description.abstractHaving underway the third measurement of the Citizen Participation Index, and taking advantage of the experience consolidated over the years in the calculation and interpretation of the indicators, one of the premises obtained for the present measurement was the need to take a step further in this direction. With this as a starting point, the exploration of Analytics and Data Science tools was proposed to guarantee a better use of the data stored as a result of the different measurements, and at the same time generate value and knowledge from the data to facilitate the decision-making exercise. As a result, a Machine Learning model was built based on the Random Forest Classifier algorithm. In order to identify the variables that most influence the final IPCM score, Feature Importance tools were used, leading to inferences, conclusions and recommendations that will provide a solid and informed basis for the development of programs, projects and public policies aimed at improving the exercise of participation in Medellin.eng
dc.description.curricularareaÁrea Curricular de Ingeniería de Sistemas e Informáticaspa
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ingeniería - Analíticaspa
dc.format.extentxii, 81 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/82598
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellínspa
dc.publisher.facultyFacultad de Minasspa
dc.publisher.placeMedellín, Colombiaspa
dc.publisher.programMedellín - Minas - Maestría en Ingeniería - Analíticaspa
dc.relation.indexedRedColspa
dc.relation.indexedLaReferenciaspa
dc.relation.referencesBoudjelida, A. & Mellouli, S. (2016). A Multidimensional Analysis Approach For Electronic Citizens Participation. In Proceedings of the 17th International Digital Government Research Conference on Digital Government Research (dg.o '16). Association for Computing Machinery, New York, NY, USA, 49–57. https://doi.org/10.1145/2912160.2912195spa
dc.relation.referencesDanaher, J., Hogan, M. J., Noone, C., Kennedy, R., Behan, A., De Paor, A., Felzmann, H., Haklay, M., Khoo, S.-M., Morison, J., Murphy, M. H., O’Brolchain, N., Schafer, B., & Shankar, K. (2017). Algorithmic governance: Developing a research agenda through the power of collective intelligence. Big Data & Society. https://doi.org/10.1177/2053951717726554spa
dc.relation.referencesDeng, N., Tian, Y., & Zhang, C. (2012). Support vector machines: optimization based theory, algorithms, and extensions. CRC press.spa
dc.relation.referencesDiez, D. M., Barr, C. D., & Çetinkaya-Rundel, M. (2019). OpenIntro Statistics: Fourth Edition. OpenIntro.spa
dc.relation.referencesGarcía, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega Colombiana S.A, Publicaciones Altaria.spa
dc.relation.referencesGonzález, F. (2019). Big data, algoritmos y política: las ciencias sociales en la era de las redes digitales. Cinta de moebio, (65), 267-280. https://dx.doi.org/10.4067/s0717-554x2019000200267spa
dc.relation.referencesHastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer New York. https://doi.org/10.1007/978-0-387-84858-7spa
dc.relation.referencesHuang, Z. (1998). Extensions to the k-means algorithm for clustering large data sets with categorical values. Data Mining and Knowledge Discovery, 2(3), 283–304. https://doi.org/10.1023/A:1009769707641spa
dc.relation.referencesIslam Sarker, N., Khatun, M., Alam, M. & Islam, S. (2020). Big Data Driven Smart City: Way to Smart City Governance. 2020 International Conference on Computing and Information Technology (ICCIT-1441), 2020, 1-8. doi: 10.1109/ICCIT-144147971.2020.9213795spa
dc.relation.referencesJu, J., Liu, L., & Feng, Y. (2018). Citizen-centered big data analysis-driven governance intelligence framework for smart cities. Telecommunications Policy, 42(10), 881–896. https://doi.org/https://doi.org/10.1016/j.telpol.2018.01.003spa
dc.relation.referencesKononenko, I., & Kukar, M. (2007). Machine Learning Basics. Machine Learning and Data Mining, 59–105. doi:10.1533/9780857099440.59spa
dc.relation.referencesKowalczyk, A. (2017). Support Vector Machines Succintly. Syncfusionspa
dc.relation.referencesLemus-Delgado, D. & Pérez Navarro, R. (2020). Ciencia de datos y estudios globales: aportaciones y desafíos metodológicos. Colombia Internacional, (102), 41-62. https://doi.org/10.7440/colombiaint102.2020.03spa
dc.relation.referencesLundberg, S. & Lee, S. (2017). A Unified Approach to Interpreting Model Predictions. ArXiv. https://doi.org/10.48550/arXiv.1705.07874spa
dc.relation.referencesMayorga, F. & Córdova, E., (2007), “Gobernabilidad y Gobernanza en América latina”, Working Paper NCCR Norte-Sur IP8, Ginebra. No publicado. http://www.institut-gouvernance.org/docs/ficha-gobernabilida.pdfspa
dc.relation.referencesMeijer, A., & Bolívar, M. P. R. (2016). Governing the smart city: a review of the literature on smart urban governance. International Review of Administrative Sciences, 82(2), 392–408. https://doi.org/10.1177/0020852314564308spa
dc.relation.referencesMeneses Rocha, M. (2018). Grandes datos, grandes desafíos para las ciencias sociales. Revista mexicana de sociología, 80(2), 415-444. https://doi.org/10.22201/iis.01882503p.2018.2.57723spa
dc.relation.referencesMüller, A.C., & Guido, S. (2016). Introduction to Machine Learning with Python. A guide for Data Scientist. O’Reilly.spa
dc.relation.referencesPando, V. & San Martín, R. (2004). Regresión logística multinomial. En: Cuadernos de la Sociedad Española de Ciencias Forestales, Nº. 18, 2004, págs. 323-327spa
dc.relation.referencesSaarela, M., Jauhiainen, S. Comparison of feature importance measures as explanations for classification models. SN Appl. Sci. 3, 272 (2021). https://doi.org/10.1007/s42452-021-04148-9spa
dc.relation.referencesWeber, M. (1947). The Theory of Social and Economic Organization. New York: Oxford University Pressspa
dc.relation.referencesWilliams, G. J. (2011). Data mining with Rattle and R: The art of excavating data for knowledge discovery. Springerspa
dc.relation.referencesZhu, Z. & Zhang. M. (2020). K-Nearest Neighbors(KNN) Classification with Different Distance Metrics. Shanghai Jiao Tong Universityspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/spa
dc.subject.ddc000 - Ciencias de la computación, información y obras generalesspa
dc.subject.ddc320 - Ciencia política (política y gobierno)spa
dc.subject.lembCitizen participation - Medellíneng
dc.subject.lembPartici´pación ciudadana - Medellínspa
dc.subject.proposalParticipación Ciudadanaspa
dc.subject.proposalIPCMspa
dc.subject.proposalMachine Learningspa
dc.subject.proposalFeature Importancespa
dc.subject.proposalMedellínspa
dc.subject.proposalInnovative Citizen Participationeng
dc.subject.proposalIPCMeng
dc.subject.proposalMachine Learningeng
dc.subject.proposalFeature Importanceeng
dc.titleAplicación de técnicas de analítica de datos para identificar los factores que afectan la participación ciudadana en Medellínspa
dc.title.translatedApplication of data analytics techniques to identify the factors that affect citizen participation in Medellineng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentEstudiantesspa
dcterms.audience.professionaldevelopmentGrupos comunitariosspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentPúblico generalspa
dcterms.audience.professionaldevelopmentResponsables políticosspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1037975877.2022.pdf
Tamaño:
2.31 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ingeniería - Analítica

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: