Mostrar el registro sencillo del documento

dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional
dc.contributor.advisorOlaya Morales, Yris
dc.contributor.authorLópez Buitrago, Juan Pablo
dc.date.accessioned2022-11-02T15:39:14Z
dc.date.available2022-11-02T15:39:14Z
dc.date.issued2022-08-02
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/82598
dc.descriptionilustaciones, diagramas
dc.description.abstractTeniendo en marcha la tercera medición del Índice de Participación Ciudadana, y aprovechando la experiencia consolidada a lo largo de los años en el cálculo e interpretación de los indicadores, una de las premisas obtenidas para la presente medición era la necesidad de dar un paso más en esta dirección. Teniendo esto como punto de partida, se propuso la exploración de herramientas de Analítica y Ciencia de Datos para garantizar un mejor aprovechamiento de los datos almacenados producto de las diferentes mediciones, y a la vez generar valor y conocimiento a partir de los datos que faciliten el ejercicio de toma de decisiones. Como resultado, se construyó un modelo de Aprendizaje Automatizado a partir del algoritmo Random Forest Classifier. Con el objetivo de identificar las variables que más influyen en el puntaje final del IPCM se utilizaron herramientas de Feature Importance, dando lugar a inferencias, conclusiones y recomendaciones que brindarán una base sólida e informada para la elaboración de programas, proyectos y políticas públicas orientadas a mejorar el ejercicio de la participación en Medellín. (Texto tomado de la fuente)
dc.description.abstractHaving underway the third measurement of the Citizen Participation Index, and taking advantage of the experience consolidated over the years in the calculation and interpretation of the indicators, one of the premises obtained for the present measurement was the need to take a step further in this direction. With this as a starting point, the exploration of Analytics and Data Science tools was proposed to guarantee a better use of the data stored as a result of the different measurements, and at the same time generate value and knowledge from the data to facilitate the decision-making exercise. As a result, a Machine Learning model was built based on the Random Forest Classifier algorithm. In order to identify the variables that most influence the final IPCM score, Feature Importance tools were used, leading to inferences, conclusions and recommendations that will provide a solid and informed basis for the development of programs, projects and public policies aimed at improving the exercise of participation in Medellin.
dc.format.extentxii, 81 páginas
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.publisherUniversidad Nacional de Colombia
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.ddc000 - Ciencias de la computación, información y obras generales
dc.subject.ddc320 - Ciencia política (política y gobierno)
dc.titleAplicación de técnicas de analítica de datos para identificar los factores que afectan la participación ciudadana en Medellín
dc.typeTrabajo de grado - Maestría
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dc.publisher.programMedellín - Minas - Maestría en Ingeniería - Analítica
dc.coverage.cityMedellín, Colombia
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería - Analítica
dc.identifier.instnameUniversidad Nacional de Colombia
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombia
dc.identifier.repourlhttps://repositorio.unal.edu.co/
dc.publisher.facultyFacultad de Minas
dc.publisher.placeMedellín, Colombia
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellín
dc.relation.indexedRedCol
dc.relation.indexedLaReferencia
dc.relation.referencesBoudjelida, A. & Mellouli, S. (2016). A Multidimensional Analysis Approach For Electronic Citizens Participation. In Proceedings of the 17th International Digital Government Research Conference on Digital Government Research (dg.o '16). Association for Computing Machinery, New York, NY, USA, 49–57. https://doi.org/10.1145/2912160.2912195
dc.relation.referencesDanaher, J., Hogan, M. J., Noone, C., Kennedy, R., Behan, A., De Paor, A., Felzmann, H., Haklay, M., Khoo, S.-M., Morison, J., Murphy, M. H., O’Brolchain, N., Schafer, B., & Shankar, K. (2017). Algorithmic governance: Developing a research agenda through the power of collective intelligence. Big Data & Society. https://doi.org/10.1177/2053951717726554
dc.relation.referencesDeng, N., Tian, Y., & Zhang, C. (2012). Support vector machines: optimization based theory, algorithms, and extensions. CRC press.
dc.relation.referencesDiez, D. M., Barr, C. D., & Çetinkaya-Rundel, M. (2019). OpenIntro Statistics: Fourth Edition. OpenIntro.
dc.relation.referencesGarcía, J., Molina, J. M., Berlanga, A., Patricio, M. A., Bustamante, A. L., & Padilla, W. R. (2018). Ciencia de datos. Técnicas analíticas y aprendizaje estadístico. Alfaomega Colombiana S.A, Publicaciones Altaria.
dc.relation.referencesGonzález, F. (2019). Big data, algoritmos y política: las ciencias sociales en la era de las redes digitales. Cinta de moebio, (65), 267-280. https://dx.doi.org/10.4067/s0717-554x2019000200267
dc.relation.referencesHastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning. Springer New York. https://doi.org/10.1007/978-0-387-84858-7
dc.relation.referencesHuang, Z. (1998). Extensions to the k-means algorithm for clustering large data sets with categorical values. Data Mining and Knowledge Discovery, 2(3), 283–304. https://doi.org/10.1023/A:1009769707641
dc.relation.referencesIslam Sarker, N., Khatun, M., Alam, M. & Islam, S. (2020). Big Data Driven Smart City: Way to Smart City Governance. 2020 International Conference on Computing and Information Technology (ICCIT-1441), 2020, 1-8. doi: 10.1109/ICCIT-144147971.2020.9213795
dc.relation.referencesJu, J., Liu, L., & Feng, Y. (2018). Citizen-centered big data analysis-driven governance intelligence framework for smart cities. Telecommunications Policy, 42(10), 881–896. https://doi.org/https://doi.org/10.1016/j.telpol.2018.01.003
dc.relation.referencesKononenko, I., & Kukar, M. (2007). Machine Learning Basics. Machine Learning and Data Mining, 59–105. doi:10.1533/9780857099440.59
dc.relation.referencesKowalczyk, A. (2017). Support Vector Machines Succintly. Syncfusion
dc.relation.referencesLemus-Delgado, D. & Pérez Navarro, R. (2020). Ciencia de datos y estudios globales: aportaciones y desafíos metodológicos. Colombia Internacional, (102), 41-62. https://doi.org/10.7440/colombiaint102.2020.03
dc.relation.referencesLundberg, S. & Lee, S. (2017). A Unified Approach to Interpreting Model Predictions. ArXiv. https://doi.org/10.48550/arXiv.1705.07874
dc.relation.referencesMayorga, F. & Córdova, E., (2007), “Gobernabilidad y Gobernanza en América latina”, Working Paper NCCR Norte-Sur IP8, Ginebra. No publicado. http://www.institut-gouvernance.org/docs/ficha-gobernabilida.pdf
dc.relation.referencesMeijer, A., & Bolívar, M. P. R. (2016). Governing the smart city: a review of the literature on smart urban governance. International Review of Administrative Sciences, 82(2), 392–408. https://doi.org/10.1177/0020852314564308
dc.relation.referencesMeneses Rocha, M. (2018). Grandes datos, grandes desafíos para las ciencias sociales. Revista mexicana de sociología, 80(2), 415-444. https://doi.org/10.22201/iis.01882503p.2018.2.57723
dc.relation.referencesMüller, A.C., & Guido, S. (2016). Introduction to Machine Learning with Python. A guide for Data Scientist. O’Reilly.
dc.relation.referencesPando, V. & San Martín, R. (2004). Regresión logística multinomial. En: Cuadernos de la Sociedad Española de Ciencias Forestales, Nº. 18, 2004, págs. 323-327
dc.relation.referencesSaarela, M., Jauhiainen, S. Comparison of feature importance measures as explanations for classification models. SN Appl. Sci. 3, 272 (2021). https://doi.org/10.1007/s42452-021-04148-9
dc.relation.referencesWeber, M. (1947). The Theory of Social and Economic Organization. New York: Oxford University Press
dc.relation.referencesWilliams, G. J. (2011). Data mining with Rattle and R: The art of excavating data for knowledge discovery. Springer
dc.relation.referencesZhu, Z. & Zhang. M. (2020). K-Nearest Neighbors(KNN) Classification with Different Distance Metrics. Shanghai Jiao Tong University
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.subject.lembCitizen participation - Medellín
dc.subject.lembPartici´pación ciudadana - Medellín
dc.subject.proposalParticipación Ciudadana
dc.subject.proposalIPCM
dc.subject.proposalMachine Learning
dc.subject.proposalFeature Importance
dc.subject.proposalMedellín
dc.subject.proposalInnovative Citizen Participation
dc.subject.proposalIPCM
dc.subject.proposalMachine Learning
dc.subject.proposalFeature Importance
dc.title.translatedApplication of data analytics techniques to identify the factors that affect citizen participation in Medellin
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2
dcterms.audience.professionaldevelopmentEstudiantes
dcterms.audience.professionaldevelopmentGrupos comunitarios
dcterms.audience.professionaldevelopmentInvestigadores
dcterms.audience.professionaldevelopmentPúblico general
dcterms.audience.professionaldevelopmentResponsables políticos
dc.description.curricularareaÁrea Curricular de Ingeniería de Sistemas e Informática
dc.contributor.orcid0000-0001-5210-4731


Archivos en el documento

Thumbnail

Este documento aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del documento

Atribución-NoComercial-SinDerivadas 4.0 InternacionalEsta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito