Show simple item record

dc.contributor.advisorGallego Vega, Luis Eduardo
dc.creatorOtálora Orjuela, Fabián
dc.date.accessioned2020-07-09T17:51:26Z
dc.date.available2020-07-09T17:51:26Z
dc.date.created2019-11-19
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/77758
dc.descriptionLa presente investigación desarrolla una metodología para la identificación de patrones asociados a la pérdida de asignaturas y a las rutas curriculares comúnmente transitadas por los estudiantes de pregrado de la Universidad Nacional de Colombia-Sede Bogotá. Para ello, se emplearon métodos de minería de datos y aprendizaje de máquina sobre la información académica real de algunos programas curriculares de pregrado en el período 2012 a 2017. Por un lado, se realizó un análisis de la inscripción de los créditos de libre elección empleando \textit{reglas de asociación} con el objeto de identificar patrones en las trayectorias de formación optadas por los estudiantes, las cuales ejemplifican la flexibilidad curricular de los planes de estudio. En este sentido, los resultados muestran un comportamiento \textit{exógeno} dado que, la inscripción de créditos de libre elección se realiza en mayor medida en facultades distintas a la que pertenece el estudiante. Igualmente, los resultados permiten diferenciar una serie de asignaturas que se inscriben conjuntamente y que están asociadas a las agrupaciones temáticas curriculares de los planes de estudio. El ordenamiento y ponderación de estos patrones, permite distinguir posibles rutas curriculares que han sido cursadas por iniciativa de los estudiantes, más allá de lo que los planes de estudio prevén, y que permiten delinear nuevas trayectorias de formación que resultan, no sólo interesantes para los estudiantes, sino, igualmente, interdisciplinarias. Por otro lado, se identificaron patrones en la secuencia de inscripción de asignaturas junto con otras variables académicas de interés, para la construcción de un modelo que permita estimar el perfil del estudiante desertor por causas académicas. Para ello, se construyeron diferentes modelos de clasificación y predicción (Arboles de Decisión y Clasificadores Bayesianos) para la reprobación de la asignatura con mayor impacto en la deserción académica (Cálculo Diferencial). Del conjunto total de variables explicativas contempladas, fue posible obtener un modelo reducido con similares resultados respecto al desempeño en términos de la predicción y clasificación. Variables tales como (i) el puntaje de admisión en el componente de matemáticas, (ii) el desempeño en la nivelación (Matemáticas básicas), (iii) la carga del semestre en créditos, (iv) la facultad a la que pertenece el estudiante y (v) el desempeño académico de los estudiantes con el docente que imparte la asignatura, son las que mejor explican la reprobación en esta asignatura, lo cual puede utilizarse para el diseño de programas de acompañamiento académico que mitiguen la deserción. Igualmente importante, resultó el comportamiento de la calificación numérica en el límite de aprobación (3.0), ya que se identificó una discontinuidad en dicho límite, aparentemente atribuida al carácter subjetivo de la calificación 3.0 y su asociación real con una aprobación explícita de la asignatura.
dc.description.abstractThe present study develops a methodology to identify patterns associated with the loss of subjects and curricular directions commonly chosen by undergraduate students of the Universidad Nacional de Colombia (UNAL) - Bogotá Campus. To do that, data mining and machine learning methods were used on the actual academic information of some undergraduate curricular programs between 2012 to 2017. On the one hand, an analysis of the enrollment of free choice credits was carried out using association rules in order to identify patterns in the training paths chosen by the students, which exemplify the curricular flexibility of the study plans. In this sense, the results show an exogenous behavior since the registration of free choice credits is carried out to a greater extent in different Schools from those the students belong to. Similarly, the results allow differentiating a series of subjects that are registered together and that are associated with the thematic groupings of the curricula. The ordering and weighting of these patterns allow to distinguish possible curricular choices that have been taken at the initiative of the students, beyond what the study plans foresee, and that allow delineating new training trajectories that result, not only interesting for students, but also interdisciplinary. On the other hand, patterns were identified in the sequence of enrollment of subjects along with other academic variables of interest in order to construct a model that allows to estimate the profile of the dropout student for academic reasons. To do this, different classification and prediction models (Decision Trees and Bayesian Classifiers) were built to fail the subject with the greatest impact on academic dropout (Differential Calculation). From the total set of explanatory variables contemplated, it was possible to obtain a reduced model with similar results regarding performance in terms of prediction and classification. Variables, such as (i) the admission score in the mathematics component, (ii) the leveling performance (Basic Mathematics), (iii) the number credits in the semester, (iv) the School to which the student belongs and (v) the academic performance of the students with the teacher of the subject best explain the failure in this subject, which can be used to design academic accompaniment programs that mitigate dropout. Equally important, the behavior of the numerical grade was in the approval limit (3.0), since a discontinuity in said limit was identified, apparently attributed to the subjective nature of the 3.0 grade and its actual association with an explicit approval of the subject.
dc.format.extent121
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.rights.urihttp://creativecommons.org/licenses/by-nd/2.5/co/
dc.subjectMinería de datos educativos
dc.subjectAprendizaje de máquina
dc.subjectRutas curriculares
dc.subjectDeserción académica
dc.subjectTasas de repitencia
dc.subject.ddc370 - Educación::378 - Educación superior (Educación terciaria)
dc.subject.ddc600 - Tecnología (Ciencias aplicadas)::607 - Educación, investigación, temas relacionados
dc.subject.ddc620 - Ingeniería y operaciones afines::629 - Otras ramas de la ingeniería
dc.titleModelo para la identificación de patrones de desempeño académico estudiantil para fortalecer el acompañamiento académico en la Universidad Nacional de Colombia
dc.typeOther
dc.rights.spaAcceso abierto
dc.contributor.institutionUniversidad Nacional de Colombia - Sede Bogotá
dc.subject.keywordEducational data mining
dc.subject.keywordMachine learning
dc.subject.keywordCurricular routes
dc.subject.keywordAcademic dropout
dc.subject.keywordloss rates
dc.type.spaOtro
dc.type.hasversionAccepted Version
dc.coverage.modalityMaestria
dc.rights.accessRightsOpen Access
dc.rights.ccAtribución-SinDerivadas 2.5 Colombia
dc.identifier.bibliographicCitation[Adekitan and Salau, 2019] Adekitan, A. I. and Salau, O. (2019). The impact of engineeringstudents’ performance in the first three years on their graduation result using educationaldata mining.Heliyon, 5(2):e01250
dc.identifier.bibliographicCitation[Agrawal et al., 1993] Agrawal, R., Imieli ́nski, T., and Swami, A. (1993). Mining AssociationRules Between Sets of Items in Large Databases. InProceedings of the 1993 ACM SIG-MOD International Conference on Management of Data, SIGMOD ’93, pages 207–216,New York, NY, USA. ACM.
dc.identifier.bibliographicCitation[Agrawal and Srikant, 1994] Agrawal, R. and Srikant, R. (1994). Fast Algorithms for MiningAssociation Rules. page 13.
dc.identifier.bibliographicCitation[Aldowah et al., 2019] Aldowah, H., Al-Samarraie, H., and Fauzy, W. M. (2019). Educational data mining and learning analytics for 21st century higher education: A review andsynthesis.Telematics and Informatics, 37:13–49.
dc.identifier.bibliographicCitation[Altujjar et al., 2016] Altujjar, Y., Altamimi, W., Al-Turaiki, I., and Al-Razgan, M. (2016).Predicting Critical Courses Affecting Students Performance: A Case Study.ProcediaComputer Science, 82:65–71.
dc.identifier.bibliographicCitation[Angeli et al., 2017] Angeli, C., Howard, S. K., Ma, J., Yang, J., and Kirschner, P. A. (2017).Data mining in educational technology classroom research: Can it make a contribution?Computers & Education, 113:226–242.
dc.identifier.bibliographicCitation[Asif et al., 2017] Asif, R., Merceron, A., Ali, S. A., and Haider, N. G. (2017). Analyzingundergraduate students’ performance using educational data mining.Computers & Edu-cation, 113:177–194.
dc.identifier.bibliographicCitation[Chen and Huang, 2012] Chen, J. and Huang, Y. (2012). Decision Tree Construction Algorithm for Incomplete Information System. In2012 Fourth International Conference onComputational and Information Sciences, pages 404–407.
dc.identifier.bibliographicCitation[CSU - Universidad Nacional de Colombia, 2007] CSU - Universidad Nacional de Colombia(2007). AC033.
dc.identifier.bibliographicCitation[Direccón Nacional de Programas Curriculares de Pregrado, 2013] Dirección Nacional de Programas Curriculares de Pregrado, V. (2013). Guía de autoevaluación de la calidad de los programas de pregrado - segunda edición.
dc.identifier.bibliographicCitation[Dirección Nacional de Programas Curriculares de Pregrado, 2018] Dirección Nacional de Programas Curriculares de Pregrado, V. (2018). Caracterización del perfil desertor en la universidad nacional de colombia, sede bogotá.
dc.identifier.bibliographicCitation[Huber et al., 2019] Huber, S., Wiemer, H., Schneider, D., and Ihlenfeldt, S. (2019). DMME:Data mining methodology for engineering applications – a holistic extension to the CRISP-DM model.Procedia CIRP, 79:403–408.
dc.identifier.bibliographicCitation[Jacob et al., 2015] Jacob, J., Jha, K., Kotak, P., and Puthran, S. (2015). Educational DataMining techniques and their applications. In2015 International Conference on GreenComputing and Internet of Things (ICGCIoT), pages 1344–1348.
dc.identifier.bibliographicCitation[Kaunang and Rotikan, 2018] Kaunang, F. J. and Rotikan, R. (2018). Students’ AcademicPerformance Prediction using Data Mining. In2018 Third International Conference onInformatics and Computing (ICIC), pages 1–5.
dc.identifier.bibliographicCitation[López Guarín, 2013] López Guarín, C. E. (2013).Data mining model to predict academic performance at the Universidad Nacional de Colombia. masters, Universidad Nacional de Colombia.
dc.identifier.bibliographicCitation[Martínez Valdés, 2011] Martínez Valdés, J. A. (2011). La minería de datos en educación matemática relación entre estilos de aprendizaje y desempeño académico. masters, Uni-versidad Nacional de Colombia Sede Palmira.
dc.identifier.bibliographicCitation[Mohamad and Tasir, 2013] Mohamad, S. K. and Tasir, Z. (2013). Educational Data Mining: A Review. Procedia - Social and Behavioral Sciences, 97:320–324.
dc.identifier.bibliographicCitation[Pathan et al., 2014] Pathan, A. A., Hasan, M., Ahmed, M. F., and Farid, D. M. (2014).Educational data mining: A mining model for developing students’ programming skills. InThe 8th International Conference on Software, Knowledge, Information Managementand Applications (SKIMA 2014), pages 1–5.
dc.identifier.bibliographicCitation[Quinlan, 2014] Quinlan, J. R. (2014).C4.5: Programs for Machine Learning. Elsevier.
dc.identifier.bibliographicCitation[Rokach and Maimon, 2008] Rokach, L. and Maimon, O. Z. (2008). Data Mining with Decision Trees: Theory and Applications. World Scientific.
dc.identifier.bibliographicCitation[Romero and Ventura, 2007] Romero, C. and Ventura, S. (2007). Educational data mining: A survey from 1995 to 2005. Expert Systems with Applications, 33(1):135–146.
dc.identifier.bibliographicCitation[Romero and Ventura, 2010] Romero, C. and Ventura, S. (2010). Educational data mining: A review of the state of the art.IEEE Transactions on Systems, Man and Cybernetics Part C: Applications and Reviews, 40(6):601–618.
dc.identifier.bibliographicCitation[Schäfer et al., 2018] Schäfer, F., Zeiselmair, C., Becker, J., and Otten, H. (2018). Synthesizing CRISP-DM and Quality Management: A Data Mining Approach for Production Processes. In 2018 IEEE International Conference on Technology Management, Operations and Decisions (ICTMOD), pages 190–195.
dc.identifier.bibliographicCitation[Srinivasa et al., 2013] Srinivasa, A., Froyd, J. E., and Guha, R. V. (2013). Insights for curriculum design from design research. In2013 IEEE Frontiers in Education Conference(FIE), pages 872–878, Oklahoma City, OK, USA. IEEE.
dc.identifier.bibliographicCitation[Sukhbaatar et al., 2018] Sukhbaatar, O., Ogata, K., and Usagawa, T. (2018). Mining Educational Data to Predict Academic Dropouts: A Case Study in Blended Learning Course. InTENCON 2018 - 2018 IEEE Region 10 Conference, pages 2205–2208.
dc.identifier.bibliographicCitation[Tan et al., 2005] Tan, P.-N., Steinbach, M., and Kumar, V. (2005).Introduction to DataMining, (First Edition). Addison-Wesley Longman Publishing Co., Inc., Boston, MA,USA.
dc.identifier.bibliographicCitation[Yang and Tian, 2017] Yang, Y. and Tian, D. (2017). The research of multimedia curriculum design and curriculum development in modern distance education. In2017 3rd IEEE International Conference on Computer and Communications (ICCC), pages 1545–1548.
dc.identifier.bibliographicCitation[Yen and Hsu, 2008] Yen, C.-C. and Hsu, J.-S. (2008). Application of Flexible and Efficient Campus Curriculum Systems. In2008 14th IEEE Pacific Rim International Symposiumon Dependable Computing, pages 132–137, Taipei, Taiwan. IEEE.
dc.contributor.generoMasculino
dc.publisher.programBogotá - Ingeniería - Maestría en Ingeniería - Automatización Industrial


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

http://creativecommons.org/licenses/by-nd/2.5/co/This work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit