Modelo para la identificación de patrones de desempeño académico estudiantil para fortalecer el acompañamiento académico en la Universidad Nacional de Colombia
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2019-11-19Metadata
Show full item recordSummary
La presente investigación desarrolla una metodología para la identificación de patrones asociados a la pérdida de asignaturas y a las rutas curriculares comúnmente transitadas por los estudiantes de pregrado de la Universidad Nacional de Colombia-Sede Bogotá. Para ello, se emplearon métodos de minería de datos y aprendizaje de máquina sobre la información académica real de algunos programas curriculares de pregrado en el período 2012 a 2017. Por un lado, se realizó un análisis de la inscripción de los créditos de libre elección empleando \textit{reglas de asociación} con el objeto de identificar patrones en las trayectorias de formación optadas por los estudiantes, las cuales ejemplifican la flexibilidad curricular de los planes de estudio. En este sentido, los resultados muestran un comportamiento \textit{exógeno} dado que, la inscripción de créditos de libre elección se realiza en mayor medida en facultades distintas a la que pertenece el estudiante. Igualmente, los resultados permiten diferenciar una serie de asignaturas que se inscriben conjuntamente y que están asociadas a las agrupaciones temáticas curriculares de los planes de estudio. El ordenamiento y ponderación de estos patrones, permite distinguir posibles rutas curriculares que han sido cursadas por iniciativa de los estudiantes, más allá de lo que los planes de estudio prevén, y que permiten delinear nuevas trayectorias de formación que resultan, no sólo interesantes para los estudiantes, sino, igualmente, interdisciplinarias. Por otro lado, se identificaron patrones en la secuencia de inscripción de asignaturas junto con otras variables académicas de interés, para la construcción de un modelo que permita estimar el perfil del estudiante desertor por causas académicas. Para ello, se construyeron diferentes modelos de clasificación y predicción (Arboles de Decisión y Clasificadores Bayesianos) para la reprobación de la asignatura con mayor impacto en la deserción académica (Cálculo Diferencial). Del conjunto total de variables explicativas contempladas, fue posible obtener un modelo reducido con similares resultados respecto al desempeño en términos de la predicción y clasificación. Variables tales como (i) el puntaje de admisión en el componente de matemáticas, (ii) el desempeño en la nivelación (Matemáticas básicas), (iii) la carga del semestre en créditos, (iv) la facultad a la que pertenece el estudiante y (v) el desempeño académico de los estudiantes con el docente que imparte la asignatura, son las que mejor explican la reprobación en esta asignatura, lo cual puede utilizarse para el diseño de programas de acompañamiento académico que mitiguen la deserción. Igualmente importante, resultó el comportamiento de la calificación numérica en el límite de aprobación (3.0), ya que se identificó una discontinuidad en dicho límite, aparentemente atribuida al carácter subjetivo de la calificación 3.0 y su asociación real con una aprobación explícita de la asignatura.Summary
The present study develops a methodology to identify patterns associated with the loss of subjects and curricular directions commonly chosen by undergraduate students of the Universidad Nacional de Colombia (UNAL) - Bogotá Campus. To do that, data mining and machine learning methods were used on the actual academic information of some undergraduate curricular programs between 2012 to 2017. On the one hand, an analysis of the enrollment of free choice credits was carried out using association rules in order to identify patterns in the training paths chosen by the students, which exemplify the curricular flexibility of the study plans. In this sense, the results show an exogenous behavior since the registration of free choice credits is carried out to a greater extent in different Schools from those the students belong to. Similarly, the results allow differentiating a series of subjects that are registered together and that are associated with the thematic groupings of the curricula. The ordering and weighting of these patterns allow to distinguish possible curricular choices that have been taken at the initiative of the students, beyond what the study plans foresee, and that allow delineating new training trajectories that result, not only interesting for students, but also interdisciplinary. On the other hand, patterns were identified in the sequence of enrollment of subjects along with other academic variables of interest in order to construct a model that allows to estimate the profile of the dropout student for academic reasons. To do this, different classification and prediction models (Decision Trees and Bayesian Classifiers) were built to fail the subject with the greatest impact on academic dropout (Differential Calculation). From the total set of explanatory variables contemplated, it was possible to obtain a reduced model with similar results regarding performance in terms of prediction and classification. Variables, such as (i) the admission score in the mathematics component, (ii) the leveling performance (Basic Mathematics), (iii) the number credits in the semester, (iv) the School to which the student belongs and (v) the academic performance of the students with the teacher of the subject best explain the failure in this subject, which can be used to design academic accompaniment programs that mitigate dropout. Equally important, the behavior of the numerical grade was in the approval limit (3.0), since a discontinuity in said limit was identified, apparently attributed to the subjective nature of the 3.0 grade and its actual association with an explicit approval of the subject.Keywords
Collections
