Prototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11

Cargando...
Miniatura

Document language:

Español

Fecha

Título de la revista

ISSN de la revista

Título del volumen

Documentos PDF

Resumen

Esta investigación desarrolla un modelo predictivo del desempeño institucional en las Pruebas Saber 11 de Colombia, con el propósito de anticipar el puntaje promedio global de las instituciones educativas a partir de sus características socioeconómicas, demográficas e institucionales. La motivación surge ante la ausencia de herramientas analíticas que permitan a los establecimientos educativos proyectar sus resultados antes de la aplicación del examen, situación que limita la planeación estratégica y la implementación de acciones preventivas. La metodología adoptada se basó en el modelo CRISP-DM, abarcando las fases de comprensión del problema, preparación y limpieza de datos, análisis exploratorio, modelado y evaluación. Se utilizaron datos históricos del ICFES correspondientes al periodo 2014-2024. Se implementaron diferentes modelos de aprendizaje automático, entre ellos regresión lineal regularizada, Random Forest, XGBoost y redes neuronales profundas. (Texto tomado de la fuente)

Abstract

This research develops a predictive model of institutional performance in Colombia’s Saber 11 tests, aiming to forecast the average global score of educational institutions based on their socioeconomic, demographic, and institutional characteristics. The motivation arises from the lack of analytical tools that allow schools to project their results before the application of the exam, a situation that limits strategic planning and the implementation of preventive actions. The adopted methodology was based on the CRISP-DM model, encompassing the phases of problem understanding, data preparation and cleaning, exploratory analysis, modeling, and evaluation. Historical data from the Colombian Institute for Educational Evaluation (ICFES) corresponding to the 2014-2024 period were used. Different machine learning models were implemented, including regularized linear regression, Random Forest, XGBoost, and deep neural networks.

Descripción

Ilustraciones, gráficos

Palabras clave

Citación