Prototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11
Cargando...
Autores
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
Esta investigación desarrolla un modelo predictivo del desempeño institucional en las Pruebas Saber 11 de Colombia, con el propósito de anticipar el puntaje promedio global de las instituciones educativas a partir de sus características socioeconómicas, demográficas e institucionales. La motivación surge ante la ausencia de herramientas analíticas que permitan a los establecimientos educativos proyectar sus resultados antes de la aplicación del examen, situación que limita la planeación estratégica y la implementación de acciones preventivas.
La metodología adoptada se basó en el modelo CRISP-DM, abarcando las fases de comprensión del problema, preparación y limpieza de datos, análisis exploratorio, modelado y evaluación. Se utilizaron datos históricos del ICFES correspondientes al periodo 2014-2024. Se implementaron diferentes modelos de aprendizaje automático, entre ellos regresión lineal regularizada, Random Forest, XGBoost y redes neuronales profundas. (Texto tomado de la fuente)
Abstract
This research develops a predictive model of institutional performance in Colombia’s Saber 11 tests, aiming to forecast the average global score of educational institutions based on their socioeconomic, demographic, and institutional characteristics. The motivation arises from the lack of analytical tools that allow schools to project their results before the application of the exam, a situation that limits strategic planning and the implementation of preventive actions.
The adopted methodology was based on the CRISP-DM model, encompassing the phases of problem understanding, data preparation and cleaning, exploratory analysis, modeling, and evaluation. Historical data from the Colombian Institute for Educational Evaluation (ICFES) corresponding to the 2014-2024 period were used. Different machine learning models were implemented, including regularized linear regression, Random Forest, XGBoost, and deep neural networks.
Palabras clave propuestas
Descripción
Ilustraciones, gráficos

