Atribución-NoComercial-CompartirIgual 4.0 InternacionalCamargo Mendoza, Jorge EliecerPuentes Cespedes, Miguel Angel2026-02-042026-02-042026https://repositorio.unal.edu.co/handle/unal/89386Ilustraciones, gráficosEsta investigación desarrolla un modelo predictivo del desempeño institucional en las Pruebas Saber 11 de Colombia, con el propósito de anticipar el puntaje promedio global de las instituciones educativas a partir de sus características socioeconómicas, demográficas e institucionales. La motivación surge ante la ausencia de herramientas analíticas que permitan a los establecimientos educativos proyectar sus resultados antes de la aplicación del examen, situación que limita la planeación estratégica y la implementación de acciones preventivas. La metodología adoptada se basó en el modelo CRISP-DM, abarcando las fases de comprensión del problema, preparación y limpieza de datos, análisis exploratorio, modelado y evaluación. Se utilizaron datos históricos del ICFES correspondientes al periodo 2014-2024. Se implementaron diferentes modelos de aprendizaje automático, entre ellos regresión lineal regularizada, Random Forest, XGBoost y redes neuronales profundas. (Texto tomado de la fuente)This research develops a predictive model of institutional performance in Colombia’s Saber 11 tests, aiming to forecast the average global score of educational institutions based on their socioeconomic, demographic, and institutional characteristics. The motivation arises from the lack of analytical tools that allow schools to project their results before the application of the exam, a situation that limits strategic planning and the implementation of preventive actions. The adopted methodology was based on the CRISP-DM model, encompassing the phases of problem understanding, data preparation and cleaning, exploratory analysis, modeling, and evaluation. Historical data from the Colombian Institute for Educational Evaluation (ICFES) corresponding to the 2014-2024 period were used. Different machine learning models were implemented, including regularized linear regression, Random Forest, XGBoost, and deep neural networks.68 páginasapplication/pdfapplication/vnd.ms-excelspahttp://creativecommons.org/licenses/by-nc-sa/4.0/000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores370 - EducaciónPrototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11Trabajo de grado - MaestríaUniversidad Nacional de ColombiaRepositorio Institucional Universidad Nacional de Colombiahttps://repositorio.unal.edu.co/info:eu-repo/semantics/openAccessCalidad de la educaciónAprendizaje automático (Inteligencia artificial)Machine learningMediciones y pruebas educativas. EstadísticasEducational test and measurements - StatisticsAprendizaje automáticoAnalítica educativaPruebas Saber 11Predicción institucionalMachine learningEducational analyticsSaber 11 testsInstitutional predictionPrototype of a predictive model to anticipate results of educational institutions in the Saber 11 testSaber 11 (Pruebas educativas)