Prototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11

dc.contributor.advisorCamargo Mendoza, Jorge Eliecer
dc.contributor.authorPuentes Cespedes, Miguel Angel
dc.contributor.orcidPuentes Cespedes, Miguel Angel [0009000906416756]
dc.date.accessioned2026-02-04T13:14:31Z
dc.date.available2026-02-04T13:14:31Z
dc.date.issued2026
dc.descriptionIlustraciones, gráficosspa
dc.description.abstractEsta investigación desarrolla un modelo predictivo del desempeño institucional en las Pruebas Saber 11 de Colombia, con el propósito de anticipar el puntaje promedio global de las instituciones educativas a partir de sus características socioeconómicas, demográficas e institucionales. La motivación surge ante la ausencia de herramientas analíticas que permitan a los establecimientos educativos proyectar sus resultados antes de la aplicación del examen, situación que limita la planeación estratégica y la implementación de acciones preventivas. La metodología adoptada se basó en el modelo CRISP-DM, abarcando las fases de comprensión del problema, preparación y limpieza de datos, análisis exploratorio, modelado y evaluación. Se utilizaron datos históricos del ICFES correspondientes al periodo 2014-2024. Se implementaron diferentes modelos de aprendizaje automático, entre ellos regresión lineal regularizada, Random Forest, XGBoost y redes neuronales profundas. (Texto tomado de la fuente)spa
dc.description.abstractThis research develops a predictive model of institutional performance in Colombia’s Saber 11 tests, aiming to forecast the average global score of educational institutions based on their socioeconomic, demographic, and institutional characteristics. The motivation arises from the lack of analytical tools that allow schools to project their results before the application of the exam, a situation that limits strategic planning and the implementation of preventive actions. The adopted methodology was based on the CRISP-DM model, encompassing the phases of problem understanding, data preparation and cleaning, exploratory analysis, modeling, and evaluation. Historical data from the Colombian Institute for Educational Evaluation (ICFES) corresponding to the 2014-2024 period were used. Different machine learning models were implemented, including regularized linear regression, Random Forest, XGBoost, and deep neural networks.eng
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ingeniería de Sistemas y Computación
dc.description.researchareaComputación aplicada
dc.format.extent68 páginas
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/vnd.ms-excel
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/89386
dc.language.isospa
dc.publisherUniversidad Nacional de Colombia
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotá
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.placeBogotá, Colombia
dc.publisher.programBogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación
dc.relation.referencesCongreso de Colombia. (2009, 13 de julio). Ley 1324 de 2009.
dc.relation.referencesMicrosoft Power BI. (2024). “Administering and Governing the Power Platform for Enterprise”. Disponible en: https://www.microsoft.com/en-us/power-platform/products/power-bi/
dc.relation.referencesTableau. (2024). “¿Qué es Tableau?”. Disponible en: https://www.tableau.com/es-es/why-tableau/what-is-tableau
dc.relation.referencesWilson, N. B. (2021, 30 noviembre). “Análisis de resultados de las Pruebas Saber 11 implementando técnicas de minería de datos". Universidad del Norte. Disponible en: https://manglar.uninorte.edu.co/bitstream/handle/10584/9877/Documento%20principal.pdf?sequence=6&isAllowed=y
dc.relation.referencesCervera, D. E. M., Parra, O. J. S., & Prado, M. A. A. (2021). "Modelo de pronósticos en la educación superior en pruebas específicas de Ingeniería, Licenciatura y Pensamiento Científico Matemático en Saber Pro aplicando Machine Learning". Disponible en: https://repository.udistrital.edu.co/handle/11349/28453?show=full
dc.relation.referencesInstituto de ingeniería del conocimiento. La metodología CRISP-DM en ciencia de datos. Disponible en: https://www.iic.uam.es/innovacion/metodologia-crisp-dm-ciencia-de-datos/
dc.relation.referencesOrganisation for Economic Co-operation and Development (OECD). PISA - Programme for International Student Assessment. Disponible en: https://www.oecd.org/pisa/
dc.relation.referencesThe College Board. SAT Suite of Assessments. Disponible en: https://satsuite.collegeboard.org/sat
dc.relation.referencesMinistério da Educação do Brasil. Exame Nacional do Ensino Médio (ENEM). Disponible en: https://www.gov.br/inep/pt-br/areas-de-atuacao/avaliacao-e-exames-educacionais/enem
dc.relation.referencesChina Education Examinations Authority. National College Entrance Examination (Gaokao). Disponible en: http://www.neea.edu.cn/
dc.relation.referencesUNESCO. Global education monitoring report: Inclusion and education - All means all. París: UNESCO, 2020. Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000373718
dc.relation.referencesJ. Liu, Y. Li, R. Klein, “Predicting SAT performance with machine learning: socioeconomic and academic variables,” Journal of Educational Data Mining, vol. 12, no. 3, pp. 45-62, 2020. Disponible en: https://jedm.educationaldatamining.org/
dc.relation.referencesA. Silva, M. Oliveira, L. Souza, “Educational data mining on ENEM: regression and ensemble models for student performance prediction,” Revista Brasileira de Informática na Educação, vol. 28, no. 2, pp. 112-129, 2020. DOI: https://doi.org/10.5753/rbie.2020.28.2.112
dc.relation.referencesH. Zhang, L. Wang, “Predictive modeling for Gaokao admissions: integrating family, academic, and institutional features,” Computers & Education, vol. 172, 104251, 2021. DOI: https://doi.org/10.1016/j.compedu.2021.104251
dc.relation.referencesC. Romero, S. Ventura, “Educational data mining and learning analytics: An updated survey,” Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, vol. 10, no. 3, e1355, 2020. DOI: https://doi.org/10.1002/widm.1355
dc.relation.referencesRobayo-Laz, G., Romero-Fernández, A., Fernández-Villacrés, G., & Llerena-Ocaña, L. (2022). Sistemas de soporte a las decisiones y efecto en la evaluación de la calidad educativa. CIENCIAMATRIA, 8(4), 867-875. https://doi.org/10.35381/cm.v8i4.894
dc.relation.referencesMinisterio de Educación Nacional. (2023, 05 de diciembre). “Pruebas PISA 2022: Colombia, un sistema educativo resiliente que requiere cambios estructurales para mejorar su calidad”. Disponible en: https://www.mineducacion.gov.co/portal/salaprensa/Comunicados/417751:Pruebas-PISA-2022-Colombia-un-sistema-educativo-resiliente-que-requiere-cambios-estructurales-para-mejorar-su-calidad
dc.relation.referencesMartínez Mosquera, D y Peña Rivera, D. (2018). El nivel socioeconómico de los estudiantes y su efecto en la calidad medida por pruebas estandarizadas: Bogotá. Universidad de los Andes. Disponible en: http://hdl.handle.net/1992/39263
dc.relation.referencesInstituto Colombiano para la Evaluación de la Educación - ICFES. (2024). Análisis de datos.
dc.relation.referencesA. Narváez-Zúñiga. “Modelo Estadístico para determinar los factores académicos en los Resultados de las Pruebas Saber Pro”. Investigación e Innovación en Ingenierías, vol. 11, n°1, 3-21, 2023. DOI: https://doi.org/10.17081/invinno.11.1.6255
dc.relation.referencesSiemens, G., & Long, P. (2011). Penetrating the Fog: Analytics in Learning and Education. EDUCAUSE Review, 46(5), 30-40.
dc.relation.referencesP. Bruce, A. Bruce, and P. Gedeck, Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd ed., O’Reilly Media, 2020.
dc.relation.referencesInstituto Colombiano para la Evaluación de la Educación -Icfes. (septiembre de 2025). DataIcfes: Repositorio de Datos Abiertos del Icfes. 04.Saber11 [Conjunto de datos].
dc.relation.referencesInstituto Colombiano para la Evaluación de la Educación -Icfes. (agosto de 2024). DataIcfes: Repositorio de Datos Abiertos del Icfes. Examen Saber 11 [Conjunto de datos]. Recuperado de DataIcfes.
dc.relation.referencesInstituto Colombiano para la Evaluación de la Educación -Icfes. (agosto de 2024). DataIcfes: Repositorio de Datos Abiertos del Icfes. Examen Saber 110 [Conjunto de datos]. Recuperado de DataIcfes
dc.relation.referencesDatabricks. Medallion architecture. (2022, marzo 9). Recuperado de: https://www.databricks.com/glossary/medallion-architecture?utm_source=chatgpt.com
dc.relation.referencesA. Field, J. Miles, Z. Field. Discovering Statistics Using R. 2nd ed. London: Sage, 2012.
dc.relation.referencesD. C. Montgomery. Design and Analysis of Experiments. 10th ed. Hoboken, NJ: Wiley, 2019.
dc.relation.referencesJ. Cohen. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum Associates, 1988.
dc.relation.referencesErsan, O., Rodriguez, M.C. Socioeconomic status and beyond: a multilevel analysis of TIMSS mathematics achievement given student and school context in Turkey. Large-scale Assess Educ 8, 15 (2020). https://doi.org/10.1186/s40536-020-00093-y
dc.relation.referencesC. M. Pineda Pertuz, Aprendizaje automático y profundo en Python: una mirada hacia la inteligencia artificial. Bogotá, Colombia: Ediciones de la U, 2021. ISBN: 9789587923162.
dc.relation.referencesV. Cerqueira, L. Torgo y I. Mozetič, “Evaluating time series forecasting models: an empirical study,” Machine Learning, 109, pp. 1997-2028, 2020.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.licenseAtribución-NoComercial-CompartirIgual 4.0 Internacional
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subject.blaaSaber 11 (Pruebas educativas)
dc.subject.ddc000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores
dc.subject.ddc370 - Educación
dc.subject.lembCalidad de la educaciónspa
dc.subject.lembAprendizaje automático (Inteligencia artificial)spa
dc.subject.lembMachine learningeng
dc.subject.lembMediciones y pruebas educativas. Estadísticasspa
dc.subject.lembEducational test and measurements - Statisticseng
dc.subject.proposalAprendizaje automáticospa
dc.subject.proposalAnalítica educativaspa
dc.subject.proposalPruebas Saber 11spa
dc.subject.proposalPredicción institucionalspa
dc.subject.proposalMachine learningeng
dc.subject.proposalEducational analyticseng
dc.subject.proposalSaber 11 testseng
dc.subject.proposalInstitutional predictioneng
dc.titlePrototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11spa
dc.title.translatedPrototype of a predictive model to anticipate results of educational institutions in the Saber 11 testeng
dc.typeTrabajo de grado - Maestría
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dcterms.audience.professionaldevelopmentPúblico general
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2

Archivos

Bloque original

Mostrando 1 - 4 de 4
Cargando...
Miniatura
Nombre:
anexo_c_diccionario_actualizado.xlsx
Tamaño:
13.35 KB
Formato:
Microsoft Excel XML
Cargando...
Miniatura
Nombre:
anexo_a_diccionario_variables.xlsx
Tamaño:
22.48 KB
Formato:
Microsoft Excel XML
Cargando...
Miniatura
Nombre:
anexo_b_matriz_valores_nulos.xlsx
Tamaño:
16.46 KB
Formato:
Microsoft Excel XML
Cargando...
Miniatura
Nombre:
Tesis Final de Maestría en Ingeniería de Sistemas y Computación.2025.pdf
Tamaño:
1.92 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: