Prototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11
| dc.contributor.advisor | Camargo Mendoza, Jorge Eliecer | |
| dc.contributor.author | Puentes Cespedes, Miguel Angel | |
| dc.contributor.orcid | Puentes Cespedes, Miguel Angel [0009000906416756] | |
| dc.date.accessioned | 2026-02-04T13:14:31Z | |
| dc.date.available | 2026-02-04T13:14:31Z | |
| dc.date.issued | 2026 | |
| dc.description | Ilustraciones, gráficos | spa |
| dc.description.abstract | Esta investigación desarrolla un modelo predictivo del desempeño institucional en las Pruebas Saber 11 de Colombia, con el propósito de anticipar el puntaje promedio global de las instituciones educativas a partir de sus características socioeconómicas, demográficas e institucionales. La motivación surge ante la ausencia de herramientas analíticas que permitan a los establecimientos educativos proyectar sus resultados antes de la aplicación del examen, situación que limita la planeación estratégica y la implementación de acciones preventivas. La metodología adoptada se basó en el modelo CRISP-DM, abarcando las fases de comprensión del problema, preparación y limpieza de datos, análisis exploratorio, modelado y evaluación. Se utilizaron datos históricos del ICFES correspondientes al periodo 2014-2024. Se implementaron diferentes modelos de aprendizaje automático, entre ellos regresión lineal regularizada, Random Forest, XGBoost y redes neuronales profundas. (Texto tomado de la fuente) | spa |
| dc.description.abstract | This research develops a predictive model of institutional performance in Colombia’s Saber 11 tests, aiming to forecast the average global score of educational institutions based on their socioeconomic, demographic, and institutional characteristics. The motivation arises from the lack of analytical tools that allow schools to project their results before the application of the exam, a situation that limits strategic planning and the implementation of preventive actions. The adopted methodology was based on the CRISP-DM model, encompassing the phases of problem understanding, data preparation and cleaning, exploratory analysis, modeling, and evaluation. Historical data from the Colombian Institute for Educational Evaluation (ICFES) corresponding to the 2014-2024 period were used. Different machine learning models were implemented, including regularized linear regression, Random Forest, XGBoost, and deep neural networks. | eng |
| dc.description.degreelevel | Maestría | |
| dc.description.degreename | Magíster en Ingeniería de Sistemas y Computación | |
| dc.description.researcharea | Computación aplicada | |
| dc.format.extent | 68 páginas | |
| dc.format.mimetype | application/pdf | |
| dc.format.mimetype | application/vnd.ms-excel | |
| dc.identifier.instname | Universidad Nacional de Colombia | spa |
| dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
| dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
| dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/89386 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Nacional de Colombia | |
| dc.publisher.branch | Universidad Nacional de Colombia - Sede Bogotá | |
| dc.publisher.faculty | Facultad de Ingeniería | |
| dc.publisher.place | Bogotá, Colombia | |
| dc.publisher.program | Bogotá - Ingeniería - Maestría en Ingeniería - Ingeniería de Sistemas y Computación | |
| dc.relation.references | Congreso de Colombia. (2009, 13 de julio). Ley 1324 de 2009. | |
| dc.relation.references | Microsoft Power BI. (2024). “Administering and Governing the Power Platform for Enterprise”. Disponible en: https://www.microsoft.com/en-us/power-platform/products/power-bi/ | |
| dc.relation.references | Tableau. (2024). “¿Qué es Tableau?”. Disponible en: https://www.tableau.com/es-es/why-tableau/what-is-tableau | |
| dc.relation.references | Wilson, N. B. (2021, 30 noviembre). “Análisis de resultados de las Pruebas Saber 11 implementando técnicas de minería de datos". Universidad del Norte. Disponible en: https://manglar.uninorte.edu.co/bitstream/handle/10584/9877/Documento%20principal.pdf?sequence=6&isAllowed=y | |
| dc.relation.references | Cervera, D. E. M., Parra, O. J. S., & Prado, M. A. A. (2021). "Modelo de pronósticos en la educación superior en pruebas específicas de Ingeniería, Licenciatura y Pensamiento Científico Matemático en Saber Pro aplicando Machine Learning". Disponible en: https://repository.udistrital.edu.co/handle/11349/28453?show=full | |
| dc.relation.references | Instituto de ingeniería del conocimiento. La metodología CRISP-DM en ciencia de datos. Disponible en: https://www.iic.uam.es/innovacion/metodologia-crisp-dm-ciencia-de-datos/ | |
| dc.relation.references | Organisation for Economic Co-operation and Development (OECD). PISA - Programme for International Student Assessment. Disponible en: https://www.oecd.org/pisa/ | |
| dc.relation.references | The College Board. SAT Suite of Assessments. Disponible en: https://satsuite.collegeboard.org/sat | |
| dc.relation.references | Ministério da Educação do Brasil. Exame Nacional do Ensino Médio (ENEM). Disponible en: https://www.gov.br/inep/pt-br/areas-de-atuacao/avaliacao-e-exames-educacionais/enem | |
| dc.relation.references | China Education Examinations Authority. National College Entrance Examination (Gaokao). Disponible en: http://www.neea.edu.cn/ | |
| dc.relation.references | UNESCO. Global education monitoring report: Inclusion and education - All means all. París: UNESCO, 2020. Disponible en: https://unesdoc.unesco.org/ark:/48223/pf0000373718 | |
| dc.relation.references | J. Liu, Y. Li, R. Klein, “Predicting SAT performance with machine learning: socioeconomic and academic variables,” Journal of Educational Data Mining, vol. 12, no. 3, pp. 45-62, 2020. Disponible en: https://jedm.educationaldatamining.org/ | |
| dc.relation.references | A. Silva, M. Oliveira, L. Souza, “Educational data mining on ENEM: regression and ensemble models for student performance prediction,” Revista Brasileira de Informática na Educação, vol. 28, no. 2, pp. 112-129, 2020. DOI: https://doi.org/10.5753/rbie.2020.28.2.112 | |
| dc.relation.references | H. Zhang, L. Wang, “Predictive modeling for Gaokao admissions: integrating family, academic, and institutional features,” Computers & Education, vol. 172, 104251, 2021. DOI: https://doi.org/10.1016/j.compedu.2021.104251 | |
| dc.relation.references | C. Romero, S. Ventura, “Educational data mining and learning analytics: An updated survey,” Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, vol. 10, no. 3, e1355, 2020. DOI: https://doi.org/10.1002/widm.1355 | |
| dc.relation.references | Robayo-Laz, G., Romero-Fernández, A., Fernández-Villacrés, G., & Llerena-Ocaña, L. (2022). Sistemas de soporte a las decisiones y efecto en la evaluación de la calidad educativa. CIENCIAMATRIA, 8(4), 867-875. https://doi.org/10.35381/cm.v8i4.894 | |
| dc.relation.references | Ministerio de Educación Nacional. (2023, 05 de diciembre). “Pruebas PISA 2022: Colombia, un sistema educativo resiliente que requiere cambios estructurales para mejorar su calidad”. Disponible en: https://www.mineducacion.gov.co/portal/salaprensa/Comunicados/417751:Pruebas-PISA-2022-Colombia-un-sistema-educativo-resiliente-que-requiere-cambios-estructurales-para-mejorar-su-calidad | |
| dc.relation.references | Martínez Mosquera, D y Peña Rivera, D. (2018). El nivel socioeconómico de los estudiantes y su efecto en la calidad medida por pruebas estandarizadas: Bogotá. Universidad de los Andes. Disponible en: http://hdl.handle.net/1992/39263 | |
| dc.relation.references | Instituto Colombiano para la Evaluación de la Educación - ICFES. (2024). Análisis de datos. | |
| dc.relation.references | A. Narváez-Zúñiga. “Modelo Estadístico para determinar los factores académicos en los Resultados de las Pruebas Saber Pro”. Investigación e Innovación en Ingenierías, vol. 11, n°1, 3-21, 2023. DOI: https://doi.org/10.17081/invinno.11.1.6255 | |
| dc.relation.references | Siemens, G., & Long, P. (2011). Penetrating the Fog: Analytics in Learning and Education. EDUCAUSE Review, 46(5), 30-40. | |
| dc.relation.references | P. Bruce, A. Bruce, and P. Gedeck, Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd ed., O’Reilly Media, 2020. | |
| dc.relation.references | Instituto Colombiano para la Evaluación de la Educación -Icfes. (septiembre de 2025). DataIcfes: Repositorio de Datos Abiertos del Icfes. 04.Saber11 [Conjunto de datos]. | |
| dc.relation.references | Instituto Colombiano para la Evaluación de la Educación -Icfes. (agosto de 2024). DataIcfes: Repositorio de Datos Abiertos del Icfes. Examen Saber 11 [Conjunto de datos]. Recuperado de DataIcfes. | |
| dc.relation.references | Instituto Colombiano para la Evaluación de la Educación -Icfes. (agosto de 2024). DataIcfes: Repositorio de Datos Abiertos del Icfes. Examen Saber 110 [Conjunto de datos]. Recuperado de DataIcfes | |
| dc.relation.references | Databricks. Medallion architecture. (2022, marzo 9). Recuperado de: https://www.databricks.com/glossary/medallion-architecture?utm_source=chatgpt.com | |
| dc.relation.references | A. Field, J. Miles, Z. Field. Discovering Statistics Using R. 2nd ed. London: Sage, 2012. | |
| dc.relation.references | D. C. Montgomery. Design and Analysis of Experiments. 10th ed. Hoboken, NJ: Wiley, 2019. | |
| dc.relation.references | J. Cohen. Statistical Power Analysis for the Behavioral Sciences. 2nd ed. Hillsdale, NJ: Lawrence Erlbaum Associates, 1988. | |
| dc.relation.references | Ersan, O., Rodriguez, M.C. Socioeconomic status and beyond: a multilevel analysis of TIMSS mathematics achievement given student and school context in Turkey. Large-scale Assess Educ 8, 15 (2020). https://doi.org/10.1186/s40536-020-00093-y | |
| dc.relation.references | C. M. Pineda Pertuz, Aprendizaje automático y profundo en Python: una mirada hacia la inteligencia artificial. Bogotá, Colombia: Ediciones de la U, 2021. ISBN: 9789587923162. | |
| dc.relation.references | V. Cerqueira, L. Torgo y I. Mozetič, “Evaluating time series forecasting models: an empirical study,” Machine Learning, 109, pp. 1997-2028, 2020. | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.license | Atribución-NoComercial-CompartirIgual 4.0 Internacional | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject.blaa | Saber 11 (Pruebas educativas) | |
| dc.subject.ddc | 000 - Ciencias de la computación, información y obras generales::004 - Procesamiento de datos Ciencia de los computadores | |
| dc.subject.ddc | 370 - Educación | |
| dc.subject.lemb | Calidad de la educación | spa |
| dc.subject.lemb | Aprendizaje automático (Inteligencia artificial) | spa |
| dc.subject.lemb | Machine learning | eng |
| dc.subject.lemb | Mediciones y pruebas educativas. Estadísticas | spa |
| dc.subject.lemb | Educational test and measurements - Statistics | eng |
| dc.subject.proposal | Aprendizaje automático | spa |
| dc.subject.proposal | Analítica educativa | spa |
| dc.subject.proposal | Pruebas Saber 11 | spa |
| dc.subject.proposal | Predicción institucional | spa |
| dc.subject.proposal | Machine learning | eng |
| dc.subject.proposal | Educational analytics | eng |
| dc.subject.proposal | Saber 11 tests | eng |
| dc.subject.proposal | Institutional prediction | eng |
| dc.title | Prototipo de modelo predictivo para anticipar resultados de instituciones educativas en las pruebas Saber 11 | spa |
| dc.title.translated | Prototype of a predictive model to anticipate results of educational institutions in the Saber 11 test | eng |
| dc.type | Trabajo de grado - Maestría | |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dcterms.audience.professionaldevelopment | Público general | |
| oaire.accessrights | http://purl.org/coar/access_right/c_abf2 |
Archivos
Bloque original
1 - 4 de 4
Cargando...
- Nombre:
- anexo_c_diccionario_actualizado.xlsx
- Tamaño:
- 13.35 KB
- Formato:
- Microsoft Excel XML
Cargando...
- Nombre:
- anexo_a_diccionario_variables.xlsx
- Tamaño:
- 22.48 KB
- Formato:
- Microsoft Excel XML
Cargando...
- Nombre:
- anexo_b_matriz_valores_nulos.xlsx
- Tamaño:
- 16.46 KB
- Formato:
- Microsoft Excel XML
Cargando...
- Nombre:
- Tesis Final de Maestría en Ingeniería de Sistemas y Computación.2025.pdf
- Tamaño:
- 1.92 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 5.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:

