Mostrar el registro sencillo del documento

dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional
dc.contributor.advisorCorrea Morales, Juan Carlos
dc.contributor.authorAhumada Riaño, Diana Paola
dc.coverage.temporalColombia
dc.coverage.temporalColombia
dc.date.accessioned2023-07-17T16:18:08Z
dc.date.available2023-07-17T16:18:08Z
dc.date.issued2023-07-08
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/84182
dc.descriptionIlustraciones
dc.description.abstractEn los últimos años, el concepto de ‘calidad en educación’ ha adquirido relevancia, en particular, se le ha dado bastante atención a los resultados de los exámenes estandarizados, como las pruebas Saber 11 y las pruebas PISA, y, así mismo, se han utilizado como herramientas para evaluar una parte de la calidad educativa. Por esta razón, es necesario realizar análisis estadísticos que permitan tener una mejor comprensión de los factores que influyen en los resultados de este tipo de pruebas, los cuales pueden estar relacionados con las condiciones socioeconómicas de los estudiantes, la infraestructura escolar, entre otros aspectos. Es así que, en función de obtener una visión más precisa y completa de la situación educativa en el departamento de Antioquia. En este trabajo se analizarán las variables socioeconómicas proporcionadas en los datos del Icfes con el propósito de ofrecer un panorama de las posibles causas de los resultados de las pruebas Saber 11 en cada una de las subregiones que la componen. El objetivo de esta investigación es, entonces, realizar un diagnóstico del nivel educativo en el departamento de Antioquia contrastando el desempeño en las pruebas Saber 11 de cada una de las subregiones del departamento, el puntaje global y la información socioeconómica de los estudiantes que presentaron la prueba durante el periodo 2017-2019. Para alcanzar este objetivo, se llevó a cabo una revisión de la literatura sobre los métodos y modelos que se utilizan para analizar pruebas estandarizadas en educación. Consecuentemente, se decidió emplear el proceso de clúster con K-Means para clasificar a los grupos de estudiantes según sus características socioeconómicas, utilizando los programas RStudio y Python. Así pues, se clasificó la población en 10 grupos mediante el proceso de clusterización teniendo en cuenta las variables socioeconómicas presentadas en las bases de datos con el fin de describir algunos de los comportamientos de las variables según la subregión. Finalmente, se llevó a cabo una prueba de homogeneidad para examinar las variables que podrían influir en los resultados de las pruebas Saber 11 en el departamento de Antioquia, considerando las características socioeconómicas de los estudiantes. (Texto tomado de la fuente)
dc.description.abstractThe concept of ‘quality in education’ has gained greater relevance in recent years, placing a significant importance on the results of standardized exams such as the Saber 11 and PISA tests, using them as tools to evaluate a part of the educational quality. For this reason, it is necessary to conduct statistical analyses that allow a better understanding of the factors that influence the results of these types of standardized tests, which may be related to socioeconomic conditions, school infrastructure, among other aspects. In this way, a more complete and accurate view of the educational situation in the department of Antioquia can be obtained. In this work only the socioeconomic variables provided by the Icfes data will be analyzed to give an insight into the possible causes of the Saber test results in each of the subregions of Antioquia. The objective of this work is, then, to diagnose the educational level in the department of Antioquia through the performance in the Saber 11 tests of each of the department’s subregions, contrasting the overall score and the socioeconomic information of the students who took the test during the period 2017-2019. To achieve this objective, a literature review on the methods and models that can be used to analyze standardized tests in education was carried out. Consequently the K-Means clustering process was decided to be employed to classify groups of students according to their socioeconomic characteristics, using RStudio and Python programs. Thus the population was classified into 10 groups through the clustering process, taking into account the socioeconomic variables presented in the databases, in order to describe some behaviors of the variables according to the subregion. Finally, a homogeneity test was conducted to examine the variables that could influence the results of the Saber 11 tests in the department of Antioquia, considering the socioeconomic characteristics.
dc.format.extent158 páginas
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.publisherUniversidad Nacional de Colombia
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.ddc510 - Matemáticas::519 - Probabilidades y matemáticas aplicadas
dc.subject.ddc370 - Educación
dc.titleTécnicas de minería de datos para el análisis de pruebas SABER
dc.typeTrabajo de grado - Maestría
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dc.publisher.programMedellín - Ciencias - Maestría en Ciencias - Estadística
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Ciencias - Estadística
dc.identifier.instnameUniversidad Nacional de Colombia
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombia
dc.identifier.repourlhttps://repositorio.unal.edu.co/
dc.publisher.facultyFacultad de Ciencias
dc.publisher.placeMedellín, Colombia
dc.publisher.branchUniversidad Nacional de Colombia - Sede Medellín
dc.relation.indexedLaReferencia
dc.relation.referencesAgresti, A. (1990). Categorical data analysis. New York: John Wiley.
dc.relation.referencesArenas, G. (2002). Las madres en la educación, una voz siempre presente pero, ¿reconocida. El harén pedagógico: perspectiva de género en la organización escolar , 103–118.
dc.relation.referencesAristizabal, G. C., Rosero, M. D., Bedoya, J. T., y cols. (2016). Causas de las diferencias en desempeño escolar entre los colegios públicos y privados: Colombia en las pruebas saber11 2014 (Inf. Téc.).
dc.relation.referencesAustin, P. C. (2011). An introduction to propensity score methods for reducing the effects of confounding in observational studies (Vol. 1).
dc.relation.referencesBernal, L. K. A.-G., Bernal, G., y cols. (2016). Brechas de género en el rendimiento escolar a lo largo de la distribución de puntajes: evidencia pruebas Saber 11° (Inf. Tec.). Universidad Javeriana-Bogotá.
dc.relation.referencesBerry, M. J., y Linoff, G. S. (2004). Data mining techniques: For marketing, sales, and customer relationship management. John Wiley & Sons.
dc.relation.referencesBischl, B., Lang, M., Kotthoff, L., Schiffner, J., Richter, J., Studerus, E., . . . [...] (2021). mlr: Machine learning in r [Manual de software informático]. Descargado de https:// mlr.mlr-org.com/ (R package versión 2.18.0)
dc.relation.referencesBorg, W. R., y Gall, M. D. (1984). Educational research: An introduction. British Journal of Educational Studies, 32 (3), 274–274.
dc.relation.referencesBorg, W. R., y Gall, M. D. (1984). Educational research: An introduction. British Journal of Educational Studies, 32 (3), 274–274.
dc.relation.referencesCastro Aristizábal, G., Diaz Rosero, M., y Tobar Bedoya, J. (2016). Causas de las diferencias en desempeño escolar entre los colegios públicos y privados: Colombia en las pruebas Saber11 2014 (Inf. Tec.). Faculty of Economics and Management, Pontificia Universidad Javeriana Cali.
dc.relation.referencesCastro, L. M. C., Ortiz, F., y Lemus, D. F. (2016). Construcción de un índice socioeconómico familiar para los estudiantes que presentan la prueba Saber 11. Comunicaciones en Estadística, 9 (1), 79–92.
dc.relation.referencesChecchi, D., y Peragine, V. (2010). Inequality of opportunity in italy. The Journal of Economic Inequality , 8 (4), 429–450.
dc.relation.referencesChica Gómez, S., Galvis Gutiérrez, D., y Ramírez Hassan, A. (2011). Determinantes del rendimiento académico en Colombia: Pruebas Icfes Saber 11, 2009 (academic performance determinants in Colombia: Icfes Saber 11, 2009 exam). Center for Research in Economics and Finance (CIEF), Working Papers(11-5).
dc.relation.referencesChiok, C. H. M. (2017). Predicción del rendimiento académico aplicando técnicas de minería de datos. En Anales científicos (Vol. 78, pp. 26–33).
dc.relation.referencesDiamond, J. (2021). The influence of cultural and social conditions on student academic performance. Journal of Education, 55 (3), 123-134.
dc.relation.referencesFerreira, F. H., Gignoux, J., y Aran, M. (2011). Measuring inequality of opportunity with imperfect data: the case of turkey. The Journal of Economic Inequality, 9 (4), 651–680. Firke, S., Bengtsson, J., Hill, S., y Wickham, H. (2021). janitor: Simple tools for examining and cleaning dirty data [Manual de software informático]. Descargado de https:// CRAN.R-project.org/package=janitor (R package version 2.1.0)
dc.relation.referencesFlórez, C., Espinosa, F., Sánchez, L., y Angulo, R. (2008). Diseño del índice Sisbén en su tercera versión. Bogotá, Colombia. https://www. sisben. gov. co/Portals/0/Documentos/Documentos Técnicos/02. Resumen Ejecutivo Sisb.
dc.relation.referencesGiordani, P., Ferraro, M. B., Martella, F., Giordani, P., Ferraro, M. B., y Martella, F. (2020). Introduction to clustering. Springer.
dc.relation.referencesGrizzle, S.-C. F. y. K. G. G., J. E. (1969). Analysis of categorical data by linear models biometrics. , 25 (Nov), 489–504.
dc.relation.referencesGuarín, A., Medina, C., y Posso, C. (2018). Calidad, cobertura y costos ocultos de la educación.
dc.relation.referencesGuo, . F.-M. W., S. (2010). Propensity score analysis: Statistical methods and applications (Vol. 1).
dc.relation.referencesHo, I.-K. K. G. . S. E. A., D. E. (2007). Matching as nonparametric preprocessing for reducing model dependence in parametric causal inference (Vol. 3).
dc.relation.referencesICFES. (2019). Instituto colombiano para la evaluación de la educación - Icfes. (2021). boletín saber al detalle (edición 4).
dc.relation.referencesKassambara, A. (2017). Practical guide to cluster analysis in r (Vol. 1). Createspace.
dc.relation.referencesKoh, T. G., Hian. (2005). Data mining applications in healthcare. Journal of healthcare information management(19), 64–72.
dc.relation.referencesKuhn, M., Wickham, H., y RStudio. (2021). tidymodels: Easily install and load the ’tidymodels’ packages [Manual de software inform´atico]. Descargado de https:// www.tidymodels.org/ (R package version 0.1.4)
dc.relation.referencesLópez, Á., Virgüez, A., Silva, C., y Sarmiento, J. (2017). Desigualdad de oportunidades en el sistema de educación pública en Bogotá, Colombia. Lecturas de Economía (87), 165–190.
dc.relation.referencesMaaten, L. v. d., y Hinton, G. (2008). Visualizing data using t-sne. Journal of machine learning research, 9 (Nov), 2579–2605.
dc.relation.referencesMacQueen, J. (1967). Some methods for classification and analysis of multivariate ob- servations. En L. M. Le Cam y J. Neyman (Eds.), Proceedings of the fifth berkeley symposium on mathematical statistics and probability (Vol. 1, pp. 281–297). Berkeley, CA: University of California Press.
dc.relation.referencesManrique, I. J. A., y Carreño, C. A. A. (2014). Influencia de los padres en el rendimiento académico de los hijos: una aproximación econométrica en el contexto de la educación media colombiana. Educación y Desarrollo Social , 8 (2), 184–199.
dc.relation.referencesMarqués, I. (2016). Apuntes sobre el informe Coleman sobre la difícil convivencia de los principios igualitarios en un mundo desigual. International Journal of Sociology of Education, 5 (2), 107–126.
dc.relation.referencesMonroy, L. G. D., Rivera, M. A. M., y Dávila, L. R. L. (2018). Análisis estadístico de datos categóricos. Universidad Nacional de Colombia
dc.relation.referencesMurillo, F. J., y Carrillo-Luna, S. (2021). Segregación escolar por nivel socioeconómico en Colombia y sus departamentos. Magis, Revista Internacional de Investigación en Educación, 14 , 1–23.
dc.relation.referencesNuñez, R. B., Zambrano, M. Q., Alarcón, M. S., Monar, L. V., y Cisneros, J. C. (2017). Alimentación saludable como factor influyente en el rendimiento escolar de los estudiantes de instituciones educativas en ecuador. FACSALUD-UNEMI , 1 (1), 34–39.
dc.relation.referencesPadilla-Escorcia, I. A., González-Tinoco, N. E., y Fernández-Díaz, O. R. (2022). Modelo estadístico para estimar la influencia de la lectura crítica en las competencias evaluadas en las pruebas saber 11°. Trilogía Ciencia Tecnología Sociedad , 14 (26).
dc.relation.referencesPardo, C. E. (2020). Estadística descriptiva multivariada.
dc.relation.referencesP´erez-Pulido, M. O., Aguilar-Galvis, F., Orlandoni-Merli, G., Ramoni-Perazzi, J., y cols. (2016). Análisis estadístico de los resultados de las pruebas de estado para el ingreso a la educación superior en la universidad de Santander, Colombia-statistical analysis of the results of state tests for admission to higher education at the university of Santander, Colombia. Revista científica, 4 (27), 328–339.
dc.relation.referencesPi˜nero, J. C. M., S´anchez, M. C. C., Bernal, I. A. M., y Jerez, S. A. R. (2019). Incidencia de las tic en el mejoramiento de las pruebas saber 11: un análisis a partir del modelo tpack. Encuentro Internacional de Educación en Ingeniería.
dc.relation.referencesRamoni Perazzi, J., Orlandoni Merli, G., Pérez Pulido, M. O., y Aguilar Galvis, F. (2016). Análisis estadístico de los resultados de las prueba de estado para el ingreso a la educación superior en la universidad de Santander, Colombia. Revista Científica.
dc.relation.referencesRhys, H. (2020). Machine learning with r, the tidyverse, and mlr (Vol. 1). Shelter Island.
dc.relation.referencesRodríguez, D. F. M. (2016). Algunos factores que influyen en los resultados de las pruebas estandarizadas y censales. Boletín Redipe, 5 (3), 136–145.
dc.relation.referencesRíos-Cuesta, W. (2023). Desempeño histórico en la prueba saber de matemáticas: la necesidad de revisar la política educativa del chocó. Encuentros, 21 (01), 30–39.
dc.relation.referencesSamper, J. D. Z. (2021). La inteligencia y el talento se desarrollan (Vol. 1). Magisterio.
dc.relation.referencesSánchez, G. D. D. (2020). La evaluación desde las pruebas estandarizadas en la educación en Latinoamérica. Revista En-Contexto, 8 (13), 107–133.
dc.relation.referencesSánchez, A. (2011). Etnia y rendimiento académico en Colombia. , 14 (Dic), 189–227.
dc.relation.referencesToranzos, L. (1996). Evaluación y calidad. Revista iberoamericana de educación, 10 .
dc.relation.referencesTorrecilla, F. J. M. (2008). Los modelos multinivel como herramienta para la investigación educativa. Magis. Revista Internacional de Investigación en Educación, 1 (1), 45–62.
dc.relation.referencesVillacís Mejía, J. E. (2020). Estado nutricional antropométrico, nivel socioeconómico y rendimiento académico en niños escolares de 6 a 12 años las islas Galápagos, ecuador 2019.
dc.relation.referencesWaring, D., y Chang, E. (2021). skimr: Compact and flexible summaries of data [Manual de software inform´atico]. Descargado de https://cran.r-project.org/package=skimr (R package version 2.1.3)
dc.relation.referencesWickham, H. (2016). ggplot2: Elegant graphics for data analysis [Manual de software inform´atico]. Descargado de https://cran.r-project.org/web/packages/ggplot2/ index.html (R package version 3.3.0)
dc.relation.referencesWickham, H., y Bryan, J. (2021). tidyverse: Easily install and load the ’tidyverse’ [Manual de software informático]. Descargado de https://tidyverse.org/ (R package versión 1.3.1)
dc.relation.referencesWickham, H., Bryan, J., y M¨uller, K. (2021). readxl: Read excel files [Manual de software informático]. Descargado de https://readxl.tidyverse.org/ (R package versión 1.3.1)
dc.relation.referencesZuluaga, K. J. H., y Morales, J. C. C. (2018). Regresión logística bivariable para tablas de contingencia usando metodología gsk. Comunicaciones en Estadística, 11 (2), 153–170.
dc.relation.referencesAlcaldía de Caucasia. (2019). Plan de desarrollo municipal Caucasia 2020. Descargado de https://www.caucasia-antioquia.gov.co/inicio/index.shtml
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.subject.lembMinería de datos
dc.subject.lembMediciones y pruebas educativas - Colombia
dc.subject.lembCalidad de la educación
dc.subject.lembAnálisis cluster
dc.subject.proposalPruebas Saber 11
dc.subject.proposalPruebas estandarizadas
dc.subject.proposalCalidad educativa
dc.subject.proposalNivel educativo
dc.subject.proposalClúster
dc.subject.proposalStandardized tests
dc.subject.proposalEducational quality
dc.subject.proposalEducational level
dc.subject.proposalCluster
dc.title.translatedData mining techniques for the analysis of SABER evidence
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2
dcterms.audience.professionaldevelopmentEstudiantes
dcterms.audience.professionaldevelopmentMaestros
dc.description.curricularareaÁrea Curricular Estadística
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/EnRecursoHumano/inicio.do


Archivos en el documento

Thumbnail

Este documento aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del documento

Atribución-NoComercial-SinDerivadas 4.0 InternacionalEsta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito