Estimación de áreas pequeñas utilizando imputación múltiple en modelos logísticos de tres parámetros

dc.contributor.advisorTrujillo Oyola, Leonardospa
dc.contributor.authorTellez Piñerez, Cristian Fernandospa
dc.date.accessioned2021-01-27T21:45:10Zspa
dc.date.available2021-01-27T21:45:10Zspa
dc.date.issued2020-10-30spa
dc.description.abstractGenerar datos de alta calidad y bajo costo es una necesidad para los tomadores de decisiones. En el sector educativo, estos datos son necesarios para decidir sobre la creación de políticas públicas, la continuidad de los programas existentes y la asignación de recursos año por año. En esta tesis se propone una metodología que incorpora la teoría de respuesta al ítem con la estimación en áreas pequeñas en presencia de datos faltantes. Se propone un estimador insesgado para el promedio de la habilidad de los estudiantes y un estimador bayesiano basado en la distribución beta, para la proporción de estudiantes que cuenten con una característica particular. Estos estimadores se comparan, vía simulación con los estimadores más usados en la práctica como lo son el estimador de Horvitz-Thompson, calibración y estimadores compuestos, para el caso del promedio, y para el caso de la proporción, se compara con el estimador de una razón y el estimador bayesiano para la proporción basado en la distribución normal. Concluyendo con esto que, los estimadores propuestos tienen menores errores estándar relativos y a su vez, son insesgados para el caso del promedio y aproximadamente insesgados para el caso de la proporción. Adicional a lo anterior, se hacen dos aplicaciones de esta metodología, la primera, utilizando los resultados de la prueba de matemáticas de PISA presentada en el año 2015 y la segunda, utilizando los resultados de las pruebas Saber 3°, 5° y 9° aplicada por el Icfes en Colombia. Para la primera, se comparan los resultados publicados con los obtenidos utilizando esta metodología en términos de precisión y a su vez, se predicen algunos países, observándose que los sesgos relativos de estas predicciones son pequeños. Para la segunda, se toma la muestra controlada, la cual implica más seguridad en la aplicación y en la posible copia entre participantes, y se predicen los resultados a nivel de entidades territoriales certifi cadas (ETC). Concluyendo con esto, que esta metodología es una buena alternativa para la generación de estadísticas ofi ciales en el sector educativo.spa
dc.description.abstractGenerating high-quality low-cost data is a must for decision makers. In the education sector, these data are necessary to decide on the creation of public policies, the continuity of the a ected programs and the allocation of resources year by year. In this thesis, a methodology is proposed that incorporates item response theory methods and small area estimation in the presence of missing data. An unbiased estimator for the average of students ability and a Bayesian estimator based on the Beta distribution for the proportion of students with a particular characteristic are proposed. These estimators are compared, via simulation, with the estimators most used in survey practice for the mean population such as the Horvitz-Thompson, calibration and composite estimator. Regarding the estimator of a proportion, its estimator is compared with the ratio estimator and the Bayesian estimator based on a normal distribution. The proposed estimators have lower relative standard errors, they are unbiased for the mean estimator and approximately unbiased for the proportion case. In addition, two applications of this methodology were implemented; the rst one, using the PISA mathematics test results in 2015 and the second one, using the results of Saber 3°, 5° y 9° tests applied by Icfes in Colombia. In the PISA case, the published results are compared with those obtained using this methodology in terms of precision and, in turn, some countries are predicted, observing that the relative biases of these predictions are small. In the Icfes application the results are predicted at the level of certi ed territorial entities (ETC). In conclusion, this methodology is a good alternative for the generation of o cial statistics in the educational sector.spa
dc.description.degreelevelDoctoradospa
dc.format.extent158spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.citationTellez Piñerez, C. F. (2020). Estimación de áreas pequeñas utilizando imputación múltiple en modelos logísticos de tres parámetros [Tesis de doctorado, Universidad Nacional de Colombia]. Repositorio Institucional.spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/78956
dc.language.isospaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.departmentDepartamento de Estadísticaspa
dc.publisher.programBogotá - Ciencias - Doctorado en Ciencias - Estadísticaspa
dc.relation.referencesAdams, L. & Darwin, G. (1982), `Solving the quandary between questionnaire length and response rate in educational research', Research in Higher Education 17, 231-240.spa
dc.relation.referencesAllen, T. M. (2004), Assessing Academic Programs in Higher Education, Jossey- Bass.spa
dc.relation.referencesÁlvarez, L., González-Castro, P., Núñeez, J. C., González-Pienda, J. A., Álvarez, D. & Bernardo, A. (2007), `Desarrollo de los procesos atencionales mediante ((actividades adaptadas))', Papeles del psicólogo 28(3), 211{217.spa
dc.relation.referencesAyala-García, J. & Ayala-García, J. (2015), `Evaluación externa y calidad de la educación en colombia', Documentos de Trabajo Sobre Economía Regional y Urbana; No. 217 .spa
dc.relation.referencesBaker, F. & Kim, S. (2004), Item Response Theory: Parameter Estimation Techniques, New York: Dekker.spa
dc.relation.referencesBattese, G. E., Harter, R. M. & Fuller, W. A. (1988), `An error components model for prediction of county crop areas using survey and satellite data', Journal of the American Statistical Association 83(401), 28-36.spa
dc.relation.referencesBernal, L. K. & González, L. M. (2017), Distribución beta para modelar proporciones en áreas pequeñas, Master's thesis, Universidad Nacional de Colombia-Sede Bogotá.spa
dc.relation.referencesBirnbaum, A. (1958), `On the estimation of mental ability', Series report nº 15. Project nº 7755-7723, USAF School of Aviation Medicine, Randolph Air Force Base, Texas pp. 7755-7723.spa
dc.relation.referencesBock, R. D. & Aitkin, M. (1981), `Marginal maximum likelihood estimation of item parameters: Application of an EM algorithm', Psychometrika 46(4), 443-459.spa
dc.relation.referencesBock, R. D. & Mislevy, R. J. (1982), `Adaptive EAP estimation of ability in a microcomputer environment', Applied Psychological Measurement 6(4), 431-444.spa
dc.relation.referencesCepeda, E. (2001), Modelagem da variabilidade em modelos lineares generalizados, PhD thesis, Tese de D. Sc., IM-UFRJ, Rio de Janeiro, RJ, Brasil.spa
dc.relation.referencesCervantes, V. H., Cepeda, E. & Camargo, S. L. (2008), `Una propuesta para la obtención de niveles de desempeño en los modelos de teoría de respuesta al ítem', Avances en Medición 6(1), 45{54.spa
dc.relation.referencesChandra, H., Chambers, R. & Salvati, N. (2012), `Small area estimation of proportions in business surveys', Journal of Statistical Computation and Simulation 82(6), 783-795.spa
dc.relation.referencesChandra, H., Kumar, S. & Aditya, K. (2018), `Small area estimation of proportions with difierent levels of auxiliary data', Biometrical Journal 60(2), 395-415.spa
dc.relation.referencesde Andrade, D. F., Tavares, H. R. & da Cunha Valle, R. (2000), `Teoria da Resposta ao Item: Conceitos e Aplicacoes', ABE, Sao Paulo, Brasil .spa
dc.relation.referencesDempster, A. P., Laird, N. M. & Rubin, D. B. (1977), `Maximum likelihood from incomplete data via the EM algorithm', Journal of the Royal Statistical Society. Series B (methodological) 39(1), 1-38.spa
dc.relation.referencesDrew, D., Singh, M. & Choudhry, G. (1982), `Evaluation of small area estimation techniques for the Canadian labour force survey', Survey Methodology 8(1), 17-47.spa
dc.relation.referencesFaires, J. D. & Richard, L. (1998), `Burden. numerical methods. brooks'.spa
dc.relation.referencesFay, R. E. & Herriot, R. A. (1979), `Estimates of income for small places: An application of James-Stein procedures to census data', Journal of the American Statistical Association 74(366), 269-277.spa
dc.relation.referencesFernández, J. M. (1997), Introducción a la teoría de respuesta a los ítems.spa
dc.relation.referencesFox, J.-P. (2010), Bayesian Item Response Modeling: Theory and Applications, Springer Science & Business Media.spa
dc.relation.referencesGamerman, D. & Lopes, H. F. (2006), Markov chain Monte Carlo: stochastic simulation for Bayesian inference, CRC Press.spa
dc.relation.referencesGarbanzo, G. M. (2007), `Factores asociados al rendimiento académico en estudiantes universitarios, una reflexión desde la calidad de la educación superior pública', Revista Educación 31(1), 43-63.spa
dc.relation.referencesGelman, A. (2006), `Prior distributions for variance parameters in hierarchical models (comment on article by browne and draper)', Bayesian Analysis 1(3), 515-534.spa
dc.relation.referencesGhosh, M. & Rao, J. (1994), `Small area estimation: An appraisal', Statistical Science 9(1), 55-83.spa
dc.relation.referencesGoldstein, A. P., Heller, K. & Sechrest, L. B. (1966), `Psychotherapy and the psychology of behavior change. Wiley'.spa
dc.relation.referencesGónzalez, M. E. (1973), Use and evaluation of synthetic estimates, in `Proceedings of the Social Statistics Section', American Statistical Association, pp. 33-36.spa
dc.relation.referencesGutiérrez, H. A. (2016), Estrategias de Muestreo. Diseño de Encuestas y Estimación de Parámetros.spa
dc.relation.referencesHambleton, R. (1985), `Swaminathan.', Item response theory: Principles and applications.spa
dc.relation.referencesHambleton, R. K., Swaminathan, H. & Rogers, H. J. (1991), Fundamentals of item response theory, Sage.spa
dc.relation.referencesHartley, H. (1959), `Analytic studies of survey data', contribution to a volume in honor of Corrado Gini, University of Rome: Istituto di Statistica.(In preparation.).spa
dc.relation.referencesHarville, D. A. (1977), `Maximum likelihood approaches to variance component estimation and to related problems', Journal of the American Statistical Association 72(358), 320-338.spa
dc.relation.referencesHenderson, C. R. (1975), `Best linear unbiased estimation and prediction under a selection model', Biometrics pp. 423-447.spa
dc.relation.referencesICFES (2014a), Pruebas saber 3º, 5º y 9º. Lineamientos para la aplicación muestral y censal 2014, Technical report.spa
dc.relation.referencesICFES (2014b), Pruebas SABER 3, 5 y 9. Lineamientos para las aplicaciones muestral y censal 2014, ICFES.spa
dc.relation.referencesICFES (2015), Manual de califi cación. prueba cognitiva saber 3, 5, 7 y 9, Technical report, ICFES.spa
dc.relation.referencesICFES (2016), Estimación en áreas pequeñas del rendimiento cognitivo medio en el módulo de matemáticas de los estudiantes de quinto de primaria en las escuelas colombianas utilizando imputación múltiple, Technical report.spa
dc.relation.referencesInstituto Colombiano para la Evaluación de la Educación, I. (2017), `El armado de las pruebas saber y la comparabilidad en el tiempo', en Breve, Saber .spa
dc.relation.referencesIsaacson, E. & Keller, H. B. (1994), Analysis of Numerical Methods, Dover Publications.spa
dc.relation.referencesJiang, J. (2003), `Empirical best prediction for small-area inference based on generalized linear mixed models', Journal of Statistical Planning and Inference 111(1-2), 117-127.spa
dc.relation.referencesJiang, J. & Lahiri, P. (2001), `Empirical best prediction for small area inference with binary data', Annals of the Institute of Statistical Mathematics 53(2), 217-243.spa
dc.relation.referencesKackar, R. N. & Harville, D. A. (1984), `Approximations for standard errors of estimators of fixed and random efects in mixed linear models', Journal of the American Statistical Association 79(388), 853{862.spa
dc.relation.referencesKass, R. E. & Steffey, D. (1989), `Approximate Bayesian inference in conditionally independent hierarchical models (parametric empirical Bayes models)', Journal of the American Statistical Association 84(407), 717-726.spa
dc.relation.referencesKish, L. (1965), Survey samplin, Wiley.spa
dc.relation.referencesKish, L. (1992), `Weighting for unequal pi', Journal of Oficial Statistics 8(2), 2183-2200.spa
dc.relation.referencesKuh, G., Jankowski, N. & Ikenberry, S. (2014), Knowing what students know and can do: The current state of learning outcomes assessment in u.s. colleges and universities, Technical report, University of Illinois and Indiana University, National Institute for Learning Outcomes Assessment.spa
dc.relation.referencesLarsen, M. D. (2003), `Estimation of small-area proportions using covariates and survey data', Journal of Statistical Planning and Inference 112(1-2), 89-98.spa
dc.relation.referencesLazarsfeld, P. F. (1955), `Recent developments in latent structure analysis', Sociometry 18(4), 391-403.spa
dc.relation.referencesLiu, B., Lahiri, P. & Kalton, G. (2007), Hierarchical bayes modeling of surveyweighted small area proportions, in `Proceedings of the American Statistical Association, Survey Research Section', pp. 3181-3186.spa
dc.relation.referencesLópez-Vizcaíno, E., Lombardía, M. J. & Morales, D. (2013), `Multinomialbased small area estimation of labour force indicators', Statistical Modelling 13(2), 153-178.spa
dc.relation.referencesLord, F. M. (1980), Applications of item response theory to practical testing problems, Routledge.spa
dc.relation.referencesLord, F. M. (1986), `Maximum likelihood and Bayesian parameter estimation in item response theory', Journal of Educational Measurement 23(2), 157-162.spa
dc.relation.referencesLord, F. M. & Novick, M. R. (1968), Statistical theories of mental test scores, Information Age Publishing Inc.spa
dc.relation.referencesMartínez Arias, R. (1995), `Psicometría: Teoría de los tests psicológicos y educativos'.spa
dc.relation.referencesMartinez, M. R. (2006), `La metodología de los estudios PISA', Revista de Educación pp. 1,111-129.spa
dc.relation.referencesMetropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H. & Teller, E. (1953), `Equation of state calculations by fast computing machines', The journal of chemical physics 21(6), 1087-1092.spa
dc.relation.referencesMinisterio de Educación Nacional (2016), `Colombia: qué y cómo mejorar a partir de la prueba PISA. Al Tablero', url:https://www.mineducacion.gov.co/1621/article-162392.html.spa
dc.relation.referencesMislevy, R. (1991), `Randomization-based inference about latent variables from complex samples', Psychometrika 56(2), 177-196.spa
dc.relation.referencesMislevy, R., Beaton, A., Kaplan, B. & Sheehan, K. (1992), `Estimating population characteristics from sparse matrix samples of item responses', Journal of Educational Measurement 29(2), 133-161.spa
dc.relation.referencesMolina, I., Saei, A. & Lombardía, M. J. (2007), `Small area estimates of labour force participation under a multinomial logit mixed model', Journal of the Royal Statistical Society: Series A (Statistics in Society) 170(4), 975-1000.spa
dc.relation.referencesMorales, D. & Molina, I. (2015), Estimación en áreas pequeñas: Métodos Basados en Modelos.spa
dc.relation.referencesMullis, I. V., Martin, M. O., Kennedy, A., Trong, K. & Sainsbury, M. P. (2015), `Assessment frameworks', TIMMS and Pirls International Study Center, Boston College .spa
dc.relation.referencesNeyman, J. & Scott, E. L. (1948), `Consistent estimates based on partially consistent observations', Econometrica: Journal of the Econometric Society 16(1), 1-32.spa
dc.relation.referencesNicholls, A. (1977), A regression approach to small area estimation, Australian Bureau of Statistics, Development and Analysis Subsection.spa
dc.relation.referencesOECD (2014), `Pisa 2012 Technical Report', url:https://www.oecd.org/pisa/pisaproducts/PISA-2012-technical-report- nal.pdf.spa
dc.relation.referencesOECD (2016), `Pisa 2015 Resultados Claves', url:https://www.oecd.org/pisa/pisa- 2015-results-in-focus-ESP.pdf.spa
dc.relation.referencesPerozo, M. F. C. (2016), `Una aplicación de valores plausibles a la cali ficación de pruebas estandarizadas vía simulación.', Comunicaciones en Estadística 9(1), 55-78.spa
dc.relation.referencesPfeffermann, D. (2002), `Small area estimation-New developments and directions', International Statistical Review 70(1), 125-143.spa
dc.relation.referencesPrasad, N. N. & Rao, J. N. (1990), `The estimation of the mean squared error of small-area estimators', Journal of the American Statistical Association 85(409), 163-171.spa
dc.relation.referencesQuenouille, M. H. (1949), `Problems in plane sampling', The Annals of Mathematical Statistics pp. 355-375.spa
dc.relation.referencesR Core Team (2018), BayesSAE: Analisys of Small Area Estimation. R package version 1.0-2. URL: https://CRAN.R-project.org/package=foreignspa
dc.relation.referencesRao, J. N. (2003), `Small Area Estimation;Wiley, New York'.spa
dc.relation.referencesRao, J. N. & Molina, I. (2015), Small Area Estimation, 2 edn, John Wiley & Sons.spa
dc.relation.referencesRevuelta, J. & Ximénez, C. (2014), `Estimación bayesiana de un modelo psicométrico multinivel con efectos aleatorios', Revista de Psicología 23(1), 53-70.spa
dc.relation.referencesRubin, D. (1987), Multiple Imputation for Nonresponse in Surveys, John Wiley and Sons, Inc.spa
dc.relation.referencesRubin, D. B. (1976), `Inference and missing data', Biometrika 63(3), 581-592.spa
dc.relation.referencesRubin, D. B. & Schenker, N. (1991), `Multiple imputation in health-are databases: An overview and some applications', Statistics in Medicine 10(4), 585-598.spa
dc.relation.referencesSalinas-Rodríguez, A., Pérez-Núñez, R. & Ávila-Burgos, L. (2006), `Modelos de regresión para variables expresadas como una proporción continua', Salud Pública de México 48(5), 395-404.spa
dc.relation.referencesSalvati, N., Chandra, H. & Chambers, R. (2012), `Model-based direct estimation of small-area distributions', Australian & New Zealand Journal of Statistics 54(1), 103-123.spa
dc.relation.referencesSarndal, C.-E., Swensson, B. & Wretman, J. (2003), Model Assisted Survey Sampling, Springer.spa
dc.relation.referencesShao, J. & Tu, D. (2012), The jackknife and bootstrap, Springer Science & Business Media.spa
dc.relation.referencesSpiegelhalter, D., Thomas, A., Best, N., Gilks, W. & Lunn, D. (1994), `Bugs: Bayesian inference using gibbs sampling. mrc biostatistics unit, cambridge, england', URL: http://www. mrc-bsu. cam. ac. uk/bugs 21, 27.spa
dc.relation.referencesSulis, I. & Porcu, M. (2017), `Handling missing data in item response theory. assessing the accuracy of a multiple imputation procedure based on latent class analysis', Journal of Classi cation 34, 327-359.spa
dc.relation.referencesTreviño, E., Fraser, P., Meyer, A., Morawietz, L., Hinostrosa, P. & Naranjo, E. (2016), `Informe de Resultados del Tercer Estudio Regional Comparativo y Explicativo. Factores Asociados 2015'.spa
dc.relation.referencesTreviño, E., Valdés, H., Castro, M., Costilla, R., Pardo, C. & Donoso Rivas, F. (2010), Factores asociados al logro cognitivo de los estudiantes de América Latina y el Caribe, OREALC/UNESCO.spa
dc.relation.referencesTukey, J. (1958), `Bias and con dence in not quite-large samples', Annals of Mathematical Statistics 29(2), 614.spa
dc.relation.referencesUNESCO (2019), The promise of large-scale learning assessments: Acknowledging limits to unlock opportunities, Technical report, United Nations Educational, Scienti c and Cultural Organization.spa
dc.relation.referencesvon Davier, M., Gonzalez, E. & Mislevy, R. (2009), `What are plausible values and why are they useful?', IERI Monograph Series: Issues and Methodologies in Large-Scale Assessments 2(1), 9-36.spa
dc.relation.referencesWieczorek, J. & Hawala, S. (2011), A Bayesian zero-one in ated Beta model for estimating poverty in US counties, in `Proceedings of the American Statistical Association, Section on Survey Research Methods, Alexandria, VA: American Statistical Association', pp. 2812-2815.spa
dc.relation.referencesZhang, P. (2003), `Multiple imputation: Theory and method', International Statistical Review 71(3), 581-592.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacionalspa
dc.rights.spaAcceso abiertospa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/spa
dc.subject.ddc510 - Matemáticasspa
dc.subject.proposalSmall area estimationeng
dc.subject.proposalEstimación en áreas pequeñasspa
dc.subject.proposalTeoría de respuesta al ítemspa
dc.subject.proposalItem Response Theoryeng
dc.subject.proposalPISAeng
dc.subject.proposalPISAspa
dc.subject.proposalICFESspa
dc.subject.proposalIcfeseng
dc.subject.proposalSaber 3°, 5° y 9°.eng
dc.subject.proposalSaber 3°, 5° y 9°spa
dc.titleEstimación de áreas pequeñas utilizando imputación múltiple en modelos logísticos de tres parámetrosspa
dc.typeTrabajo de grado - Doctoradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_db06spa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/doctoralThesisspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1052955652.2020.pdf
Tamaño:
2.56 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.87 KB
Formato:
Item-specific license agreed upon to submission
Descripción: