Selección de variables en modelos de regresión logística usando regularización

dc.contributor.advisorVanegas Penagos, Luis Hernandospa
dc.contributor.authorAgudelo Rico, Harold Danielspa
dc.date.accessioned2025-09-12T16:09:55Z
dc.date.available2025-09-12T16:09:55Z
dc.date.issued2025
dc.descriptionilustraciones, diagramasspa
dc.description.abstractCon el propósito de desarrollar un mecanismo probabilístico que modele el comportamiento natural de un fenómeno dicotómico, garantizando estabilidad, generalización, interpretabilidad, precisión y la estimación de parámetros, mientras selecciona variables y evita problemas de multicolinealidad, se implementan modelos lineales generalizados regularizados con respuesta binomial y enlace logístico. Para validar estas características, en particular la capacidad de selección de variables, se propone comparar esta metodología en términos de AUC con las técnicas clásicas. Estas últimas incluyen el modelo lineal generalizado con respuesta binomial y enlace logit, utilizando métodos de ajuste como el AIC (Criterio de Información de Akaike) y estrategias de selección de variables como forward, backward y stepwise. (Texto tomado de la fuente).spa
dc.description.abstractTo develop a probabilistic mechanism capable of modeling the natural behavior of a dichotomous phenomenon while ensuring stability, generalization, interpretability, precision, and parameter estimation, as well as variable selection while avoiding multicollinearity issues, generalized linear models with regularization for a binomial response and logistic link are implemented. To validate these features, particularly the ability to select variables, this methodology is compared in terms of AUC with classical approaches. The latter include generalized linear models with binomial response and logistic link, using adjustment methods such as AIC (Akaike Information Criterion) and variable selection strategies like forward, backward, and stepwiseeng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias - Estadísticaspa
dc.description.researchareaModelo lineales generalizadosspa
dc.format.extentvi, 55 páginasspa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/88739
dc.language.isospa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.departmentDepartamento de Estad´ısticaspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeBogotá, Colombiaspa
dc.publisher.programBogotá - Ciencias - Maestría en Ciencias - Estadísticaspa
dc.relation.referencesA. Agresti. Categorical Data Analysis. Wiley Series in Probability and Statistics. Wiley- Interscience, 2 edition, 2002. ISBN 0471360937,9780471360933,9780471458760. URL http://gen.lib.rus.ec/book/index.php?md5=68B63FC9EA34F5691AD8434727373D5E
dc.relation.referencesZ. Y. Algamal and M. H. Lee. High dimensional logistic regression model using adjusted elastic net penalty. Pakistan Journal of Statistics and Operation Research, 11(4):667-676, 2015
dc.relation.referencesG. E. Box and G. M. Jenkins. Time series analysis: Forecasting and control. San Francisco, CA: Holden Day, 3226(3228):10, 1976
dc.relation.referencesJ. Friedman, T. Hastie, and R. Tibshirani. Regularization paths for generalized linear models via coordinate descent. Journal of statistical software, 33(1):1, 2010
dc.relation.referencesD. N. Gujarati and D. C. Porter. Basic econometrics. McGraw-hill, 2009
dc.relation.referencesT. Hastie, R. Tibshirani, and J. Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Series in Statistics. Springer, New York, 2nd edition, 2009. ISBN 978-0-387-84857-0
dc.relation.referencesH. He and E. A. Garcia. Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering, 21(9):1263-1284, 2009. doi: 10.1109/TKDE.2008.239
dc.relation.referencesD. W. Hosmer Jr, S. Lemeshow, and R. X. Sturdivant. Applied logistic regression. John Wiley & Sons, 2013
dc.relation.referencesG. James, D. Witten, T. Hastie, R. Tibshirani, et al. An introduction to statistical learning, volume 112. Springer, 2013
dc.relation.referencesP. McCullagh and J. A. Nelder. Generalized linear models. Chapman Hall/CRC Monographs on Statistics Applied Probability. Chapman and Hall/CRC, 2 edition, 1989. ISBN 9780412317606,0412317605. URL http://gen.lib.rus.ec/book/index.php?md5=F0CE6B1E52E967D164DF73DE4CFDC567
dc.relation.referencesJ. A. Nelder and R. W. Wedderburn. Generalized linear models. Journal of the Royal Statistical Society: Series A (General), 135(3):370-384, 1972
dc.relation.referencesB. Nguyen, C. Morell, and B. De Baets. Un método eficiente para resolver un problema de programación cuadrática derivado del aprendizaje de funciones de distancia. Investigación Operacional, 37(2):124-136, 2016
dc.relation.referencesR. Tibshirani. Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society Series B: Statistical Methodology, 58(1):267-288, 1996
dc.relation.referencesH. Zou and T. Hastie. Regularization and variable selection via the elastic net. Journal of the royal statistical society: series B (statistical methodology), 67(2):301-320, 2005
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.licenseAtribución-NoComercial 4.0 Internacional
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subject.ddc510 - Matemáticas::515 - Análisisspa
dc.subject.proposalÁrea bajo la curvaspa
dc.subject.proposalDimensionalidadspa
dc.subject.proposalModelos lineales generalizadosspa
dc.subject.proposalMulticolinealidadspa
dc.subject.proposalRegresión logísticaspa
dc.subject.proposalRegularizaciónspa
dc.subject.proposalSelección de variablesspa
dc.subject.proposalArea under the curveeng
dc.subject.proposalDimensionalityeng
dc.subject.proposalGeneralized linear modelseng
dc.subject.proposalMulticollinearityeng
dc.subject.proposalLogistic regressioneng
dc.subject.proposalRegularizationeng
dc.subject.proposalVariable selectioneng
dc.subject.unescoAnálisis de varianciaspa
dc.subject.unescoVariance analysiseng
dc.subject.wikidataregularizationeng
dc.subject.wikidatamodelo estadísticospa
dc.subject.wikidatastatistical modeleng
dc.subject.wikidataregularizaciónspa
dc.titleSelección de variables en modelos de regresión logística usando regularizaciónspa
dc.title.translatedVariable selection in logistic regression models using regularizationeng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dcterms.audience.professionaldevelopmentInvestigadoresspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1022401295.2025.pdf
Tamaño:
941.17 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: