Modelos de mezclas Bernoulli con regresión logística: una aplicación en la valoración de carteras de crédito
dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional |
dc.contributor.advisor | Giraldo Gómez, Norman Diego |
dc.contributor.author | Tabares Alzate, Esteban |
dc.date.accessioned | 2020-02-10T21:10:00Z |
dc.date.available | 2019 |
dc.date.available | 2020-02-10T21:10:00Z |
dc.date.issued | 2019 |
dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/75575 |
dc.description.abstract | Este trabajo final de maestría, modalidad de profundización, consiste en la elaboración de un problema de modelación estadística aplicada al sector crediticio. El objetivo es aplicar un modelo de regresión logística o un modelo de aprendizaje de máquina para calcular la probabilidad de default e incorporarla en la fórmula para hallar la distribución de costos totales en el modelo de Mezclas Bernoulli, con el fin de estimar valores de cuartiles superiores de la distribución de los costos totales, denominados la provisión. Para cumplir lo anterior se deben calcular las probabilidades de incumplimiento (o de default) después de realizar una competencia entre modelos vía mejor medida de ajuste (AUC), precisión y rango del intervalo de precisión (IC precisión); si bien el título solo menciona regresión logística, este modelo competirá con modelos de aprendizaje de máquina como arboles aleatorios, bosques aleatorios, Knn y máquinas de soporte vectorial y con el de mejor AUC, precisión y IC precisión se calcularán dichas probabilidades de default. Además, se calcula la distribución aproximada del monto total de las perdidas por incumplimiento para créditos originados entre 2014 y 2018. Tales costos totales se modelan mediante ciertos tipos de sumas de variables aleatorias que se denominan Mezclas Bernoulli para, finalmente evaluar el capital expuesto de una cartera de créditos y así entender el grado de deterioro de esta cartera para créditos originados entre 2014 y 2018. Palabras claves Riesgo de crédito, distribuciones de Mezclas Bernoulli, regresión logística, modelos de aprendizaje de máquina, distribución de perdidas, VaR y TVaR |
dc.description.abstract | This _nal master's work, deepening modality, consists in the elaboration of a statistical modeling problem applied to the credit sector. The objective is to apply a logistic regression model or a machine learning model to calculate the probability of default and incorporate it in the formula to _nd the distribution of total costs in the Bernoulli Blends model, in order to estimate values of higher quartiles of the distribution of total costs, called the provision. To accomplish the above, the probabilities of default must be calculated after competition between models via best _t measurement (AUC), precision and precision interval range (IC precision); although the title only mentions logistic regression, this model will compete with machine learning models such as random trees, random forests, Knn and vector support machines and with the best AUC, precision and IC precision these default probabilities will be calculated. In addition, the approximate distribution of the total amount of default losses is calculated for credits originated between 2014 and 2018. These total costs are modeled using certain types of random variable sums called Bernoulli Blends to _nally evaluate the exposed capital of a loan portfolio and thus understand the degree of impairment of this portfolio for loans originated between 2014 and 2018.. |
dc.format.extent | 62 |
dc.format.mimetype | application/pdf |
dc.language.iso | spa |
dc.rights | Derechos reservados - Universidad Nacional de Colombia |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.subject.ddc | Matemáticas::Probabilidades y matemáticas aplicadas |
dc.title | Modelos de mezclas Bernoulli con regresión logística: una aplicación en la valoración de carteras de crédito |
dc.type | Otro |
dc.rights.spa | Acceso abierto |
dc.description.additional | Maestría en Ciencias - Estadística |
dc.type.driver | info:eu-repo/semantics/other |
dc.type.version | info:eu-repo/semantics/acceptedVersion |
dc.description.degreelevel | Maestría |
dc.publisher.department | Escuela de estadística |
dc.publisher.branch | Universidad Nacional de Colombia - Sede Medellín |
dc.relation.references | Albrecher, H., Beirlant, J., y Teugels, J. L. (2017). Reinsurance: actuarial and statistical aspects. John Wiley & Sons |
dc.relation.references | Bakar, S. A., Hamzah, N., Maghsoudi, M., y Nadarajah, S. (2015). Modeling loss data using composite models. Insurance: Mathematics and Economics, 61, 146{154. |
dc.relation.references | Castaner, A., Claramunt, M., y Marmol, M. (2013). Tail value at risk. an analysis with the normal-power approximation. Statistical and Soft Computing Approaches in Insurance Problems; Nova Science Publishers: Hauppauge, NY, USA, 87{112 |
dc.relation.references | Demidenko, E. (2013). Mixed models: theory and applications with r. John Wiley & Sons |
dc.relation.references | Friedman, J., Hastie, T., y Tibshirani, R. (2001). The elements of statistical learning (Vol. 1) (n.o 10). Springer series in statistics New York. |
dc.relation.references | Giraldo, N. (2014). Gesti on cuantitativa de riesgo. aplicaciones con r. notas de clase (sin publicar). Escuela de Estad stica. Universidad Nacional de Colombia. Medellin |
dc.relation.references | Hastie, T., Tibshirani, R., y Friedman, J. (2009). The elements of statistical learning (2.a ed.). Springer-Verlag New York. doi: 10.1007/978-0-387 -84858-7 |
dc.relation.references | Kaas, R., Goovaerts, M., Dhaene, J., y Denuit, M. (2008). Modern actuarial risk theory: using r (Vol. 128). Springer Science & Business Media |
dc.relation.references | Lieberman, O. (1994). Saddlepoint approximation for the distribution of a ratio of quadratic forms in normal variables. Journal of the American Statistical Association, 89(427), 924{928 |
dc.relation.references | Maillard, D. (2018). A user's guide to the cornish sher expansion. Available at SSRN 1997178. |
dc.relation.references | McNeil, A. J., y Wendin, J. (2003). Generalized linear mixed models in portfolio credit risk modelling (Inf. T ec.). ETH Zurich. |
dc.relation.references | Peters, G., Targino, R., y Shevchenko, P. V. (2013). Understanding operational risk capital approximations: rst and second orders. Available at SSRN 2980465. |
dc.relation.references | Sandri, M., y Zuccolotto, P. (2008). A bias correction algorithm for the gini variable importance measure in classi cation trees. Journal of Computatio- nal and Graphical Statistics, 17(3), 611-628. Descargado de https://doi .org/10.1198/106186008X344522 doi: 10.1198/106186008X344522 |
dc.relation.references | Strobl, C., Boulesteix, A.-L., Zeileis, A., y Hothorn, T. (2007, 25 de Jan). Bias in random forest variable importance measures: Illustrations, sources and a solution. BMC Bioinformatics, 8(1), 25. Descargado de https:// doi.org/10.1186/1471-2105-8-25 doi: 10.1186/1471-2105-8-25 |
dc.relation.references | Sundt, B. (1999). An introduction to non-life insurance mathematics (Vol. 28). VVW GmbH. |
dc.relation.references | Zhou, Z.-H. (2012). Ensemble methods: foundations and algorithms. Chapman and Hall/CRC |
dc.rights.accessrights | info:eu-repo/semantics/openAccess |
dc.subject.proposal | Riesgo de crédito |
dc.subject.proposal | Credit risk |
dc.subject.proposal | distribuciones de Mezclas Bernoulli |
dc.subject.proposal | Bernoulli Blend distributions |
dc.subject.proposal | Regresión loguistica |
dc.subject.proposal | Logistic regression |
dc.subject.proposal | machine learning models |
dc.subject.proposal | modelos de aprendizaje de máquina |
dc.subject.proposal | Distribución de pérdidas |
dc.subject.proposal | Loss distribution |
dc.subject.proposal | VaR y TVaR |
dc.type.coar | http://purl.org/coar/resource_type/c_1843 |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa |
dc.type.content | Text |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 |
Files in this item
This item appears in the following Collection(s)
This work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit