Evaluación de la habilidad predictiva de la regresión de soporte vectorial en series de tiempo multivariadas

dc.contributor.advisorArrieta Prieto, Mario Enriquespa
dc.contributor.authorHurtado Moreno, Marlijarspa
dc.contributor.projectmemberCalderón, Sergiospa
dc.date.accessioned2025-04-07T14:55:44Z
dc.date.available2025-04-07T14:55:44Z
dc.date.issued2024-10
dc.descriptionilustraciones, diagramas, tablasspa
dc.description.abstractEl estudio sobre la aplicación de la regresión de soporte vectorial (SVR) en series de tiempo multivariadas ha sido escaso, a pesar de las ventajas que ofrece este algoritmo en el análisis de series de tiempo univariadas, ya que facilita un modelado y pronóstico preciso, especialmente en situaciones donde las series son no lineales o no cumplen con los supuestos de los modelos tradicionales. Debido a estas ventajas, se presenta el interés por investigar si, en un contexto multivariado, el rendimiento de este algoritmo es más preciso para la predicción en comparación con un modelo clásico. Para ello, se ha desarrollado una rutina que permite implementar la regresión de soporte vectorial multivariada (MSVR), basada en el artículo ”Multi-step-ahead time series prediction using multiple-output support vector regression” (Bao, 2014), con el fin de evaluar la eficacia de la predicción en series multivariadas. Este algoritmo se ha adaptado considerando la estructura de autocorrelación presente en las series de tiempo multivariadas. Además, se ha puesto un énfasis especial en la selección del núcleo y los hiperparámetros óptimos, utilizando técnicas de búsqueda aleatoria que exploran eficientemente el espacio de posibles combinaciones de hiperparámetros para lograr predicciones precisas y generalizables (Texto tomado de la fuente).spa
dc.description.abstractThe investigation of support vector regression (SVR) application in multivariate time series has been limited, even though this algorithm provides significant advantages when applied to univariate time series. It enables accurate modeling and forecasting, especially in scenarios where the time series are nonlinear or fail to satisfy the assumptions of traditional models. Given these advantages, there is a growing interest in exploring whether the performance of this algorithm in a multivariate setting yields more accurate predictions than a classical model. To address this, a routine has been developed to implement multivariate support vector regression (MSVR) based on the article ”Multi-step-ahead time series prediction using multiple-output support vector regression”(Bao, 2014) to assess prediction efficiency in multivariate series. This algorithm has been modified to take into account the autocorrelation structure inherent in multivariate time series. Furthermore, careful consideration has been given to selecting the kernel and optimal hyperparameters, employing random search techniques that effectively navigate the space of potential hyperparameter combinations, which enables us to achieve accurate and generalizable predictions.eng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagister en Ciencias Estadísticaspa
dc.description.methodsComo se menciono anteriormente, la revisión de la literatura muestra que el trabajo de Bao et al. es la referencia más sólida para el desarrollo de un algoritmo iterativo de Regresion de Soporte Vectorial Multivariada (MSVR) en la actualidad. Este estudio no solo proporciona un marco teórico relevante, sino que también ofrece una implementación practica en Python, la cual sera nuestro punto de partida para modificar la rutina y adaptarla al uso en series de tiempo multivariadas. Esta aplicación está disponible en GitHub en el siguiente enlace: https://github.com/Analytics-for-Forecasting/msvr. Para adaptar el modelo de un enfoque MIMO a uno de series de tiempo multivariada, fue necesario comprender y modificar varias partes del proceso original. En la propuesta de Bao et al., se desarrollan diversas funciones cruciales para la implementación del modelo. En particular, se presta atencion al modelo iterativo de MSVR, el cual se mantuvo en su forma original, permitiendonos enfocarnos en comprender su funcionamiento. Esta comprensión es esencial para aplicar correctamente el modelo a nuestro contexto específico, asegurando que cada componente se adapte adecuadamente a las necesidades del análisis de series temporales multivariadas. El segundo componente clave es la función create dataset, que convierte una serie temporal en un conjunto de datos adecuado para la rutina de MSVR, facilitando el ajuste efectivo del modelo de prediccion. Esta funcion recibe tres parametros: la serie temporal (ts), la dimensión de la ventana (dim) y el horizonte de predicción (h). Utilizando esta información, crea una ventana móvil que organiza los datos sin perder su orden temporal. Posteriormente, divide los datos en entradas y salidas, lo que simplifica la preparación necesaria para el entrenamiento del modelo. Este proceso es crucial para asegurar que el modelo aprenda de manera efectiva y realice predicciones precisas.spa
dc.description.researchareaSeries de tiempo multivariadasspa
dc.format.extentix, 81 páginasspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameUniversidad Nacional de Colombiaspa
dc.identifier.reponameRepositorio Institucional Universidad Nacional de Colombiaspa
dc.identifier.repourlhttps://repositorio.unal.edu.co/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/87857
dc.language.isospaspa
dc.publisherUniversidad Nacional de Colombiaspa
dc.publisher.branchUniversidad Nacional de Colombia - Sede Bogotáspa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.placeBogotá, Colombiaspa
dc.publisher.programBogotá - Ciencias - Maestría en Ciencias - Estadísticaspa
dc.relation.referencesA Ilemobayo, J., Durodola, O., Alade, O., J Awotunde, O., T Olanrewaju, A., Falana, O., Ogungbire, A., Osinuga, A., Ogunbiyi, D., Ifeanyi, A. et al. (2024). Hyperparameter tuning in machine learning: A comprehensive review, Journal of Engineering Research and Reports 26(6): 388–395.spa
dc.relation.referencesAnonymous (2011). How to simulate cointegrated prices, https://quant. stackexchange.com/questions/3930/how-to-simulate-cointegrated-prices. Accessed: 2024-10-13.spa
dc.relation.referencesBao, Y., Xiong, T. & Hu, Z. (2014). Multi-step-ahead time series prediction using multipleoutput support vector regression, Neurocomputing 129: 482–493spa
dc.relation.referencesBoser, B. E., Guyon, I. M. & Vapnik, V. N. (1992). A training algorithm for optimal margin classifiers, Proceedings of the fifth annual workshop on Computational learning theory, pp. 144–152.spa
dc.relation.referencesBox, G. E. P., Jenkins, G. M. & Reinsel, G. C. (2015). Time Series Analysis: Forecasting and Control, Wileyspa
dc.relation.referencesBoyd, S. (2004). Convex optimization–boyd and vandenberghespa
dc.relation.referencesBrochu, E., Cora, V. & de Freitas, N. (2010). Bayesian optimization: A review, arXiv preprint arXiv:1012.2599 .spa
dc.relation.referencesCortes, C. & Vapnik, V. (1995). Support-vector networks, Machine learning 20: 273–297spa
dc.relation.referencesGanaie, B. N., Jabeen, A. S. & Khan, M. S. (2020). Hyperparameter tuning in machine learning: A comprehensive review, International Journal of Machine Learning and Computing 10(3): 359–366spa
dc.relation.referencesHastie, T., Tibshirani, R., Friedman, J. H. & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction, Vol. 2, Springer.spa
dc.relation.referencesHenrique, B. M., Sobreiro, V. A. & Kimura, H. (2018). Stock price prediction using support vector regression on daily and up to the minute prices, The Journal of finance and data science 4(3): 183–201spa
dc.relation.referencesHertzmann, A., Fleet, D. & Brubaker, M. (2012). Machine learning and data mining lecture notes, University of Toronto Version 134.spa
dc.relation.referencesHutter, F., Hoos, H. & Leyton-Brown, K. (2014). An efficient approach for assessing hyperparameter importance, International conference on machine learning, PMLR, pp. 754–762.spa
dc.relation.referencesHyndman, R. J. & Athanasopoulos, G. (2018). Forecasting: Principles and Practice, OTextsspa
dc.relation.referencesJaikla, R., Auephanwiriyakul, S. & Jintrawet, A. (2008). Rice yield prediction using a support vector regression method, 2008 5th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, Vol. 1, IEEE, pp. 29–32.spa
dc.relation.referenceslearn Developers, S. (2023). Pipeline: sklearn.pipeline.pipeline. Accedido: 2023-10-13. URL: https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.htmlspa
dc.relation.referencesL¨utkepohl, H. (2005). New Introduction to Multiple Time Series Analysis, Springer Series in Statistics, Springer.spa
dc.relation.referencesMukherjee, S., Osuna, E. & Girosi, F. (1997). Nonlinear prediction of chaotic time series using support vector machines, Neural Networks for Signal Processing VII. Proceedings of the 1997 IEEE Signal Processing Society Workshop, IEEE, pp. 511–520.spa
dc.relation.referencesMüller, K.-R., Smola, A. J., R¨atsch, G., Sch¨olkopf, B., Kohlmorgen, J. & Vapnik, V. (1997). Predicting time series with support vector machines, International conference on artificial neural networks, Springer, pp. 999–1004spa
dc.relation.referencesNguyen, T. L. H. T. D. & Dang, K. F. P. K. T. P. (2022). An efficient approach for assessing hyperparameter importance, Journal of Computer Science and Technology 37(1): 1–19.spa
dc.relation.referencesPerez-Cruz, F., Camps-Valls, G., Soria-Olivas, E., P´erez-Ruixo, J. J., Figueiras-Vidal, A. R. & Art´es-Rodr´ıguez, A. (2002). Multi-dimensional function approximation and regression estimation, Artificial Neural Networks—ICANN 2002: International Conference Madrid, Spain, August 28–30, 2002 Proceedings 12, Springer, pp. 757–762.spa
dc.relation.referencesRosenblatt, F. et al. (1962). Principles of neurodynamics: Perceptrons and the theory of brain mechanisms, Vol. 55, Spartan books Washington, DCspa
dc.relation.referencesscikit-learn developers, T. (2024). Randomizedsearchcv, https://scikit-learn.org/ stable/modules/generated/sklearn.model_selection.RandomizedSearchCV. html. Accedido el 13 de octubre de 2024.spa
dc.relation.referencesSmola, A. J. & Sch¨olkopf, B. (2004). A tutorial on support vector regression, Statistics and computing 14: 199–222spa
dc.relation.referencesSteinwart, I., Hush, D. & Scovel, C. (2009). Learning from dependent observations, Journal of Multivariate Analysis 100(1): 175–194.spa
dc.relation.referencesSu´arez, E. J. C. (2014). Tutorial sobre m´aquinas de vectores soporte (svm), Tutorial sobre M´aquinas de Vectores Soporte (SVM) pp. 1–12.spa
dc.relation.referencesSugaya, N. (2014). Ligand efficiency-based support vector regression models for predicting bioactivities of ligands to drug target proteins, Journal of chemical information and modeling 54(10): 2751–2763.spa
dc.relation.referencesTay, F. E. & Cao, L. (2001). Application of support vector machines in financial time series forecasting, omega 29(4): 309–317spa
dc.relation.referencesVapnik, V. (2000). Statistics for engineering and information science, The Nature of Statistical Learning Theory .spa
dc.relation.referencesVelásquez, J. D., Olaya, Y. & Franco, C. J. (2010). Predicción de series temporales usando máquinas de vectores de soporte, Ingeniare. Revista chilena de ingeniería 18(1): 64– 75.spa
dc.relation.referencesVillanueva, S. A. C. (2022). Notas de clase: Series de tiempo multivariadas, Clase magistralspa
dc.relation.referencesZhang, J., Sato, T. & Iai, S. (2007). Novel support vector regression for structural system identification, Structural Control and Health Monitoring: The Official Journal of the International Association for Structural Control and Monitoring and of the European Association for the Control of Structures 14(4): 609–626spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/spa
dc.subject.ddc510 - Matemáticas::519 - Probabilidades y matemáticas aplicadasspa
dc.subject.ddc519.55spa
dc.subject.lembANALISIS DE SERIES DE TIEMPO-MODELOS MATEMATICOSspa
dc.subject.lembTime-series analysis - mathematical modelseng
dc.subject.lembSERIES (MATEMATICAS)spa
dc.subject.lembSerieseng
dc.subject.lembSUCESIONES (MATEMATICAS)spa
dc.subject.lembSequences (mathematics)eng
dc.subject.lembANALISIS MULTIVARIANTEspa
dc.subject.lembMultivariate analysiseng
dc.subject.lembMATRICES (MATEMATICAS)-ENSENANZA PROGRAMADAspa
dc.subject.lembMatrices - programmed instructioneng
dc.subject.proposalRegresión de soporte vectorialspa
dc.subject.proposalSeries de tiempo multivariadasspa
dc.subject.proposalPredicciónspa
dc.subject.proposalSupport vector regressioneng
dc.subject.proposalSVReng
dc.subject.proposalMSVReng
dc.subject.proposalMultivariate time serieseng
dc.subject.proposalPredictioneng
dc.titleEvaluación de la habilidad predictiva de la regresión de soporte vectorial en series de tiempo multivariadasspa
dc.title.translatedEvaluation of the predictive ability of support vector regression in multivariate time serieseng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
dcterms.audience.professionaldevelopmentBibliotecariosspa
dcterms.audience.professionaldevelopmentEstudiantesspa
dcterms.audience.professionaldevelopmentInvestigadoresspa
dcterms.audience.professionaldevelopmentMaestrosspa
dcterms.audience.professionaldevelopmentPersonal de apoyo escolarspa
dcterms.audience.professionaldevelopmentPúblico generalspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1014254096.2025.pdf
Tamaño:
1.56 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría en Ciencias - Estadística

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
5.74 KB
Formato:
Item-specific license agreed upon to submission
Descripción: