Evaluación de la habilidad predictiva de la regresión de soporte vectorial en series de tiempo multivariadas
dc.contributor.advisor | Arrieta Prieto, Mario Enrique | spa |
dc.contributor.author | Hurtado Moreno, Marlijar | spa |
dc.contributor.projectmember | Calderón, Sergio | spa |
dc.date.accessioned | 2025-04-07T14:55:44Z | |
dc.date.available | 2025-04-07T14:55:44Z | |
dc.date.issued | 2024-10 | |
dc.description | ilustraciones, diagramas, tablas | spa |
dc.description.abstract | El estudio sobre la aplicación de la regresión de soporte vectorial (SVR) en series de tiempo multivariadas ha sido escaso, a pesar de las ventajas que ofrece este algoritmo en el análisis de series de tiempo univariadas, ya que facilita un modelado y pronóstico preciso, especialmente en situaciones donde las series son no lineales o no cumplen con los supuestos de los modelos tradicionales. Debido a estas ventajas, se presenta el interés por investigar si, en un contexto multivariado, el rendimiento de este algoritmo es más preciso para la predicción en comparación con un modelo clásico. Para ello, se ha desarrollado una rutina que permite implementar la regresión de soporte vectorial multivariada (MSVR), basada en el artículo ”Multi-step-ahead time series prediction using multiple-output support vector regression” (Bao, 2014), con el fin de evaluar la eficacia de la predicción en series multivariadas. Este algoritmo se ha adaptado considerando la estructura de autocorrelación presente en las series de tiempo multivariadas. Además, se ha puesto un énfasis especial en la selección del núcleo y los hiperparámetros óptimos, utilizando técnicas de búsqueda aleatoria que exploran eficientemente el espacio de posibles combinaciones de hiperparámetros para lograr predicciones precisas y generalizables (Texto tomado de la fuente). | spa |
dc.description.abstract | The investigation of support vector regression (SVR) application in multivariate time series has been limited, even though this algorithm provides significant advantages when applied to univariate time series. It enables accurate modeling and forecasting, especially in scenarios where the time series are nonlinear or fail to satisfy the assumptions of traditional models. Given these advantages, there is a growing interest in exploring whether the performance of this algorithm in a multivariate setting yields more accurate predictions than a classical model. To address this, a routine has been developed to implement multivariate support vector regression (MSVR) based on the article ”Multi-step-ahead time series prediction using multiple-output support vector regression”(Bao, 2014) to assess prediction efficiency in multivariate series. This algorithm has been modified to take into account the autocorrelation structure inherent in multivariate time series. Furthermore, careful consideration has been given to selecting the kernel and optimal hyperparameters, employing random search techniques that effectively navigate the space of potential hyperparameter combinations, which enables us to achieve accurate and generalizable predictions. | eng |
dc.description.degreelevel | Maestría | spa |
dc.description.degreename | Magister en Ciencias Estadística | spa |
dc.description.methods | Como se menciono anteriormente, la revisión de la literatura muestra que el trabajo de Bao et al. es la referencia más sólida para el desarrollo de un algoritmo iterativo de Regresion de Soporte Vectorial Multivariada (MSVR) en la actualidad. Este estudio no solo proporciona un marco teórico relevante, sino que también ofrece una implementación practica en Python, la cual sera nuestro punto de partida para modificar la rutina y adaptarla al uso en series de tiempo multivariadas. Esta aplicación está disponible en GitHub en el siguiente enlace: https://github.com/Analytics-for-Forecasting/msvr. Para adaptar el modelo de un enfoque MIMO a uno de series de tiempo multivariada, fue necesario comprender y modificar varias partes del proceso original. En la propuesta de Bao et al., se desarrollan diversas funciones cruciales para la implementación del modelo. En particular, se presta atencion al modelo iterativo de MSVR, el cual se mantuvo en su forma original, permitiendonos enfocarnos en comprender su funcionamiento. Esta comprensión es esencial para aplicar correctamente el modelo a nuestro contexto específico, asegurando que cada componente se adapte adecuadamente a las necesidades del análisis de series temporales multivariadas. El segundo componente clave es la función create dataset, que convierte una serie temporal en un conjunto de datos adecuado para la rutina de MSVR, facilitando el ajuste efectivo del modelo de prediccion. Esta funcion recibe tres parametros: la serie temporal (ts), la dimensión de la ventana (dim) y el horizonte de predicción (h). Utilizando esta información, crea una ventana móvil que organiza los datos sin perder su orden temporal. Posteriormente, divide los datos en entradas y salidas, lo que simplifica la preparación necesaria para el entrenamiento del modelo. Este proceso es crucial para asegurar que el modelo aprenda de manera efectiva y realice predicciones precisas. | spa |
dc.description.researcharea | Series de tiempo multivariadas | spa |
dc.format.extent | ix, 81 páginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.instname | Universidad Nacional de Colombia | spa |
dc.identifier.reponame | Repositorio Institucional Universidad Nacional de Colombia | spa |
dc.identifier.repourl | https://repositorio.unal.edu.co/ | spa |
dc.identifier.uri | https://repositorio.unal.edu.co/handle/unal/87857 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad Nacional de Colombia | spa |
dc.publisher.branch | Universidad Nacional de Colombia - Sede Bogotá | spa |
dc.publisher.faculty | Facultad de Ciencias | spa |
dc.publisher.place | Bogotá, Colombia | spa |
dc.publisher.program | Bogotá - Ciencias - Maestría en Ciencias - Estadística | spa |
dc.relation.references | A Ilemobayo, J., Durodola, O., Alade, O., J Awotunde, O., T Olanrewaju, A., Falana, O., Ogungbire, A., Osinuga, A., Ogunbiyi, D., Ifeanyi, A. et al. (2024). Hyperparameter tuning in machine learning: A comprehensive review, Journal of Engineering Research and Reports 26(6): 388–395. | spa |
dc.relation.references | Anonymous (2011). How to simulate cointegrated prices, https://quant. stackexchange.com/questions/3930/how-to-simulate-cointegrated-prices. Accessed: 2024-10-13. | spa |
dc.relation.references | Bao, Y., Xiong, T. & Hu, Z. (2014). Multi-step-ahead time series prediction using multipleoutput support vector regression, Neurocomputing 129: 482–493 | spa |
dc.relation.references | Boser, B. E., Guyon, I. M. & Vapnik, V. N. (1992). A training algorithm for optimal margin classifiers, Proceedings of the fifth annual workshop on Computational learning theory, pp. 144–152. | spa |
dc.relation.references | Box, G. E. P., Jenkins, G. M. & Reinsel, G. C. (2015). Time Series Analysis: Forecasting and Control, Wiley | spa |
dc.relation.references | Boyd, S. (2004). Convex optimization–boyd and vandenberghe | spa |
dc.relation.references | Brochu, E., Cora, V. & de Freitas, N. (2010). Bayesian optimization: A review, arXiv preprint arXiv:1012.2599 . | spa |
dc.relation.references | Cortes, C. & Vapnik, V. (1995). Support-vector networks, Machine learning 20: 273–297 | spa |
dc.relation.references | Ganaie, B. N., Jabeen, A. S. & Khan, M. S. (2020). Hyperparameter tuning in machine learning: A comprehensive review, International Journal of Machine Learning and Computing 10(3): 359–366 | spa |
dc.relation.references | Hastie, T., Tibshirani, R., Friedman, J. H. & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction, Vol. 2, Springer. | spa |
dc.relation.references | Henrique, B. M., Sobreiro, V. A. & Kimura, H. (2018). Stock price prediction using support vector regression on daily and up to the minute prices, The Journal of finance and data science 4(3): 183–201 | spa |
dc.relation.references | Hertzmann, A., Fleet, D. & Brubaker, M. (2012). Machine learning and data mining lecture notes, University of Toronto Version 134. | spa |
dc.relation.references | Hutter, F., Hoos, H. & Leyton-Brown, K. (2014). An efficient approach for assessing hyperparameter importance, International conference on machine learning, PMLR, pp. 754–762. | spa |
dc.relation.references | Hyndman, R. J. & Athanasopoulos, G. (2018). Forecasting: Principles and Practice, OTexts | spa |
dc.relation.references | Jaikla, R., Auephanwiriyakul, S. & Jintrawet, A. (2008). Rice yield prediction using a support vector regression method, 2008 5th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology, Vol. 1, IEEE, pp. 29–32. | spa |
dc.relation.references | learn Developers, S. (2023). Pipeline: sklearn.pipeline.pipeline. Accedido: 2023-10-13. URL: https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html | spa |
dc.relation.references | L¨utkepohl, H. (2005). New Introduction to Multiple Time Series Analysis, Springer Series in Statistics, Springer. | spa |
dc.relation.references | Mukherjee, S., Osuna, E. & Girosi, F. (1997). Nonlinear prediction of chaotic time series using support vector machines, Neural Networks for Signal Processing VII. Proceedings of the 1997 IEEE Signal Processing Society Workshop, IEEE, pp. 511–520. | spa |
dc.relation.references | Müller, K.-R., Smola, A. J., R¨atsch, G., Sch¨olkopf, B., Kohlmorgen, J. & Vapnik, V. (1997). Predicting time series with support vector machines, International conference on artificial neural networks, Springer, pp. 999–1004 | spa |
dc.relation.references | Nguyen, T. L. H. T. D. & Dang, K. F. P. K. T. P. (2022). An efficient approach for assessing hyperparameter importance, Journal of Computer Science and Technology 37(1): 1–19. | spa |
dc.relation.references | Perez-Cruz, F., Camps-Valls, G., Soria-Olivas, E., P´erez-Ruixo, J. J., Figueiras-Vidal, A. R. & Art´es-Rodr´ıguez, A. (2002). Multi-dimensional function approximation and regression estimation, Artificial Neural Networks—ICANN 2002: International Conference Madrid, Spain, August 28–30, 2002 Proceedings 12, Springer, pp. 757–762. | spa |
dc.relation.references | Rosenblatt, F. et al. (1962). Principles of neurodynamics: Perceptrons and the theory of brain mechanisms, Vol. 55, Spartan books Washington, DC | spa |
dc.relation.references | scikit-learn developers, T. (2024). Randomizedsearchcv, https://scikit-learn.org/ stable/modules/generated/sklearn.model_selection.RandomizedSearchCV. html. Accedido el 13 de octubre de 2024. | spa |
dc.relation.references | Smola, A. J. & Sch¨olkopf, B. (2004). A tutorial on support vector regression, Statistics and computing 14: 199–222 | spa |
dc.relation.references | Steinwart, I., Hush, D. & Scovel, C. (2009). Learning from dependent observations, Journal of Multivariate Analysis 100(1): 175–194. | spa |
dc.relation.references | Su´arez, E. J. C. (2014). Tutorial sobre m´aquinas de vectores soporte (svm), Tutorial sobre M´aquinas de Vectores Soporte (SVM) pp. 1–12. | spa |
dc.relation.references | Sugaya, N. (2014). Ligand efficiency-based support vector regression models for predicting bioactivities of ligands to drug target proteins, Journal of chemical information and modeling 54(10): 2751–2763. | spa |
dc.relation.references | Tay, F. E. & Cao, L. (2001). Application of support vector machines in financial time series forecasting, omega 29(4): 309–317 | spa |
dc.relation.references | Vapnik, V. (2000). Statistics for engineering and information science, The Nature of Statistical Learning Theory . | spa |
dc.relation.references | Velásquez, J. D., Olaya, Y. & Franco, C. J. (2010). Predicción de series temporales usando máquinas de vectores de soporte, Ingeniare. Revista chilena de ingeniería 18(1): 64– 75. | spa |
dc.relation.references | Villanueva, S. A. C. (2022). Notas de clase: Series de tiempo multivariadas, Clase magistral | spa |
dc.relation.references | Zhang, J., Sato, T. & Iai, S. (2007). Novel support vector regression for structural system identification, Structural Control and Health Monitoring: The Official Journal of the International Association for Structural Control and Monitoring and of the European Association for the Control of Structures 14(4): 609–626 | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | spa |
dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | spa |
dc.subject.ddc | 510 - Matemáticas::519 - Probabilidades y matemáticas aplicadas | spa |
dc.subject.ddc | 519.55 | spa |
dc.subject.lemb | ANALISIS DE SERIES DE TIEMPO-MODELOS MATEMATICOS | spa |
dc.subject.lemb | Time-series analysis - mathematical models | eng |
dc.subject.lemb | SERIES (MATEMATICAS) | spa |
dc.subject.lemb | Series | eng |
dc.subject.lemb | SUCESIONES (MATEMATICAS) | spa |
dc.subject.lemb | Sequences (mathematics) | eng |
dc.subject.lemb | ANALISIS MULTIVARIANTE | spa |
dc.subject.lemb | Multivariate analysis | eng |
dc.subject.lemb | MATRICES (MATEMATICAS)-ENSENANZA PROGRAMADA | spa |
dc.subject.lemb | Matrices - programmed instruction | eng |
dc.subject.proposal | Regresión de soporte vectorial | spa |
dc.subject.proposal | Series de tiempo multivariadas | spa |
dc.subject.proposal | Predicción | spa |
dc.subject.proposal | Support vector regression | eng |
dc.subject.proposal | SVR | eng |
dc.subject.proposal | MSVR | eng |
dc.subject.proposal | Multivariate time series | eng |
dc.subject.proposal | Prediction | eng |
dc.title | Evaluación de la habilidad predictiva de la regresión de soporte vectorial en series de tiempo multivariadas | spa |
dc.title.translated | Evaluation of the predictive ability of support vector regression in multivariate time series | eng |
dc.type | Trabajo de grado - Maestría | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | spa |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | spa |
dc.type.content | Text | spa |
dc.type.driver | info:eu-repo/semantics/masterThesis | spa |
dc.type.redcol | http://purl.org/redcol/resource_type/TM | spa |
dc.type.version | info:eu-repo/semantics/acceptedVersion | spa |
dcterms.audience.professionaldevelopment | Bibliotecarios | spa |
dcterms.audience.professionaldevelopment | Estudiantes | spa |
dcterms.audience.professionaldevelopment | Investigadores | spa |
dcterms.audience.professionaldevelopment | Maestros | spa |
dcterms.audience.professionaldevelopment | Personal de apoyo escolar | spa |
dcterms.audience.professionaldevelopment | Público general | spa |
oaire.accessrights | http://purl.org/coar/access_right/c_abf2 | spa |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- 1014254096.2025.pdf
- Tamaño:
- 1.56 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Tesis de Maestría en Ciencias - Estadística
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 5.74 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: