Identificabilidad de modelos matemáticos en procesos biotecnológicos
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2021Resumen
La biotecnología puede ser una opción viable para mitigar o resolver problemáticas generadas por la acción antrópica, mediante la generación de alternativas más eficientes y ambientalmente amigables a los procesos industriales convencionales. Desde la perspectiva de ingeniería de sistemas de proceso, los sistemas biológicos pueden describirse como modelos matemáticos útiles para el diseño, control y optimización de procesos biotecnológicos. Debido a esto, se genera la necesidad de obtener modelos matemáticos con capacidad descriptiva y predictiva. Sin embargo, los modelos de bioprocesos presentan un reto desde el punto matemático por diferentes circunstancias como su naturaleza no lineal, incertidumbre en mediciones experimentales, sobreparametrización, múltiples mínimos locales (problema no convexo), carencia de identificabilidad estructural, entre otros. En esta investigación se propone una metodología extendida para la estimación de parámetros y validación de modelos matemáticos de procesos biotecnológicos, que apunta a la generación de modelos matemáticos robustos, con interpretabilidad en sus parámetros y con capacidad tanto descriptiva como predictiva, útiles para el diseño, control y optimización de bioprocesos. Se tomó como caso de estudio un modelo matemático de bioproducción de xilitol, que considera características inherentes a los sistemas biológicos como inhibición y transporte de metabolitos. Como punto de partida se analizaron los datos experimentales a través de métodos de detección y limpieza de puntos atípicos junto con un método de suavizado por ajuste polinomial para eliminación de ruido aleatorio. Subsecuentemente, se analizaron las propiedades de identificabilidad estructural del caso de estudio y la influencia de las condiciones experimentales. Posteriormente, se analizó la reproducibilidad y precisión en la solución del problema de optimización no convexo para estimación de parámetros, a través de algoritmos de optimización global estocásticos (metaheurísticas) y la influencia de su sintonización. Finalmente, se estudió la influencia de los diferentes elementos del problema de optimización en el valor de los parámetros del modelo matemático analizado. Así mismo, la calidad de la predicción del modelo de caso de estudio se examinó con intervalos de confianza, indicadores de ajuste e índices de sensibilidad. Específicamente, se determinó que el optimizador enjambre de partículas sintonizado pudo encontrar satisfactoriamente el mínimo global de la función objetivo y el pretratamiento de datos experimentales reduce la incertidumbre en el valor de los parámetros. Además, se demostró que aunque un conjunto de datos presente identificabilidad estructural no necesariamente también brindará identificabilidad práctica. En cuanto a la validación del modelo, se encontró alta interacción entre parámetros debido a carencia de datos experimentales con concentraciones iniciales de glucosa y xilosa, se analizó la sensibilidad de indicadores de ajuste, se determinó la incertidumbre en la respuesta del modelo y se calculó la sensibilidad del modelo a incertidumbre en los parámetros, siendo mejor el método de coeficientes de regresión estandarizados (SRC) sobre los índices de Sobol (Texto tomado de la fuente)Abstract
Biotechnology could be a viable option to mitigate or solve problems generated by anthropic action, through the generation of more efficient and ecologically friendly alternatives to conventional industrial processes. From Process Systems Engineering perspective, biological systems can be described as mathematical models useful for the design, control, and optimization of biotechnological processes. Due to this, the need to have mathematical models with descriptive and predictive capabilities is generated. However, mathematical models of bioprocesses present a challenge from a mathematical point of view due to different circumstances like their non-linear nature, uncertainty in experimental measurements, overfitting, multiple local minima (non-convex problem), lack of structural identifiability, among others. In this investigation an extended methodology for parameter estimation and model validation of mathematical models of biotechnological processes is proposed, that aims to the generation of robust mathematical models, with interpretability in their parameters and both descriptive and predictive capabilities, useful for design, control, and optimization of bioprocesses. As a case of study, a mathematical model of xylitol bioproduction was used, which presents inherent characteristics of biological systems as enzymatic inhibition and metabolite transport. As starting point, the experimental data were analyzed through outlier detection and cleansing methods coupled with a polynomial adjustment smoothing method for random noise reduction. Subsequently, the case of study’s structural identifiability properties and influence of experimental conditions were analyzed. Later, the reproducibility and accuracy of the non-convex optimization problem for parameter estimation were investigated with stochastic global optimization algorithms (metaheuristics) and the influence of the optimizer’s tuning was evaluated. Finally, the influence of the different elements that are part of the optimization problem over the xylitol bioproduction model’s estimated parameter values was investigated. Moreover, the quality of the model prediction was evaluated with confidence intervals, adjustment indexes, and sensibility indexes. Specifically, the results show that tuned Particle Swarm Optimization algorithm consistently found the global minima and data cleansing and smoothing procedures can reduce uncertainty in estimated parameter values. Also, it was demonstrated that even if a dataset gives structural identifiability to the model, it is not guaranteed that the same dataset would give practical identifiability. As to the model validation, high interaction among the model parameters was found due to the lack of experimental datasets with both glucose and xylose initial concentrations, adjustment indexes’ sensibility was analyzed, the uncertainty in model response was evaluated, and the model’s sensibility to parameter uncertainty was calculated with Standardized Regression Coefficients (SRC) method and Sobol’s Indexes, with better results of SRC method.Palabras clave
Descripción Física/Lógica/Digital
imágenes, ilustraciones, tablas, texto
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito