Implementation of flexible lifetime distributions in regression models to estimate survival times
Author
Advisor
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2023Metadata
Show full item recordAbstract
In the fields of reliability engineering and survival analysis, it is common to find experiments from which data characterized by non-monotonic hazard functions—such as bathtub-shaped or unimodal functions—can be obtained. To model datasets like those mentioned, flexible lifetime distributions are frequently proposed. However, many of these distributions are not yet implemented in statistical software for fitting regression models. In this context, we have developed the EstimationTools R package, which offers a general-purpose framework for fitting and evaluating distributional regression models. This framework employs a syntax that mirrors mathematical notation. We leveraged maximum likelihood estimation and computed the log-likelihood function just using the probability mass/density function implemented in the R global workspace. Our framework is particularly suited for datasets where the response variable follows a flexible lifetime distribution, thereby enabling users to estimate distribution parameters in relation to covariates, even with censored data. It also provides graphical diagnostic tools through Martingale, Cox-Snell, Deviance and Randomized Quantile Residuals. The software has been tested on well-known datasets from health sciences and reliability studies, demonstrating its potential to develop models for applications such as flood prediction, churn analysis, credit risk modeling, recidivism, and student dropout. Overall, our work represents a versatile alternative for fitting parametric time-to-event models. (Tomado de la fuente)Summary
En los campos de la ingeniería de confiabilidad y el análisis de supervivencia, es común encontrar experimentos de los cuales se pueden obtener datos caracterizados por funciones de riesgo no monótonas, tales como funciones en forma de bañera o unimodales. Para modelar conjuntos de datos como los mencionados, se proponen frecuentemente distribuciones de vida útil flexibles. Sin embargo, muchas de estas distribuciones aun no están implementadas en software estadístico para ajustar modelos de regresión. En este contexto, hemos desarrollado el paquete R EstimationTools, que ofrece un marco de trabajo de propósito general para ajustar y evaluar modelos de regresión distribucional. Este marco utiliza una sintaxis que refleja la notación matemática. Utilizamos la estimación de máxima verosimilitud y calculamos la función de log-verosimilitud basada en la función de masa/densidad de probabilidad implementada en el espacio de trabajo global de R. Nuestro marco es particularmente adecuado para conjuntos de datos donde la variable de respuesta sigue una distribución de vida útil flexible, lo que permite a los usuarios estimar parámetros de distribución en relación con covariables, incluso con datos censurados. También proporciona herramientas de diagnóstico gráfico a través de residuos de Martingala, Cox-Snell y Deviance. El software ha sido probado en conjuntos de datos bien conocidos de las ciencias de la salud y estudios de confiabilidad, demostrando su potencial para desarrollar modelos para aplicaciones como la predicción de inundaciones, análisis de abandono de clientes, modelado de riesgo crediticio, reincidencia y deserción estudiantil. En general, nuestro trabajo representa una alternativa versátil para ajustar modelos paramétricos de tiempo hasta el evento.Keywords
Bathtub hazard ; Deviance residuals ; Distributional regression ; Flexible lifetime distributions ; Martingale residuals ; Maximum likelihood estimation ; Randomized quantile residuals ; Función hazard en forma de banera ; Residuos deviancee ; Regresión distribucionale ; Distribuciones de vida útil flexibles ; Residuos de Martingala ; Estimación de máxima verosimilitud ; Residuos cuantil aleatorizados ;
Physical description
Ilustraciones, gráficos
Collections
