Modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos y creación del paquete ZOIP en R
Author
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2018-03-31Metadata
Show full item recordSummary
El modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, es un modelo de regresión donde la variable respuesta se encuentra definida a partir de una distribución para datos proporcionales, como la distribución beta o la distribución simplex, que dan resultados en el intervalo cero uno, más dos valores dados por cero y/o uno, representando la ausencia o presencia total de cierta característica. Diferentes autores han trabajado en el desarrollo de diferentes modelos y metodologías de estimación, sin embargo, no se ha desarrollado un modelo de regresión mixto para datos proporcionales inflados con ceros y/o unos, que reúna los principales modelos de regresión de este tipo y que la estimación de los parámetros sean vía máxima verosimilitud y la cuadratura de Gauss-Hermite. En este trabajo se presenta el paquete ZOIP del sistema computacional R, alojado en el CRAN y en GitHub, en ´el que se implementa la distribución ZOIP (Zeros Ones Inflated Proporcional), el modelo de regresión para efectos fijos y mixtos, ZOIP, que reúne las distribuciones y los modelos de regresión de efectos fijos y mixtos para las distribuciones beta en tres diferentes parametrizaciones y la distribución simplex, inflada con ceros y/o unos, la estimación de los parámetros se hace vía máxima verosimilitud y la cuadratura de Gauss-Hermite utilizando diferentes alternativas, como la cuadratura de Gauss-Hermite adaptativa con o sin pruning. Se realizan tres estudios de simulación que muestran la onvergencia de los parámetros para el ajuste de una distribución ZOIP y los diferentes casos de uso de los modelos de regresi´on ZOIP con efectos fijos y mixtos, a través de los estudios de simulación se presenta las ventajas y desventajas de los métodos de estimación propuestos y la alternativa de estimación que obtiene mejor desempeño, para cada modelo presentado. Además, se ajustan diferentes modelos de regresión ZOIP a un caso real sobre el porcentaje de uso de las tarjetas de crédito en una entidad bancaria colombiana y la dependencia a diferentes variables de negocio que fueron definidas previamente como efectos fijos y aleatorios, dependiendo del caso de estudio Palabras clave: modelos lineales mixtos, datos proporcionales inflados, cuadratura de Gauss-Hermite, máxima verosimilitudSummary
Abstract: The mixed regression model for proportional data inflated with zeros and/or ones is a regression model where the response variable is defined by a proportional data distribution. A proportional data distribution could be the beta distribution or the simplex distribution, which its results are given in the interval zero one, and in other two values given by zero and/or one that represent the absence or total presence of a given characteristic. Although several authors have worked on the development of different models and estimation methodologies, a mixed regression model for proportional data inflated with zeros and/or ones that aggregates the main regression models and the estimation of the parameters through the maximum likelihood and Gauss-Hermite quadrature has not been developed. In this paper, it is presented the ZOIP package for the computational system R, hosted in the CRAN and in GitHub, in which the ZOIP (Zeros Ones Inflated Proportional) distribution is implemented. In the ZOIP package is used a regression model for fixed and mixed effects, which unifies the distributions and these types of egressions for beta distribution with three differents cases of parameters and simplex distribution, inflated with zeros and/or ones, and the estimation of the parameters solved by the maximum likelihood and Gauss-Hermite quadrature using differents choices, like the Gauss-Hermite adaptive quadrature with pruning or without pruning. Three simulation studies are performed showing the convergence of the parameters for the fit of a ZOIP distribution and the different cases of use of the ZOIP regression model with fixed and mixed effects, with this simulation studies show the advantages and disadvantages of the proposed estimation methods and the estimation alternative that presents the best performance. Furthermore, different ZOIP regression models are fitted to a real case about percentage of use of credit cards in a Colombian bank and your dependence with different business variables that were previously defined as fixed and random effects, depending on the case of study.Keywords
Collections
This work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit