Detección de datos influenciales y multicolinealidad en el modelo no lineal
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2015Metadata
Show full item recordSummary
El análisis de regresión es una herramienta ampliamente usada en el trabajo estadístico aplicado. Una de las características deseables respecto a un conjunto de observaciones es que cada uno de los elementos de este conjunto tenga un impacto aproximadamente igual dentro del proceso de estimación de un modelo estadístico. En el caso del modelo de regresión lineal múltiple, se espera que cada una de las filas de la matriz de diseño X y su respectiva variable respuesta y, tenga un impacto similar en la estimación del modelo. También es deseable que la matriz de datos X no presente problemas de multicolinealidad, es decir, que las estimaciones del modelo no pierdan precisión debido a relaciones lineales entre las columnas de la matriz de diseño o falta de variabilidad en las mismas. No obstante, cuando se trabaja con datos observacionales, esto difícilmente ocurre, puesto que los procesos de estimación suelen estar contaminados por datos extremos y, algunas veces, por presencia de multicolinealidad. En este trabajo, se analizan este tipo de problemas en el modelo no lineal, y el diagnóstico de éstos se realiza generalizando algunas metodologías que son utilizadas en el modelo lineal múltiple, utilizando en este caso, estimación por mínimos cuadrados no lineales. Finalmente, se desarrolla una interfaz gráfica en R donde son implementadas estas técnicas.Summary
Abstract: regression analysis is a widely used tool in the statistical work applied. One of the desirable features over a set of observations is that each of the elements of this set has an impact approximately equal within the estimation process of a statistical model. In the case of multiple linear regression model, it is expected that each of the rows of the matrix design X and respective variable response y, have a similar impact in the model estimation. It is also desirable that the data matrix X collinearity issues not present. However, when working with observational data, this hardly occurs, since the estimation processes are often contaminated by outliers and, sometimes, by the presence of collinearity. In this paper, these problems are discussed in the nonlinear model, and diagnosis of these are done generalizing some methodologies that are used in the multiple linear model, using in this case, estimated by nonlinear least squares. Finally, a graphical interface in R where these techniques are implemented develops.Keywords
Collections
