Comparación entre análisis discriminante no métrico y regresión logística multinominal
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2007Resumen
Resumen: en este trabajo se presenta un estudio de comparación entre las técnicas de clasificación análisis discriminante no métrico, regresión logística multinomial; adicionalmente, se considera la técnica tradicional análisis discriminante lineal ya que la función de clasificación de ésta sirve como punto de partida para análisis discriminante no métrico. Los escenarios bajo los cuales se llevó a cabo el estudio fueron los siguientes: tres grupos distribuidos normal bivariado con matrices de varianza y covarianza iguales y diferentes, siete grupos distribuidos normal con tres variables y matrices de varianza y covarianza diferentes, tres grupos distribuidos Logitnormal, Lognormal y Sinh−1-normal con dos variables. Los desempeños de las técnicas fueron medidos con la tasa de clasificación errónea. Las técnicas de Regresión Logística Multinomial y Análisis Discriminante Lineal obtuvieron tasas de clasificación errónea muy similares en todo el estudio e inferiores que Análisis Discriminante no Métrico. Se construyeron funciones en el programa R para implementar el algoritmo propuesto por Choulakian y Almhana (2001) para técnica Análisis Discriminante no Métrico. Se llevó a cabo una aplicación de las tres técnicas utilizando una base de datos real sobre datos antropométricos de trabajadores colombianos.En esta aplicación se encontró que las mejores clasificaciones fueron obtenidas por Regresión Logística Multinomial y Análisis Discriminante Lineal al clasificar personas en tres grupos predeterminados por el índice de masa corporal. Finalmente, del estudio se recomienda la utilización de las técnicas regresión logística multinomial y análisis discriminante lineal para realizar clasificaciones en situaciones donde la distribución de los datos sea próxima a la distribución normal multivariada con variables explicativas cuantitativas.Resumen
Abastract: in this paper we show the results of a comparison simulation study for three classification techniques: Multinomial Logistic Regression (MLR), No Metric Discriminant Analysis (NDA) and Linear Discriminant Analysis (LDA). The measure used to compare the performance of the three techniques was the Error Classification Rate (ECR). We found that MLR and LDA techniques have similar performance and that they are better that NDA when the population multivariate distribution is Normal or Logit-Normal. We illustrated the application of the three techniques using a Colombian workers anthropometric data basePalabras clave
Colecciones
![Atribución-NoComercial 4.0 Internacional](/themes/Mirage2//images/creativecommons/cc-generic.png)