Tamaño de muestra para funciones de tablas de contingencia vía algoritmos genéticos
Cargando...
Autores
Bustos Polo, Oveida Rosa
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
The GSK methodology proposed by Grizzle, Starmer and Koch (1969), frames their methodology. a in the regression analysis and the weighted least squares method, for the estimation of parameters of a model where the response variables are generated functions of a contingency table, and in particular to model responses variables that they have a multinomial distribution. The main advantages of this methodology are: its exibility in the construction of response functions and their ease of calculations.
The method of estimation by weighted least squares, due to the asymptotic nature of your statistical tests, you need a minimum sample size to get results with ables. Practically every statistical procedure needs its own development to calculating the required sample size. In the analysis of contingency tables, depending of the researcher’s interest, calculations specific to the problem should be carried out of interest is. For example, the sample sizes for an odds ratio are different from sizes for relative risk. The GSK methodology allows developing solutions to very various problems in the case of counting tables. Determination of sample sizes in this case it is a complex problem, since several multinomial populations are involved
and functions of the parameters of these populations, which are the researcher’s objective.
In this work we propose a methodology not developed to one in the literature for table of contingencies, which consists of determining the sample size by using of genetic algorithms to develop the GSK methodology for estimating of models for data in contingency table. A vector of sizes must be found Show them that they meet some established optimization criteria. This is implemented methodology in the statistical software R.
La metodología GSK propuesta por Grizzle, Starmer y Koch (1969), enmarca su metodología en el análisis de regresión y el método de mínimos cuadrados ponderados, para la estimación de parámetros de un modelo donde las variables respuestas son funciones generadas de una tabla de contingencia, y en particular para modelar variables respuestas que tienen una distribución multinomial. Las principales ventajas de esta metodología son: su flexibilidad en la construcción de funciones respuestas y su facilidad de cálculos. El método de estimación por mínimos cuadrados ponderados, debido a la naturaleza asintótica de sus pruebas estadísticas, necesita un tamaño muestral mínimo para obtener resultados confiables. Prácticamente cada procedimiento estadístico necesita su propio desarrollo para el cálculo del tamaño muestral requerido. En el análisis de tablas de contingencia, dependiendo del interés del investigador, se debe proceder a realizar cálculos específicos al problema de interés. Por ejemplo, los tamaños muestrales para una razón de odds son diferentes a los tamaños para un riesgo relativo. La metodología GSK permite desarrollar soluciones a muy diversos problemas en el caso de tablas de conteo. La determinación de tamaños muestrales en este caso es un problema complejo, ya que se involucran varias poblaciones multinomiales y funciones de los parámetros de estas poblaciones, que son el objetivo del investigador. En este trabajo se propone una metodología no desarrollada aún en la literatura para tabla de contingencias, la cual consiste en la determinación del tamaño muestral mediante la utilización de algoritmos genéticos a fin de desarrollar la metodología GSK para la estimación de modelos para datos en tabla de contingencia. Se debe encontrar un vector de tamaños muestrales que cumplan con algún criterio de optimización establecido. Se implementa esta metodología en el software estadístico R.
La metodología GSK propuesta por Grizzle, Starmer y Koch (1969), enmarca su metodología en el análisis de regresión y el método de mínimos cuadrados ponderados, para la estimación de parámetros de un modelo donde las variables respuestas son funciones generadas de una tabla de contingencia, y en particular para modelar variables respuestas que tienen una distribución multinomial. Las principales ventajas de esta metodología son: su flexibilidad en la construcción de funciones respuestas y su facilidad de cálculos. El método de estimación por mínimos cuadrados ponderados, debido a la naturaleza asintótica de sus pruebas estadísticas, necesita un tamaño muestral mínimo para obtener resultados confiables. Prácticamente cada procedimiento estadístico necesita su propio desarrollo para el cálculo del tamaño muestral requerido. En el análisis de tablas de contingencia, dependiendo del interés del investigador, se debe proceder a realizar cálculos específicos al problema de interés. Por ejemplo, los tamaños muestrales para una razón de odds son diferentes a los tamaños para un riesgo relativo. La metodología GSK permite desarrollar soluciones a muy diversos problemas en el caso de tablas de conteo. La determinación de tamaños muestrales en este caso es un problema complejo, ya que se involucran varias poblaciones multinomiales y funciones de los parámetros de estas poblaciones, que son el objetivo del investigador. En este trabajo se propone una metodología no desarrollada aún en la literatura para tabla de contingencias, la cual consiste en la determinación del tamaño muestral mediante la utilización de algoritmos genéticos a fin de desarrollar la metodología GSK para la estimación de modelos para datos en tabla de contingencia. Se debe encontrar un vector de tamaños muestrales que cumplan con algún criterio de optimización establecido. Se implementa esta metodología en el software estadístico R.
Abstract
Palabras clave propuestas
Descripción
Palabras clave
Citación
Oveida Rosa Bustos Polo. Tamaño de muestra para funciones de tablas de contingencia vía algoritmos genéticos. Master's thesis, Universidad Nacional de Colombia sede Medellín, Medellín 2020.

