Modelo computacional para la identificación de endofenotipos en pacientes con artritis reumatoide utilizando información del antígeno leucocitario humano HLA clase II
Author
Type
Trabajo de grado - Maestría
Document language
EspañolPublication Date
2014Metadata
Show full item recordSummary
La Artritis Reumatoide es una enfermedad autoinmune que afecta del 0.4% al 1% de la población humana y existen marcadores genéticos implicados en esta enfermedad. Se han utilizado varios modelos de inteligencia computacional para la clasificación e identificación de endofenotipos (relación entre fenotipo y marcadores genéticos) en pacientes con Artritis Reumatoide y controles sanos a partir de información genética, principalmente el HLA DRB1 (Antígeno Leucocitario Humano), así como la teoría del Epítope Compartido. Esta hace referencia a la asociación entre la AR y el HLA-DRB1, principalmente los alelos que contienen un motivo común de aminoácidos de las secuencias QKRAA, QRRAA o RRRAA en las posiciones 70 a 74 de la cadena del DRB1, los cuales les confieren una susceptibilidad particular de la enfermedad a los individuos. En este trabajo se logró desarrollar un modelo computacional para clasificación de pacientes de artritis reumatoide y controles utilizando técnicas de estadística aplicada como son las redes neuronales, las redes bayesianas y los métodos de kernel. Como datos de entrada se utilizaron las variables de los pacientes en relación a serología (factor reumatoide y citrulinas), número de articulaciones inflamadas y dolorosas, reactantes de inflamación (velocidad de sedimentación globular y Proteína C Reactiva), rigidez matinal, edad, género, antecedentes de co morbilidades y la información del alelo HLA-DRB1. Se obtuvieron resultados importantes para el diagnóstico de la enfermedad, su categorización y como potencial aplicación en la medicina personalizada de los individuos afectados por esta enfermedad. A partir de esta información, se diseñaron y probaron varios modelos computacionales para clasificación. Particularmente,. Adicionalmente, se hicieron varios agrupamientos de los datos aspectos relacionados con laóel la algunas Para definir el número de grupos se utilizó el coeficiente de silueta. Finalmente se obtuvo un árbol de distancia entre las secuencias de aminoácidos de los distintos alelos HLA DRB1 lo cual permitió además visualizar los grupos con cercanía genética. Los métodos utilizados permiten una mejor estratificación de la enfermedad en relación a la predicción de fenotipos y posibles desenlaces de la enfermedad, así como para la potencial prevención primaria de la enfermedad.Summary
Abstract. Rheumatoid arthritis is an autoimmune disease that affects from 0.4% to 1% of the human population and genetic markers have been identified to be involved in the development of this disease. In this work, several computational intelligence models were used for the classification and identification of endophenotypes (relationship between phenotype and genetic markers) in patients with rheumatoid arthritis and healthy controls from genetic information, primarily the HLA-DRB1 (Human Leukocyte Antigen), and the Shared Epitope theory. This refers to association between RA and the HLA-DRB1 alleles, mainly containing common amino acid motif sequences QKRAA, RRRAA, QRRAA at positions 70 to 74 in the DRB1 sequence, which confer them particular disease susceptibility individuals. A computational model for classification was proposed, particularly, some statistical and computational intelligence techniques such as neural networks, bayesian networks and kernel methods were applied. Input variables used in relation to patients were serology (rheumatoid factor, Anti–citrullinated protein antibodies ACPA), number of swollen and tender joints, inflammation reactants (erythrocyte sedimentation rate and C-reactive protein), morning stiffness, age, gender, history of co morbidities and the information of the HLA-DRB1. We obtained promising results for disease diagnosis, and its categorization as potential application in personalized medicine for individuals suffering from this disease. From this information we designed computer models for classification in which neural networks properly classified 137 instances of the 138 instances in total representing 99.2% and 0.72% classified improperly, bayesian networks properly classified 136 instances representing 98.5% and inadequately 2 instances representing 1.44% of the 138 instances. Finally we obtained a tree distance between amino acid sequences of the different alleles HLA DRB1 which allows us to visualize genetic proximity groups. These applications provide better stratification of the disease in relation to the predicted phenotypes, and the potential for primary prevention of this disease.Keywords
Collections
