Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas

dc.contributorNiño V., Luis Fernandospa
dc.contributor.authorHernández González, Nelsonspa
dc.date.accessioned2019-06-25T18:25:22Zspa
dc.date.available2019-06-25T18:25:22Zspa
dc.date.issued2013spa
dc.description.abstractEste trabajo presenta una metodología de solución al problema de clasificación de residuos catalíticos en sitios activos de enzimas. Esta metodología está basada en el aprendizaje de máquina específicamente en las máquinas de soporte vectorial (MSV); que junto a las funciones kernel permite clasificar residuos en enzimas a partir de su secuencia. El conjunto de datos utilizados fue Catalytic Site Atlas (CSA). En la metodología planteada, en primer lugar encontramos la información biológica de los residuos integrada con la representación en secuencia de la enzima que lo contiene; esto por medio de las funciones kernel gaussiano y string, respectivamente. Posteriormente; el algoritmo jerárquico AGNES (Agglomerative Nesting) es aplicado para obtener un número de grupos inicial para el algoritmo de agrupación k-medias; obteniendo como resultado cinco grupos de enzimas. Por último, para cada grupo se desarrolló un sistema basado en MSV. La estimación del error de generalización después de validación cruzada es usada como criterio de desempeño del modelo.spa
dc.description.abstractAbstract. This project presents a methodology to solve the problem of classification of catalytic residues in enzyme active sites. This methodology is based on machine learning and more specifically support vector machine (SVM); which together with the kernel functions allows classifying residues in enzyme with their own sequence. The dataset used during this study was Catalytic Site Atlas (CSA). In the proposed methodology, first it is found the biologic information of the residues integrated with the sequence representation of the enzyme that contains the residue. This is done by means of the Gaussian and string kernel functions, respectively. Afterwards, the hierarchical clustering algorithm AGNES (Agglomerative Nesting) is applied in order to get a number of groups to initialize the k-means clustering algorithm, obtaining as result five groups of enzymes. Finally, for each one of the clusters, it was developed a sorting system based on SVM. The estimation of generalization error using cross validation is used as criteria of model performance.spa
dc.description.degreelevelMaestríaspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.eprintshttp://bdigital.unal.edu.co/10683/spa
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/20209
dc.language.isospaspa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Bogotá Facultad de Ingeniería Departamento de Ingeniería de Sistemas e Industrialspa
dc.relation.ispartofDepartamento de Ingeniería de Sistemas e Industrialspa
dc.relation.referencesHernández González, Nelson (2013) Métodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimas. Maestría thesis, Universidad Nacional de Colombia.spa
dc.rightsDerechos reservados - Universidad Nacional de Colombiaspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccessspa
dc.rights.licenseAtribución-NoComercial 4.0 Internacionalspa
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/spa
dc.subject.ddc0 Generalidades / Computer science, information and general worksspa
dc.subject.ddc57 Ciencias de la vida; Biología / Life sciences; biologyspa
dc.subject.ddc66 Ingeniería química y Tecnologías relacionadas/ Chemical engineeringspa
dc.subject.proposalMáquinas de soporte vectorialspa
dc.subject.proposalFunciones kernelspa
dc.subject.proposalSitios catalíticosspa
dc.subject.proposalSupport Vector Machinespa
dc.subject.proposalKernel functionsspa
dc.subject.proposalCatalytic sitesspa
dc.titleMétodos de Kernels en secuencias para la clasificación de residuos catalíticos en sitios activos de enzimasspa
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttp://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2spa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
299799.2013.pdf
Tamaño:
1.47 MB
Formato:
Adobe Portable Document Format