Método computacional para la identificación de proteínas secretadas por vía no clásica / Computational method for the classification of non classical secreted protein
Summary
Este trabajo propuso un método computacional innovador para la clasificación de proteínas secretadas por vía no clásica. De forma específica se presenta una aproximación novedosa tanto en la comprensión y uso de los métodos basados en aprendizaje de máquina como en la solución a un problema complejo previamente reportado por la comunidad científica. La nueva metodología denominada SIG+SVM fue validada con datos evaluados experimentalmente superando las aproximaciones previamente reportadas para la clasificación de proteínas que cumplen con esta condición. Así mismo, se proponen transformaciones innovadoras a partir de procesos eficaces, reportando excelentes resultados, lo cual se ve reflejado de manera directa en el área de las ciencias de la vida a nivel mundial, abriendo un espacio único para el Departamento de Ingeniería de Sistemas. / Abstract. This work proposed novel computational method for classifying Gram-positive proteins that are secreted via the nonclassical secretory pathway, denoted as SIG+SVM: secretion independent Gram-positive supported vector machine. SIG+SVM implements novel approaches, both in the use and understanding of Kernel methods as well as for the solution of a biological problem. It is composed by 4 Kernel-based classifiers (frequencies, dipeptides, physicochemical factors and PSSM), each of which is based on different vectorial representations obtained by applying different amino acid sequence transformations to the input data. The method performed better than previously reported approaches proposed for classifying nonclassically secreted proteins when being tested with an experimentally validated protein dataset.