生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2009年
4期
255-257
,共3页
陆林英%魏雅卓%崔颖%孙平平%马雅楠%马志强
陸林英%魏雅卓%崔穎%孫平平%馬雅楠%馬誌彊
륙림영%위아탁%최영%손평평%마아남%마지강
蛋白质相互作用%SVM%序列主要结构
蛋白質相互作用%SVM%序列主要結構
단백질상호작용%SVM%서렬주요결구
Protein-protein interactions%Protein Primary Structure%SVM
支持向量机(SVM)是广泛应用于各个领域的分类算法,包括生物信息学.本研究应用SVM作为蛋白质相互作用的分类算法,所用蛋白质相互作用数据下载于墨尼黑生物信息学中心的酿酒酵母数据集,包含有6 736条蛋白质,其中相互作用的有4 837对,不相互作用的有9 674对.提取蛋白质主要结构的电荷和等电位点特征,并应用SVM分类算法对此进行了分类.结果显示,分类的正确率在60%左右,但是较系统发育谱法还是获得了较高的分类正确率.
支持嚮量機(SVM)是廣汎應用于各箇領域的分類算法,包括生物信息學.本研究應用SVM作為蛋白質相互作用的分類算法,所用蛋白質相互作用數據下載于墨尼黑生物信息學中心的釀酒酵母數據集,包含有6 736條蛋白質,其中相互作用的有4 837對,不相互作用的有9 674對.提取蛋白質主要結構的電荷和等電位點特徵,併應用SVM分類算法對此進行瞭分類.結果顯示,分類的正確率在60%左右,但是較繫統髮育譜法還是穫得瞭較高的分類正確率.
지지향량궤(SVM)시엄범응용우각개영역적분류산법,포괄생물신식학.본연구응용SVM작위단백질상호작용적분류산법,소용단백질상호작용수거하재우묵니흑생물신식학중심적양주효모수거집,포함유6 736조단백질,기중상호작용적유4 837대,불상호작용적유9 674대.제취단백질주요결구적전하화등전위점특정,병응용SVM분류산법대차진행료분류.결과현시,분류적정학솔재60%좌우,단시교계통발육보법환시획득료교고적분류정학솔.
SVM classification algorithm has been applied to identify protein-protein interactions data. SVM has been employed widely in many fields, such as bioinformatics. The protein interactions data download from munich information center for protein sequence, which includes 6736 proteins in Scerevisiae yeast dataset.Interaction protein has 4837 pairs and non-interaction protein has 9674 pairs.Extracting charge and the isoelectric point (PI) as mainly features of protein primary structure, and SVM has been used to classify interaction proteins.Although the accuracy of classification was about 60%, comparing with Phylogenetic profiling, it also got good results.