计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
2期
82-86
,共5页
史文丽%郭茂祖%李晋%刘晓燕
史文麗%郭茂祖%李晉%劉曉燕
사문려%곽무조%리진%류효연
支持向量机%主动学习%蛋白质相互作用
支持嚮量機%主動學習%蛋白質相互作用
지지향량궤%주동학습%단백질상호작용
Support vector machine%Active learning%Protein-protein interaction
提出了基于SVM的主动学习算法,用来解决蛋白质相互作用的预测问题.细胞中的生物过程是通过蛋白质相互作用实现的.但是通过实验验证蛋白质之间是否具有相互作用的代价非常大,而且数据很难获取.为了在有限的阳性样本情况下更加快速准确地预测蛋白质之间是否具有相互作用,引入了主动学习方法.主动学习算法可以用来构造有效训练集,其目标是通过迭代抽样,每次寻找最富有信息量的数据点,找到最有利于提升分类效果的样本,进而减小分类训练集的大小.比较了5种不同的主动学习算法,以寻找在有限资源前提下提高分类算法效率的最佳途径.实验表明,主动学习方法与SVM算法相结合,能够在保证SVM分类性能的前提下,有效减少学习所需的样本数量.
提齣瞭基于SVM的主動學習算法,用來解決蛋白質相互作用的預測問題.細胞中的生物過程是通過蛋白質相互作用實現的.但是通過實驗驗證蛋白質之間是否具有相互作用的代價非常大,而且數據很難穫取.為瞭在有限的暘性樣本情況下更加快速準確地預測蛋白質之間是否具有相互作用,引入瞭主動學習方法.主動學習算法可以用來構造有效訓練集,其目標是通過迭代抽樣,每次尋找最富有信息量的數據點,找到最有利于提升分類效果的樣本,進而減小分類訓練集的大小.比較瞭5種不同的主動學習算法,以尋找在有限資源前提下提高分類算法效率的最佳途徑.實驗錶明,主動學習方法與SVM算法相結閤,能夠在保證SVM分類性能的前提下,有效減少學習所需的樣本數量.
제출료기우SVM적주동학습산법,용래해결단백질상호작용적예측문제.세포중적생물과정시통과단백질상호작용실현적.단시통과실험험증단백질지간시부구유상호작용적대개비상대,이차수거흔난획취.위료재유한적양성양본정황하경가쾌속준학지예측단백질지간시부구유상호작용,인입료주동학습방법.주동학습산법가이용래구조유효훈련집,기목표시통과질대추양,매차심조최부유신식량적수거점,조도최유리우제승분류효과적양본,진이감소분류훈련집적대소.비교료5충불동적주동학습산법,이심조재유한자원전제하제고분류산법효솔적최가도경.실험표명,주동학습방법여SVM산법상결합,능구재보증SVM분류성능적전제하,유효감소학습소수적양본수량.