中国生物医学工程学报
中國生物醫學工程學報
중국생물의학공정학보
CHINESE JOURNAL OF BIOMEDICAL ENGINEERING
2013年
5期
580-587
,共8页
蛋白质结构类预测%特征信息集%Ma-Ada多分类器融合
蛋白質結構類預測%特徵信息集%Ma-Ada多分類器融閤
단백질결구류예측%특정신식집%Ma-Ada다분류기융합
protein structural class prediction%feature information set%Ma-Ada multi-classifier fusion
蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面.本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法.该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息.实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%.与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率.
蛋白質序列特徵錶示和機器學習算法是影響蛋白質結構類預測效果好壞的兩箇重要方麵.本研究基于k-字統計頻率和k-片段位置分佈兩種特徵提取方法,將分彆提取到的氨基痠序列信息和物理化學性質信息同蛋白質二級結構信息進行融閤,建立17維和57維的特徵信息集,併嘗試在Adaboost.M1算法中引入Multi-Agent多智能體融閤的思想,提齣瞭一種Ma-Ada多分類器融閤算法.該算法作為蛋白質結構類的預測工具,充分挖掘瞭單分類器度量層信息以及各箇單分類器之間的交互融閤信息.實驗結果錶明,Ma-Ada算法在Z277、Z498、1189和D640四箇蛋白質數據集的57維特徵信息集上的分類率分彆達到瞭91.3%、96.8%、85.3%和87.2%,在17維特徵信息集上的分類率也分彆達到瞭90.6%、95.8%、84.8%和88.3%.與其它蛋白質結構類預測方法的結果相比,本方法能夠穫得較好的分類率.
단백질서렬특정표시화궤기학습산법시영향단백질결구류예측효과호배적량개중요방면.본연구기우k-자통계빈솔화k-편단위치분포량충특정제취방법,장분별제취도적안기산서렬신식화물이화학성질신식동단백질이급결구신식진행융합,건립17유화57유적특정신식집,병상시재Adaboost.M1산법중인입Multi-Agent다지능체융합적사상,제출료일충Ma-Ada다분류기융합산법.해산법작위단백질결구류적예측공구,충분알굴료단분류기도량층신식이급각개단분류기지간적교호융합신식.실험결과표명,Ma-Ada산법재Z277、Z498、1189화D640사개단백질수거집적57유특정신식집상적분류솔분별체도료91.3%、96.8%、85.3%화87.2%,재17유특정신식집상적분류솔야분별체도료90.6%、95.8%、84.8%화88.3%.여기타단백질결구류예측방법적결과상비,본방법능구획득교호적분류솔.