化学研究与应用
化學研究與應用
화학연구여응용
CHEMICAL RESEARCH AND APPLICATION
2014年
9期
1483-1486
,共4页
蛋白质相互作用%最小冗余最大相关%支持向量机
蛋白質相互作用%最小冗餘最大相關%支持嚮量機
단백질상호작용%최소용여최대상관%지지향량궤
protein-protein interactions%minimum redundancy maximum relevance%support vector machine
蛋白质与蛋白质相互作用的识别有助于研究蛋白质功能和发现潜在的药物靶标。本研究采用氨基酸组成、二肽组成、三联子组成、组成、转变、分布和自相关特征对蛋白质与蛋白质相互作用对进行表征。基于最小冗余最大相关方法选择最优特征子集,结合支持向量机对酵母蛋白质与蛋白质相互作用进行了预测研究。通过采用最优特征子集,训练集和测试集的预测精度分别比二肽组成的提高了4%和2%,表明了当前方法的有效性。
蛋白質與蛋白質相互作用的識彆有助于研究蛋白質功能和髮現潛在的藥物靶標。本研究採用氨基痠組成、二肽組成、三聯子組成、組成、轉變、分佈和自相關特徵對蛋白質與蛋白質相互作用對進行錶徵。基于最小冗餘最大相關方法選擇最優特徵子集,結閤支持嚮量機對酵母蛋白質與蛋白質相互作用進行瞭預測研究。通過採用最優特徵子集,訓練集和測試集的預測精度分彆比二肽組成的提高瞭4%和2%,錶明瞭噹前方法的有效性。
단백질여단백질상호작용적식별유조우연구단백질공능화발현잠재적약물파표。본연구채용안기산조성、이태조성、삼련자조성、조성、전변、분포화자상관특정대단백질여단백질상호작용대진행표정。기우최소용여최대상관방법선택최우특정자집,결합지지향량궤대효모단백질여단백질상호작용진행료예측연구。통과채용최우특정자집,훈련집화측시집적예측정도분별비이태조성적제고료4%화2%,표명료당전방법적유효성。
Identification of protein-protein interactions can provide useful information to elucidate protein functions and discover drug target. In this study,amino acid composition,dipeptide composition,conjoint triad,composition,transition,distribution and nor-malized Moreau-Broto autocorrelation features are used to characterize protein-protein interactions. Minimum redundancy maximum relevance is employed to select the optimized feature subset,and support vector machine is adopted to construct model and predict protein-protein interactions of saccharomyces. Based on the optimized subset,accuracies of training set and test set are about 5%and 2%higher than those of dipeptide composition,showing the effectiveness of the current method.