生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2013年
3期
181-185
,共5页
多样性增量%支持向量机%6类亲疏水紧邻%三磷酸腺苷(ATP)
多樣性增量%支持嚮量機%6類親疏水緊鄰%三燐痠腺苷(ATP)
다양성증량%지지향량궤%6류친소수긴린%삼린산선감(ATP)
Increment of diversity%Support Vector Machines%Diad%Seven Crosscheck%Adenosine-triphosphate
从蛋白质序列出发,对经Dr.G.P.S.Raghava整理和使用过的168条非冗余的ATP与蛋白质结合氨基酸序列进行分段,对ATP与蛋白质结合位点进行了统计分析.在此基础上,利用20种氨基酸的亲疏水性将20种氨基酸约化为6类.以氨基酸组分和6类亲疏水紧邻为参数,用多样性增量(ID)方法将氨基酸组分和6类亲疏水紧邻降维并将降维后的特征参数输入支持向量机中运算,本文运算结果显示用氨基酸组分ID值和6类亲疏水紧邻ID值共同作为特征参数结果最优,在七交叉检验下的预测总精度达到了99.67%,相关系数达到0.993 4,好于前人的预测结果.
從蛋白質序列齣髮,對經Dr.G.P.S.Raghava整理和使用過的168條非冗餘的ATP與蛋白質結閤氨基痠序列進行分段,對ATP與蛋白質結閤位點進行瞭統計分析.在此基礎上,利用20種氨基痠的親疏水性將20種氨基痠約化為6類.以氨基痠組分和6類親疏水緊鄰為參數,用多樣性增量(ID)方法將氨基痠組分和6類親疏水緊鄰降維併將降維後的特徵參數輸入支持嚮量機中運算,本文運算結果顯示用氨基痠組分ID值和6類親疏水緊鄰ID值共同作為特徵參數結果最優,在七交扠檢驗下的預測總精度達到瞭99.67%,相關繫數達到0.993 4,好于前人的預測結果.
종단백질서렬출발,대경Dr.G.P.S.Raghava정리화사용과적168조비용여적ATP여단백질결합안기산서렬진행분단,대ATP여단백질결합위점진행료통계분석.재차기출상,이용20충안기산적친소수성장20충안기산약화위6류.이안기산조분화6류친소수긴린위삼수,용다양성증량(ID)방법장안기산조분화6류친소수긴린강유병장강유후적특정삼수수입지지향량궤중운산,본문운산결과현시용안기산조분ID치화6류친소수긴린ID치공동작위특정삼수결과최우,재칠교차검험하적예측총정도체도료99.67%,상관계수체도0.993 4,호우전인적예측결과.