内蒙古工业大学学报(自然科学版)
內矇古工業大學學報(自然科學版)
내몽고공업대학학보(자연과학판)
Journal of Inner Mongolia University of Technology(Natural science edition)
2015年
3期
177-183
,共7页
孙利霞%胡秀珍%李少波%李昆
孫利霞%鬍秀珍%李少波%李昆
손리하%호수진%리소파%리곤
βαβ模体%SVM算法%位点氨基酸%亲疏水组分%超二级结构
βαβ模體%SVM算法%位點氨基痠%親疏水組分%超二級結構
βαβ모체%SVM산법%위점안기산%친소수조분%초이급결구
βαβ motif%SVM algorithm%Position of amino acids%Hydropathy composition%Super secondary structure
从已知蛋白质结构的氨基酸序列出发,利用DSSP和PROMTIF构建了蛋白质复杂超二级结构strand-loop-helix-loop-strand模体数据集.数据集含1458条蛋白质链,其中βaβ模体数为3632个,非βαβ模体数为3148个.将亲疏水组分、优化的位点氨基酸组分、预测的模体信息和二级结构信息共同作为序列特征输入支持向量机,5交叉检验的预测总精度和马氏相关系数达到了79.7%和0.59;独立检验的预测总精度和马氏相关系数达到了73.4%和0.47.
從已知蛋白質結構的氨基痠序列齣髮,利用DSSP和PROMTIF構建瞭蛋白質複雜超二級結構strand-loop-helix-loop-strand模體數據集.數據集含1458條蛋白質鏈,其中βaβ模體數為3632箇,非βαβ模體數為3148箇.將親疏水組分、優化的位點氨基痠組分、預測的模體信息和二級結構信息共同作為序列特徵輸入支持嚮量機,5交扠檢驗的預測總精度和馬氏相關繫數達到瞭79.7%和0.59;獨立檢驗的預測總精度和馬氏相關繫數達到瞭73.4%和0.47.
종이지단백질결구적안기산서렬출발,이용DSSP화PROMTIF구건료단백질복잡초이급결구strand-loop-helix-loop-strand모체수거집.수거집함1458조단백질련,기중βaβ모체수위3632개,비βαβ모체수위3148개.장친소수조분、우화적위점안기산조분、예측적모체신식화이급결구신식공동작위서렬특정수입지지향량궤,5교차검험적예측총정도화마씨상관계수체도료79.7%화0.59;독립검험적예측총정도화마씨상관계수체도료73.4%화0.47.