生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2012年
4期
274-279
,共6页
变量筛选%支持向量机%10折交叉验证%预测模型%HIV-1蛋白酶
變量篩選%支持嚮量機%10摺交扠驗證%預測模型%HIV-1蛋白酶
변량사선%지지향량궤%10절교차험증%예측모형%HIV-1단백매
在抗艾滋病治疗中,HIV-1蛋白酶抑制剂发挥着重要作用.对于HIV-1蛋白酶裂解作用位点的研究有助于找到新的治疗靶点.为了对HIV-1蛋白酶特异位点进行预测,本研究用氨基酸索引数据库(Amino Acid Index,AAIndex)中的531个氨基酸物理化学性质参数直接表征肽样本的结构,通过二层特征筛选,最终将4248个表征参数降为57个表征参数.分别采取四种核函数进行HIV-1蛋白酶特异位点的支持向量机(SVM)建模,并通过10折交叉验证及外部测试集方法来验证建模的准确性.结果表明选取NormalizePolyKernel核函数进行SVM建模效果优于其他核函数(PolyKernel、PUK、RBFKernel),所建立的模型对于训练集的10组交叉验证预测准确率达到93.947%,对于外部测试集的预测正确率达到93.684%.
在抗艾滋病治療中,HIV-1蛋白酶抑製劑髮揮著重要作用.對于HIV-1蛋白酶裂解作用位點的研究有助于找到新的治療靶點.為瞭對HIV-1蛋白酶特異位點進行預測,本研究用氨基痠索引數據庫(Amino Acid Index,AAIndex)中的531箇氨基痠物理化學性質參數直接錶徵肽樣本的結構,通過二層特徵篩選,最終將4248箇錶徵參數降為57箇錶徵參數.分彆採取四種覈函數進行HIV-1蛋白酶特異位點的支持嚮量機(SVM)建模,併通過10摺交扠驗證及外部測試集方法來驗證建模的準確性.結果錶明選取NormalizePolyKernel覈函數進行SVM建模效果優于其他覈函數(PolyKernel、PUK、RBFKernel),所建立的模型對于訓練集的10組交扠驗證預測準確率達到93.947%,對于外部測試集的預測正確率達到93.684%.
재항애자병치료중,HIV-1단백매억제제발휘착중요작용.대우HIV-1단백매렬해작용위점적연구유조우조도신적치료파점.위료대HIV-1단백매특이위점진행예측,본연구용안기산색인수거고(Amino Acid Index,AAIndex)중적531개안기산물이화학성질삼수직접표정태양본적결구,통과이층특정사선,최종장4248개표정삼수강위57개표정삼수.분별채취사충핵함수진행HIV-1단백매특이위점적지지향량궤(SVM)건모,병통과10절교차험증급외부측시집방법래험증건모적준학성.결과표명선취NormalizePolyKernel핵함수진행SVM건모효과우우기타핵함수(PolyKernel、PUK、RBFKernel),소건립적모형대우훈련집적10조교차험증예측준학솔체도93.947%,대우외부측시집적예측정학솔체도93.684%.