工程数学学报
工程數學學報
공정수학학보
CHINESE JOURNAL OF ENGINEERING MATHEMATICS
2010年
6期
959-966
,共8页
高建召%胡刚%王奎%沈世镒
高建召%鬍剛%王奎%瀋世鎰
고건소%호강%왕규%침세일
蛋白质折叠速率%基因序列的预测方法%局部结构信息熵%线性回归
蛋白質摺疊速率%基因序列的預測方法%跼部結構信息熵%線性迴歸
단백질절첩속솔%기인서렬적예측방법%국부결구신식적%선성회귀
正确预测蛋白质折叠速率对理解蛋白质的折叠机制非常重要.本文从AAindex数据库中的531种残基物理化学性质、序列长度信息和局部结构信息熵中筛选特征,从而提出了一个基于蛋白质序列信息的线性回归模型.针对三种折叠机制two-state,multi-state和mixed-state,用Jackknife验证模犁,预测的折叠速率和实验验证的折叠速率相关系数分别为0.790,0.829和0.778.本文结果表明四阶局部结构信息熵和折叠速率有很高的负相关性;蛋白质的长度和蛋白质的折叠速率成反比关系;螺旋的含量会加快蛋白质的折叠过程.对two-state蛋白质β折叠的含量会减慢蛋白质的折叠过程;和其他模型相比,我们提出的线性回归模型具有输入参数少,计算简单,平均绝对误差小的优点.
正確預測蛋白質摺疊速率對理解蛋白質的摺疊機製非常重要.本文從AAindex數據庫中的531種殘基物理化學性質、序列長度信息和跼部結構信息熵中篩選特徵,從而提齣瞭一箇基于蛋白質序列信息的線性迴歸模型.針對三種摺疊機製two-state,multi-state和mixed-state,用Jackknife驗證模犛,預測的摺疊速率和實驗驗證的摺疊速率相關繫數分彆為0.790,0.829和0.778.本文結果錶明四階跼部結構信息熵和摺疊速率有很高的負相關性;蛋白質的長度和蛋白質的摺疊速率成反比關繫;螺鏇的含量會加快蛋白質的摺疊過程.對two-state蛋白質β摺疊的含量會減慢蛋白質的摺疊過程;和其他模型相比,我們提齣的線性迴歸模型具有輸入參數少,計算簡單,平均絕對誤差小的優點.
정학예측단백질절첩속솔대리해단백질적절첩궤제비상중요.본문종AAindex수거고중적531충잔기물이화학성질、서렬장도신식화국부결구신식적중사선특정,종이제출료일개기우단백질서렬신식적선성회귀모형.침대삼충절첩궤제two-state,multi-state화mixed-state,용Jackknife험증모리,예측적절첩속솔화실험험증적절첩속솔상관계수분별위0.790,0.829화0.778.본문결과표명사계국부결구신식적화절첩속솔유흔고적부상관성;단백질적장도화단백질적절첩속솔성반비관계;라선적함량회가쾌단백질적절첩과정.대two-state단백질β절첩적함량회감만단백질적절첩과정;화기타모형상비,아문제출적선성회귀모형구유수입삼수소,계산간단,평균절대오차소적우점.