生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2014年
3期
227-231
,共5页
蛋白质序列%特征值%折叠速率%相关系数
蛋白質序列%特徵值%摺疊速率%相關繫數
단백질서렬%특정치%절첩속솔%상관계수
Protein sequence%Eigenvalue%Folding rate%Correlation coefficient
鉴于蛋白质折叠速率预测对研究其蛋白质功能的重要性,许多的科研工作者都开始对影响蛋白质折叠速率的因素进行研究。各种预测参数和方法被提出。利用蛋白质编码序列的不同特征参数,不同的二级结构及不同的折叠类的蛋白质对折叠速率的不同影响,我们选取蛋白质编码序列的新的特征值,即选取蛋白质序列的LZ复杂度,等电点等特征值。然后把这些特征值与20种氨基酸的属性αc、Cα、K0、Pβ、Ra、ΔASA、PI、ΔGhD、Nm、LZ、Mu、El融合,建立多元线性回归模型,并利用回归模型计算了13个全α类蛋白质、18个全β类蛋白质、13个混合类蛋白质和39个未分类蛋白质的ln( kf )与预测值之间的相关系数分别达到0.89、0.93、0.98、0.86。在Jack-knife方法的验证下发现在不同的结构中混合特征值与相应折叠速率有很好的相关性。结果表明,在蛋白质折叠过程中,蛋白质序列的LZ复杂度、等电点等特征值可能影响蛋白质的折叠速率及其结构。
鑒于蛋白質摺疊速率預測對研究其蛋白質功能的重要性,許多的科研工作者都開始對影響蛋白質摺疊速率的因素進行研究。各種預測參數和方法被提齣。利用蛋白質編碼序列的不同特徵參數,不同的二級結構及不同的摺疊類的蛋白質對摺疊速率的不同影響,我們選取蛋白質編碼序列的新的特徵值,即選取蛋白質序列的LZ複雜度,等電點等特徵值。然後把這些特徵值與20種氨基痠的屬性αc、Cα、K0、Pβ、Ra、ΔASA、PI、ΔGhD、Nm、LZ、Mu、El融閤,建立多元線性迴歸模型,併利用迴歸模型計算瞭13箇全α類蛋白質、18箇全β類蛋白質、13箇混閤類蛋白質和39箇未分類蛋白質的ln( kf )與預測值之間的相關繫數分彆達到0.89、0.93、0.98、0.86。在Jack-knife方法的驗證下髮現在不同的結構中混閤特徵值與相應摺疊速率有很好的相關性。結果錶明,在蛋白質摺疊過程中,蛋白質序列的LZ複雜度、等電點等特徵值可能影響蛋白質的摺疊速率及其結構。
감우단백질절첩속솔예측대연구기단백질공능적중요성,허다적과연공작자도개시대영향단백질절첩속솔적인소진행연구。각충예측삼수화방법피제출。이용단백질편마서렬적불동특정삼수,불동적이급결구급불동적절첩류적단백질대절첩속솔적불동영향,아문선취단백질편마서렬적신적특정치,즉선취단백질서렬적LZ복잡도,등전점등특정치。연후파저사특정치여20충안기산적속성αc、Cα、K0、Pβ、Ra、ΔASA、PI、ΔGhD、Nm、LZ、Mu、El융합,건립다원선성회귀모형,병이용회귀모형계산료13개전α류단백질、18개전β류단백질、13개혼합류단백질화39개미분류단백질적ln( kf )여예측치지간적상관계수분별체도0.89、0.93、0.98、0.86。재Jack-knife방법적험증하발현재불동적결구중혼합특정치여상응절첩속솔유흔호적상관성。결과표명,재단백질절첩과정중,단백질서렬적LZ복잡도、등전점등특정치가능영향단백질적절첩속솔급기결구。
Given the importance of protein folding rate prediction on protein function analysis, many researchers have begun to study the influential factors of protein folding rate. Several prediction parameters and methods have been proposed due to the different eigenvalues of protein-coding sequences, using the different effects on the folding rate by different secondary structures and folding classes of proteins, we selected some characteristic values of protein coding sequence the characteristics of LZ complexity of protein-coding sequence and isoelectric point. Then we integrated these eigenvalues and properties of 20 kinds of amino acids αc,Cα,K0,Pβ,Ra,ΔASA,PI,ΔGhD,Nm, LZ,Mu, El, and established a linear regression model. Using the regression model to calculate the correlation coefficient betweenln(kf) and predicted values for 13 all-α proteins ,18 all-β proteins,13 mixed class proteins,39 unclassified proteins as 0.89, 0.93, 0.98, 0.86, respectively.We used Jack-knife to test our model and it was found that the classification of protein into different structural classes reflected a good correlation between mixed eigenvalues and protein folding rates. The result shows that the characteristics of LZ complexity of protein-coding sequence and isoelectric point may affect the structure and the protein in the protein folding rate.