中国科技论文
中國科技論文
중국과기논문
Sciencepaper Online
2015年
6期
626-628,637
,共4页
巩晶%李雪%陶超%魏天迪
鞏晶%李雪%陶超%魏天迪
공정%리설%도초%위천적
生物信息学%富亮氨酸重复序列%序列算法%位点相关概率模型
生物信息學%富亮氨痠重複序列%序列算法%位點相關概率模型
생물신식학%부량안산중복서렬%서렬산법%위점상관개솔모형
富亮氨酸重复序列(leucine-rich repeat,LRR)是一种广泛存在的蛋白质结构基序,在诸多重要生命过程中起关键性作用并与诸多人类疾病紧密相关.研究LRR中各个位点之间的氨基酸分布的相关性,并基于此相关性建立概率模型,可应用于序列水平上的LRR预测,以提高LRR预测的准确度.本文从LRRML数据库中提取已知的LRR蛋白质序列作为训练集和测试集;为LRR各个位点上氨基酸的分布数据构建4种不同的概率模型,包括位点相关和位点不相关概率模型;再通过机器学习和K-折交叉验证的方法,确定可以用于LRR预测的最佳模型.结果表明,位点相关概率模型和位点不相关概率模型以不同权重相加之后的综合模型在LRR预测中显示出高的准确度.LRR中各个位点之间的氨基酸分布存在一定的相关性,此相关性可作为重要参数应用于LRR预测.
富亮氨痠重複序列(leucine-rich repeat,LRR)是一種廣汎存在的蛋白質結構基序,在諸多重要生命過程中起關鍵性作用併與諸多人類疾病緊密相關.研究LRR中各箇位點之間的氨基痠分佈的相關性,併基于此相關性建立概率模型,可應用于序列水平上的LRR預測,以提高LRR預測的準確度.本文從LRRML數據庫中提取已知的LRR蛋白質序列作為訓練集和測試集;為LRR各箇位點上氨基痠的分佈數據構建4種不同的概率模型,包括位點相關和位點不相關概率模型;再通過機器學習和K-摺交扠驗證的方法,確定可以用于LRR預測的最佳模型.結果錶明,位點相關概率模型和位點不相關概率模型以不同權重相加之後的綜閤模型在LRR預測中顯示齣高的準確度.LRR中各箇位點之間的氨基痠分佈存在一定的相關性,此相關性可作為重要參數應用于LRR預測.
부량안산중복서렬(leucine-rich repeat,LRR)시일충엄범존재적단백질결구기서,재제다중요생명과정중기관건성작용병여제다인류질병긴밀상관.연구LRR중각개위점지간적안기산분포적상관성,병기우차상관성건립개솔모형,가응용우서렬수평상적LRR예측,이제고LRR예측적준학도.본문종LRRML수거고중제취이지적LRR단백질서렬작위훈련집화측시집;위LRR각개위점상안기산적분포수거구건4충불동적개솔모형,포괄위점상관화위점불상관개솔모형;재통과궤기학습화K-절교차험증적방법,학정가이용우LRR예측적최가모형.결과표명,위점상관개솔모형화위점불상관개솔모형이불동권중상가지후적종합모형재LRR예측중현시출고적준학도.LRR중각개위점지간적안기산분포존재일정적상관성,차상관성가작위중요삼수응용우LRR예측.