中南大学学报(自然科学版)
中南大學學報(自然科學版)
중남대학학보(자연과학판)
JOURNAL OF CENTRAL SOUTH UNIVERSITY
2011年
9期
2543-2550
,共8页
赵伟%许尤厚%郑甲%王玉光%周洪波
趙偉%許尤厚%鄭甲%王玉光%週洪波
조위%허우후%정갑%왕옥광%주홍파
氨基酸组成%多肽片段%非相邻二元组合%蛋白质热稳定性%支持向量机
氨基痠組成%多肽片段%非相鄰二元組閤%蛋白質熱穩定性%支持嚮量機
안기산조성%다태편단%비상린이원조합%단백질열은정성%지지향량궤
从GenBank数据库中获取了微生物来源的嗜热脂肪酶序列77条,耐热脂肪酶序列65条,分别统计分析序列中20种氨基酸出现的频次,二肽片段、三肽片段出现的差异以及非相邻二元组合的偏爱性.在此基础上,利用支持向量机(SVM)进行序列分类研究.研究结果表明:在统计学意义上,20种天然氨基酸残基中,亮氨酸、脯氨酸、蛋氨酸、苯丙氨酸、色氨酸和酪氨酸在嗜热蛋白序列中出现的频率高于其在耐热蛋白中出现的频率;二肽片段KC,EE,KE,RE,VE,YI,EK,VK,EV,YV,EY,KY,VY和YY的出现频率在嗜热蛋白中显著高于其在耐热蛋白中出现的频率.三肽片段的出现频率和非相邻二元组合的序列偏爱性也显示与蛋白耐热性显著相关.训练集的分类准确率达99.65%,真实数据集的分类准确率达到98.41%.
從GenBank數據庫中穫取瞭微生物來源的嗜熱脂肪酶序列77條,耐熱脂肪酶序列65條,分彆統計分析序列中20種氨基痠齣現的頻次,二肽片段、三肽片段齣現的差異以及非相鄰二元組閤的偏愛性.在此基礎上,利用支持嚮量機(SVM)進行序列分類研究.研究結果錶明:在統計學意義上,20種天然氨基痠殘基中,亮氨痠、脯氨痠、蛋氨痠、苯丙氨痠、色氨痠和酪氨痠在嗜熱蛋白序列中齣現的頻率高于其在耐熱蛋白中齣現的頻率;二肽片段KC,EE,KE,RE,VE,YI,EK,VK,EV,YV,EY,KY,VY和YY的齣現頻率在嗜熱蛋白中顯著高于其在耐熱蛋白中齣現的頻率.三肽片段的齣現頻率和非相鄰二元組閤的序列偏愛性也顯示與蛋白耐熱性顯著相關.訓練集的分類準確率達99.65%,真實數據集的分類準確率達到98.41%.
종GenBank수거고중획취료미생물래원적기열지방매서렬77조,내열지방매서렬65조,분별통계분석서렬중20충안기산출현적빈차,이태편단、삼태편단출현적차이이급비상린이원조합적편애성.재차기출상,이용지지향량궤(SVM)진행서렬분류연구.연구결과표명:재통계학의의상,20충천연안기산잔기중,량안산、포안산、단안산、분병안산、색안산화락안산재기열단백서렬중출현적빈솔고우기재내열단백중출현적빈솔;이태편단KC,EE,KE,RE,VE,YI,EK,VK,EV,YV,EY,KY,VY화YY적출현빈솔재기열단백중현저고우기재내열단백중출현적빈솔.삼태편단적출현빈솔화비상린이원조합적서렬편애성야현시여단백내열성현저상관.훈련집적분류준학솔체99.65%,진실수거집적분류준학솔체도98.41%.