国际生物医学工程杂志
國際生物醫學工程雜誌
국제생물의학공정잡지
INTERNATIONAL JOURNAL OF BIOMEDICAL ENGINEERING
2012年
6期
350-352,372
,共4页
杨惠云%石鸥燕%乔海晅%田心
楊惠雲%石鷗燕%喬海晅%田心
양혜운%석구연%교해훤%전심
蛋白质结构类%预测%隐马尔可夫模型%3-状态%8-状态
蛋白質結構類%預測%隱馬爾可伕模型%3-狀態%8-狀態
단백질결구류%예측%은마이가부모형%3-상태%8-상태
Protein structural class%Prediction%Hidden Markov model%3-state%8-state
目的 准确预测蛋白质结构类,为研究其空间结构及生物功能打下基础.方法 应用隐马尔可夫模型(HMM)预测蛋白质结构类,分别构建3-状态HMM和8-状态HMM.数据来源于Chou和Zhou构建的蛋白质数据集,分别包含有204条蛋白质序列和498条蛋白质序列,通过留一法预测其准确率.结果 所构建的3-状态HMM和8-状态HMM对全α类的预测准确率最高,尤其是3-状态HMM的预测准确率达到95%以上.与Chou数据集相比,Zhou数据集对于全β类和α/β类的预测准确率也有所提高,同时,总体预测率也提高了2%左右;但α+β类的预测准确率有所下降.结论 将整条蛋白质序列作为预测模型的输入信息所构建的HMM模型能有效地预测蛋白质的结构类.
目的 準確預測蛋白質結構類,為研究其空間結構及生物功能打下基礎.方法 應用隱馬爾可伕模型(HMM)預測蛋白質結構類,分彆構建3-狀態HMM和8-狀態HMM.數據來源于Chou和Zhou構建的蛋白質數據集,分彆包含有204條蛋白質序列和498條蛋白質序列,通過留一法預測其準確率.結果 所構建的3-狀態HMM和8-狀態HMM對全α類的預測準確率最高,尤其是3-狀態HMM的預測準確率達到95%以上.與Chou數據集相比,Zhou數據集對于全β類和α/β類的預測準確率也有所提高,同時,總體預測率也提高瞭2%左右;但α+β類的預測準確率有所下降.結論 將整條蛋白質序列作為預測模型的輸入信息所構建的HMM模型能有效地預測蛋白質的結構類.
목적 준학예측단백질결구류,위연구기공간결구급생물공능타하기출.방법 응용은마이가부모형(HMM)예측단백질결구류,분별구건3-상태HMM화8-상태HMM.수거래원우Chou화Zhou구건적단백질수거집,분별포함유204조단백질서렬화498조단백질서렬,통과류일법예측기준학솔.결과 소구건적3-상태HMM화8-상태HMM대전α류적예측준학솔최고,우기시3-상태HMM적예측준학솔체도95%이상.여Chou수거집상비,Zhou수거집대우전β류화α/β류적예측준학솔야유소제고,동시,총체예측솔야제고료2%좌우;단α+β류적예측준학솔유소하강.결론 장정조단백질서렬작위예측모형적수입신식소구건적HMM모형능유효지예측단백질적결구류.
Objective Predicting protein structural class is the basis for predicting protein spatial structure,so it is important to improve the prediction accuracy of protein structural class.Methods We proposed 3-state and 8-state Hidden Markov model (HMM),and applied these HMMs to the prediction of protein structural class,respectively.We evaluated their accuracy on two different datasets through the rigorous jackknife cross-validation test.Results Prediction ability of 8-state HMM and 3-state HMM to all α class were excellent,the prediction accuracy of 3-state HMM even reached above 95%.Compared with Chou data set,the prediction accuracy of Zhou data set for all β class and α/β class of was improved,while overall prediction accuracy increased by 2%.Conclusion HMM is an effective method to predict protein structural class.