济南大学学报(自然科学版)
濟南大學學報(自然科學版)
제남대학학보(자연과학판)
JOURNAL OF JINAN UNIVERSITY(SCIENE AND TECHNOLOGY)
2010年
4期
376-379
,共4页
刘立元%陈月辉%马炳先%曹毅
劉立元%陳月輝%馬炳先%曹毅
류립원%진월휘%마병선%조의
蛋白质亚核定位%集成学习%进化模糊K近邻%粒子群优化算法%Jackknife验证
蛋白質亞覈定位%集成學習%進化模糊K近鄰%粒子群優化算法%Jackknife驗證
단백질아핵정위%집성학습%진화모호K근린%입자군우화산법%Jackknife험증
针对从蛋白质原始序列中预测蛋白质定位及功能信息这个生物信息学中研究的热点问题,提出进化模糊K近邻算法(Evolutionary Fuzzy K-Nearest Neighbor,EFKNN)直接处理多分类问题的预测模型,用EFKNN及其集成直接从蛋白质序列中预测蛋白质亚核定位.采用5种特征提取算法从蛋白质序列中提取特征,训练了5个基于EFKNN的基分类器,并根据得票量大小原则集成每个基分类器的分类结果作为待测样本的输出.将蛋白质亚核定位预测中常用的数据集SNL9作为训练集,利用jackknife测试方法预测了数据集中每条单定位亚核蛋白,正确率为70.0%,表明该模型可以作为蛋白质亚核定位预测的工具或对现有预测模型和方法的补充.
針對從蛋白質原始序列中預測蛋白質定位及功能信息這箇生物信息學中研究的熱點問題,提齣進化模糊K近鄰算法(Evolutionary Fuzzy K-Nearest Neighbor,EFKNN)直接處理多分類問題的預測模型,用EFKNN及其集成直接從蛋白質序列中預測蛋白質亞覈定位.採用5種特徵提取算法從蛋白質序列中提取特徵,訓練瞭5箇基于EFKNN的基分類器,併根據得票量大小原則集成每箇基分類器的分類結果作為待測樣本的輸齣.將蛋白質亞覈定位預測中常用的數據集SNL9作為訓練集,利用jackknife測試方法預測瞭數據集中每條單定位亞覈蛋白,正確率為70.0%,錶明該模型可以作為蛋白質亞覈定位預測的工具或對現有預測模型和方法的補充.
침대종단백질원시서렬중예측단백질정위급공능신식저개생물신식학중연구적열점문제,제출진화모호K근린산법(Evolutionary Fuzzy K-Nearest Neighbor,EFKNN)직접처리다분류문제적예측모형,용EFKNN급기집성직접종단백질서렬중예측단백질아핵정위.채용5충특정제취산법종단백질서렬중제취특정,훈련료5개기우EFKNN적기분류기,병근거득표량대소원칙집성매개기분류기적분류결과작위대측양본적수출.장단백질아핵정위예측중상용적수거집SNL9작위훈련집,이용jackknife측시방법예측료수거집중매조단정위아핵단백,정학솔위70.0%,표명해모형가이작위단백질아핵정위예측적공구혹대현유예측모형화방법적보충.