计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
36期
238-244
,共7页
信号肽预测%不平衡数据集%聚类划分%概率神经网络%多分类器融合
信號肽預測%不平衡數據集%聚類劃分%概率神經網絡%多分類器融閤
신호태예측%불평형수거집%취류화분%개솔신경망락%다분류기융합
在信号肽预测问题中,由于信号肽序列长度不等且氨基酸组成具有多样性的特点,以往方法通常采用滑动窗口进行处理,从而导致了信息丢失以及数据不平衡等问题.为改善少数类预测效果,对训练数据进行了预处理,将多数类样本数据划分,生成的各组样本分别与少数类样本合并组成若干个数据子集,在两种蛋白质编码方案下采用概率神经网络建立多个分类器,采用加权投票将多分类器集成的方法预测信号肽.在目前广泛使用的Neilsen数据集上进行实验,表明该方法具有一定的有效性.
在信號肽預測問題中,由于信號肽序列長度不等且氨基痠組成具有多樣性的特點,以往方法通常採用滑動窗口進行處理,從而導緻瞭信息丟失以及數據不平衡等問題.為改善少數類預測效果,對訓練數據進行瞭預處理,將多數類樣本數據劃分,生成的各組樣本分彆與少數類樣本閤併組成若榦箇數據子集,在兩種蛋白質編碼方案下採用概率神經網絡建立多箇分類器,採用加權投票將多分類器集成的方法預測信號肽.在目前廣汎使用的Neilsen數據集上進行實驗,錶明該方法具有一定的有效性.
재신호태예측문제중,유우신호태서렬장도불등차안기산조성구유다양성적특점,이왕방법통상채용활동창구진행처리,종이도치료신식주실이급수거불평형등문제.위개선소수류예측효과,대훈련수거진행료예처리,장다수류양본수거화분,생성적각조양본분별여소수류양본합병조성약간개수거자집,재량충단백질편마방안하채용개솔신경망락건립다개분류기,채용가권투표장다분류기집성적방법예측신호태.재목전엄범사용적Neilsen수거집상진행실험,표명해방법구유일정적유효성.