计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2014年
4期
103-106
,共4页
数据挖掘%特征选择%集成学习%互信息%Bagging%分类器
數據挖掘%特徵選擇%集成學習%互信息%Bagging%分類器
수거알굴%특정선택%집성학습%호신식%Bagging%분류기
data mining%feature selection%ensemble learning%mutual information%Bagging%classifier
为了提高数据的分类性能,提出了一种基于特征选择的Bagging分类算法。通过Fisher准则和互信息的方法给定一种能够直接评价特征区分度和与类别相关性的评价方法,重新构造了计算特征区分度和与类别相关性的计算公式。并将该方法应用到Bagging分类算法当中。实现了算法迭代过程中的特征选择,使得每个基分类器都是由不同的特征子集训练所得,保证了基分类器的独立性,降低了训练误差。通过理论分析和大量的实验,对文中的方法与经典特征选择方法进行了比较,实验结果显示文中的方法能够得到更高的预测精准度。
為瞭提高數據的分類性能,提齣瞭一種基于特徵選擇的Bagging分類算法。通過Fisher準則和互信息的方法給定一種能夠直接評價特徵區分度和與類彆相關性的評價方法,重新構造瞭計算特徵區分度和與類彆相關性的計算公式。併將該方法應用到Bagging分類算法噹中。實現瞭算法迭代過程中的特徵選擇,使得每箇基分類器都是由不同的特徵子集訓練所得,保證瞭基分類器的獨立性,降低瞭訓練誤差。通過理論分析和大量的實驗,對文中的方法與經典特徵選擇方法進行瞭比較,實驗結果顯示文中的方法能夠得到更高的預測精準度。
위료제고수거적분류성능,제출료일충기우특정선택적Bagging분류산법。통과Fisher준칙화호신식적방법급정일충능구직접평개특정구분도화여유별상관성적평개방법,중신구조료계산특정구분도화여유별상관성적계산공식。병장해방법응용도Bagging분류산법당중。실현료산법질대과정중적특정선택,사득매개기분류기도시유불동적특정자집훈련소득,보증료기분류기적독립성,강저료훈련오차。통과이론분석화대량적실험,대문중적방법여경전특정선택방법진행료비교,실험결과현시문중적방법능구득도경고적예측정준도。
In order to improve the classification performance of data,a Bagging classification algorithm based on feature selection is pro-posed in this paper. An evaluation method is proposed for full account of the discrimination and class information of each feature by the Fisher criterion and mutual information,built on the formula about discrimination and class information. The feature selection algorithm is applied to the Bagging classification algorithm. The feature selection is implemented in the iterative process of algorithm,so that each base classifier is trained by different feature subsets,which ensures the independence of each base classifier,reducing the training error. Com-pared the method with several classical feature selection methods by theoretical analysis and extensive experiments,the results show that the method can achieve higher predictive accuracy.