计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2014年
8期
1704-1718
,共15页
特征选择%支持向量机%相关性%特征子集区分度%特征区分度
特徵選擇%支持嚮量機%相關性%特徵子集區分度%特徵區分度
특정선택%지지향량궤%상관성%특정자집구분도%특정구분도
feature selection%support vector machines%correlation%discernibility of a feature subset%discernibility of a feature
考虑特征之间的相关性对于其类间区分能力的影响,提出了一种新的特征子集区分度衡量准则——DFS(Discernibility of Feature Subsets)准则.该准则考虑特征之间的相关性,通过计算特征子集中全部特征对于分类的联合贡献来判断特征子集的类间辨别能力大小,不再只考虑单个特征对于分类的贡献.结合顺序前向、顺序后向、顺序前向浮动和顺序后向浮动4种特征搜索策略,以支持向量机(Support Vector Machines,SVM)为分类工具,引导特征选择过程,得到4种基于DFS与SVM的特征选择算法.其中在顺序前/后向浮动搜索策略中,首先根据DFS准则加入/去掉特征到特征子集中,然后在浮动阶段根据所得临时SVM分类器的分类性能决定刚加入/去掉特征的去留.UCI机器学习数据库数据集的对比实验测试表明,提出的DFS准则是一种很好的特征子集类间区分能力度量准则;基于DFS与SVM的特征选择算法实现了有效的特征选择;与其他同类算法相比,基于DFS准则与SVM的特征选择算法具有非常好的泛化性能,但其所选特征子集的规模不一定是最好的.
攷慮特徵之間的相關性對于其類間區分能力的影響,提齣瞭一種新的特徵子集區分度衡量準則——DFS(Discernibility of Feature Subsets)準則.該準則攷慮特徵之間的相關性,通過計算特徵子集中全部特徵對于分類的聯閤貢獻來判斷特徵子集的類間辨彆能力大小,不再隻攷慮單箇特徵對于分類的貢獻.結閤順序前嚮、順序後嚮、順序前嚮浮動和順序後嚮浮動4種特徵搜索策略,以支持嚮量機(Support Vector Machines,SVM)為分類工具,引導特徵選擇過程,得到4種基于DFS與SVM的特徵選擇算法.其中在順序前/後嚮浮動搜索策略中,首先根據DFS準則加入/去掉特徵到特徵子集中,然後在浮動階段根據所得臨時SVM分類器的分類性能決定剛加入/去掉特徵的去留.UCI機器學習數據庫數據集的對比實驗測試錶明,提齣的DFS準則是一種很好的特徵子集類間區分能力度量準則;基于DFS與SVM的特徵選擇算法實現瞭有效的特徵選擇;與其他同類算法相比,基于DFS準則與SVM的特徵選擇算法具有非常好的汎化性能,但其所選特徵子集的規模不一定是最好的.
고필특정지간적상관성대우기류간구분능력적영향,제출료일충신적특정자집구분도형량준칙——DFS(Discernibility of Feature Subsets)준칙.해준칙고필특정지간적상관성,통과계산특정자집중전부특정대우분류적연합공헌래판단특정자집적류간변별능력대소,불재지고필단개특정대우분류적공헌.결합순서전향、순서후향、순서전향부동화순서후향부동4충특정수색책략,이지지향량궤(Support Vector Machines,SVM)위분류공구,인도특정선택과정,득도4충기우DFS여SVM적특정선택산법.기중재순서전/후향부동수색책략중,수선근거DFS준칙가입/거도특정도특정자집중,연후재부동계단근거소득림시SVM분류기적분류성능결정강가입/거도특정적거류.UCI궤기학습수거고수거집적대비실험측시표명,제출적DFS준칙시일충흔호적특정자집류간구분능력도량준칙;기우DFS여SVM적특정선택산법실현료유효적특정선택;여기타동류산법상비,기우DFS준칙여SVM적특정선택산법구유비상호적범화성능,단기소선특정자집적규모불일정시최호적.