现代图书情报技术
現代圖書情報技術
현대도서정보기술
NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE
2004年
7期
27-29,67
,共4页
文本自动分类%支持向量机%K-最邻近法%特征选择
文本自動分類%支持嚮量機%K-最鄰近法%特徵選擇
문본자동분류%지지향량궤%K-최린근법%특정선택
提出了将支持向量机应用于文本自动分类的研究,与常用的K-最邻近法相比,无论是对训练数据集还是测试数据集均具有一定的优势,而且不同特征选择方法对支持向量机的影响要比K-最邻近法小.此外,从研究中的不同特征选择的评价函数来看,它们对分类有一定的影响,应用X2统计进行特征选择的分类正确率最高,其次是文本证据权,而期望交叉熵的效果最差,说明特征选择在文本自动分类中也是相当重要的.
提齣瞭將支持嚮量機應用于文本自動分類的研究,與常用的K-最鄰近法相比,無論是對訓練數據集還是測試數據集均具有一定的優勢,而且不同特徵選擇方法對支持嚮量機的影響要比K-最鄰近法小.此外,從研究中的不同特徵選擇的評價函數來看,它們對分類有一定的影響,應用X2統計進行特徵選擇的分類正確率最高,其次是文本證據權,而期望交扠熵的效果最差,說明特徵選擇在文本自動分類中也是相噹重要的.
제출료장지지향량궤응용우문본자동분류적연구,여상용적K-최린근법상비,무론시대훈련수거집환시측시수거집균구유일정적우세,이차불동특정선택방법대지지향량궤적영향요비K-최린근법소.차외,종연구중적불동특정선택적평개함수래간,타문대분류유일정적영향,응용X2통계진행특정선택적분류정학솔최고,기차시문본증거권,이기망교차적적효과최차,설명특정선택재문본자동분류중야시상당중요적.