山东大学学报(理学版)
山東大學學報(理學版)
산동대학학보(이학판)
JOURNAL OF SHANDONG UNIVERSITY(NATURAL SCIENCE)
2006年
3期
144-148
,共5页
特征选择%文本分类%类间分布%类内分布
特徵選擇%文本分類%類間分佈%類內分佈
특정선택%문본분류%류간분포%류내분포
随着网上电子文档的急剧增长,文本分类技术在信息检索中的应用变得日益重要.特征维数增加会使样本统计特性的评估变得更加困难,从而降低分类器的泛化能力,出现"过学习"的现象.因此,文档特征的选择和提取是文本分类的必要前提.提出一种基于类别信息的特征选择方法,该方法在尽量保留文档信息的同时,考虑了文档的类别信息.实验表明,这种方法的分类性能比较好,特别是在微平均指标上,与OCFS以及卡方统计量相比有较大幅度的提高.
隨著網上電子文檔的急劇增長,文本分類技術在信息檢索中的應用變得日益重要.特徵維數增加會使樣本統計特性的評估變得更加睏難,從而降低分類器的汎化能力,齣現"過學習"的現象.因此,文檔特徵的選擇和提取是文本分類的必要前提.提齣一種基于類彆信息的特徵選擇方法,該方法在儘量保留文檔信息的同時,攷慮瞭文檔的類彆信息.實驗錶明,這種方法的分類性能比較好,特彆是在微平均指標上,與OCFS以及卡方統計量相比有較大幅度的提高.
수착망상전자문당적급극증장,문본분류기술재신식검색중적응용변득일익중요.특정유수증가회사양본통계특성적평고변득경가곤난,종이강저분류기적범화능력,출현"과학습"적현상.인차,문당특정적선택화제취시문본분류적필요전제.제출일충기우유별신식적특정선택방법,해방법재진량보류문당신식적동시,고필료문당적유별신식.실험표명,저충방법적분류성능비교호,특별시재미평균지표상,여OCFS이급잡방통계량상비유교대폭도적제고.