计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
16期
160-162,177
,共4页
特征选择%文本分类%特征分辨率%差别对象时集%属性约简
特徵選擇%文本分類%特徵分辨率%差彆對象時集%屬性約簡
특정선택%문본분류%특정분변솔%차별대상시집%속성약간
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果.首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了特征分辨率的概念,并提出了一个基于差别对象对集的属性约简算法,最后把该属性约简算法同特征分辨率结合起来,提出了一个新的特征选择方法.该方法首先利用特征分辨率进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明此种特征选择方法效果良好.
特徵選擇是文本分類的關鍵步驟之一,所選特徵子集的優劣直接影響文本分類的結果.首先簡單分析瞭幾種經典的特徵選擇方法,總結瞭它們的不足,然後提齣瞭特徵分辨率的概唸,併提齣瞭一箇基于差彆對象對集的屬性約簡算法,最後把該屬性約簡算法同特徵分辨率結閤起來,提齣瞭一箇新的特徵選擇方法.該方法首先利用特徵分辨率進行特徵初選以過濾掉一些詞條來降低特徵空間的稀疏性,然後利用所提屬性約簡算法消除冗餘,從而穫得較具代錶性的特徵子集.實驗結果錶明此種特徵選擇方法效果良好.
특정선택시문본분류적관건보취지일,소선특정자집적우렬직접영향문본분류적결과.수선간단분석료궤충경전적특정선택방법,총결료타문적불족,연후제출료특정분변솔적개념,병제출료일개기우차별대상대집적속성약간산법,최후파해속성약간산법동특정분변솔결합기래,제출료일개신적특정선택방법.해방법수선이용특정분변솔진행특정초선이과려도일사사조래강저특정공간적희소성,연후이용소제속성약간산법소제용여,종이획득교구대표성적특정자집.실험결과표명차충특정선택방법효과량호.