计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2005年
1期
181-184,220
,共5页
特征项%权重算法%分布信息%低频高权特征%文本分类
特徵項%權重算法%分佈信息%低頻高權特徵%文本分類
특정항%권중산법%분포신식%저빈고권특정%문본분류
文章研究并改进了文本自动分类中的特征权重算法.传统的特征权重算法着重于考虑频率和反文档频率等因素,而未考虑特征的类间、类内分布与低频高权信息.该文重点研究了特征的类间、类内分布,以及低频高权特征对分类的影响,并在此基础上提出了低频高权特征集的构造方法及特征权重的新算法,同时将该算法推广到多层次分类体系.实验证明该算法能有效提高分类的精确度,而且在多级分类中也能取得很好的效果.
文章研究併改進瞭文本自動分類中的特徵權重算法.傳統的特徵權重算法著重于攷慮頻率和反文檔頻率等因素,而未攷慮特徵的類間、類內分佈與低頻高權信息.該文重點研究瞭特徵的類間、類內分佈,以及低頻高權特徵對分類的影響,併在此基礎上提齣瞭低頻高權特徵集的構造方法及特徵權重的新算法,同時將該算法推廣到多層次分類體繫.實驗證明該算法能有效提高分類的精確度,而且在多級分類中也能取得很好的效果.
문장연구병개진료문본자동분류중적특정권중산법.전통적특정권중산법착중우고필빈솔화반문당빈솔등인소,이미고필특정적류간、류내분포여저빈고권신식.해문중점연구료특정적류간、류내분포,이급저빈고권특정대분류적영향,병재차기출상제출료저빈고권특정집적구조방법급특정권중적신산법,동시장해산법추엄도다층차분류체계.실험증명해산법능유효제고분류적정학도,이차재다급분류중야능취득흔호적효과.