计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2010年
22期
184-186
,共3页
特征选择%交叉熵%文本分类%关联挖掘
特徵選擇%交扠熵%文本分類%關聯挖掘
특정선택%교차적%문본분류%관련알굴
提出一种在选取特征时考虑特征与特征之间联系的算法.对特征词之间的关联关系进行挖掘,找出那些对类别有重要影响的特征词组,而这些特征词组中的每个单词在传统单独打分策略的特征选择算法中很可能会因分值过低而被丢弃.在Ruters21578、20Newsgroup文本数据集上进行实验,将算法与广泛应用的特征选择算法(信息增益、CHI 等)进行对比、分析.实验结果表明该方法是一种有特点、有效的特征选择方法.
提齣一種在選取特徵時攷慮特徵與特徵之間聯繫的算法.對特徵詞之間的關聯關繫進行挖掘,找齣那些對類彆有重要影響的特徵詞組,而這些特徵詞組中的每箇單詞在傳統單獨打分策略的特徵選擇算法中很可能會因分值過低而被丟棄.在Ruters21578、20Newsgroup文本數據集上進行實驗,將算法與廣汎應用的特徵選擇算法(信息增益、CHI 等)進行對比、分析.實驗結果錶明該方法是一種有特點、有效的特徵選擇方法.
제출일충재선취특정시고필특정여특정지간련계적산법.대특정사지간적관련관계진행알굴,조출나사대유별유중요영향적특정사조,이저사특정사조중적매개단사재전통단독타분책략적특정선택산법중흔가능회인분치과저이피주기.재Ruters21578、20Newsgroup문본수거집상진행실험,장산법여엄범응용적특정선택산법(신식증익、CHI 등)진행대비、분석.실험결과표명해방법시일충유특점、유효적특정선택방법.