计算机与数字工程
計算機與數字工程
계산궤여수자공정
COMPUTER & DIGITAL ENGINEERING
2012年
7期
6-8
,共3页
特征选择%文本分类%类间分散度%类内集中度
特徵選擇%文本分類%類間分散度%類內集中度
특정선택%문본분류%류간분산도%류내집중도
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果.论文首先定义了两种特征分类能力:一种是特征对类间文档的分散程度,该分散度越大越好;另一种是特征对类内文档的聚集程度,该集中度越大越好.然后把这两种特征影响度有机地结合起来设计了一个新的特征选择方法,该方法能够对所选特征进行综合考虑,从而使获得的特征集具有较好的代表性.仿真实验表明所提特征选择方法在一定程度上能够提高文本分类性能.
特徵選擇是文本分類的關鍵步驟之一,所選特徵子集的優劣直接影響文本分類的結果.論文首先定義瞭兩種特徵分類能力:一種是特徵對類間文檔的分散程度,該分散度越大越好;另一種是特徵對類內文檔的聚集程度,該集中度越大越好.然後把這兩種特徵影響度有機地結閤起來設計瞭一箇新的特徵選擇方法,該方法能夠對所選特徵進行綜閤攷慮,從而使穫得的特徵集具有較好的代錶性.倣真實驗錶明所提特徵選擇方法在一定程度上能夠提高文本分類性能.
특정선택시문본분류적관건보취지일,소선특정자집적우렬직접영향문본분류적결과.논문수선정의료량충특정분류능력:일충시특정대류간문당적분산정도,해분산도월대월호;령일충시특정대류내문당적취집정도,해집중도월대월호.연후파저량충특정영향도유궤지결합기래설계료일개신적특정선택방법,해방법능구대소선특정진행종합고필,종이사획득적특정집구유교호적대표성.방진실험표명소제특정선택방법재일정정도상능구제고문본분류성능.