计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2009年
3期
843-845
,共3页
短文本分类%关联规则挖掘%特征扩展
短文本分類%關聯規則挖掘%特徵擴展
단문본분류%관련규칙알굴%특정확전
针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法.该方法首先利用FP-Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展.同时,引入语义信息并且改进了知网中DEF词条的描述能力公式,在此基础上对中文短文本进行分类.实验证明,这种方法具有高的分类性能,其微平均和宏平均值都高于常规的文本分类方法.
針對短文本所描述信號弱的特點,提齣一種基于特徵擴展的中文短文本分類方法.該方法首先利用FP-Growth算法挖掘訓練集特徵項與測試集特徵項之間的共現關繫,然後用得到的關聯規則對短文本測試文檔中的概唸詞語進行特徵擴展.同時,引入語義信息併且改進瞭知網中DEF詞條的描述能力公式,在此基礎上對中文短文本進行分類.實驗證明,這種方法具有高的分類性能,其微平均和宏平均值都高于常規的文本分類方法.
침대단문본소묘술신호약적특점,제출일충기우특정확전적중문단문본분류방법.해방법수선이용FP-Growth산법알굴훈련집특정항여측시집특정항지간적공현관계,연후용득도적관련규칙대단문본측시문당중적개념사어진행특정확전.동시,인입어의신식병차개진료지망중DEF사조적묘술능력공식,재차기출상대중문단문본진행분류.실험증명,저충방법구유고적분류성능,기미평균화굉평균치도고우상규적문본분류방법.