计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2009年
3期
624-626,630
,共4页
词共现%向量空间模型%规则重构%关联分类%文本分类
詞共現%嚮量空間模型%規則重構%關聯分類%文本分類
사공현%향량공간모형%규칙중구%관련분류%문본분류
研究了现有的关联分类算法在文本分类中的应用,发现对于有结构的文本数据,关联分类算法未考虑文本的语义信息导致分类精度不够理想,为此提出了基于规则重构的关联文本分类方法.该方法利用词共现模型,在已挖掘的分类规则基础上,将具有高共现程度的词对组合在一起进行规则重构,形成了有结构的带有文本语义信息的分类规则,再利用它们对新文本进行分类.实验结果表明,该方法在分类精度上优于其它的关联文本分类方法(ARC).
研究瞭現有的關聯分類算法在文本分類中的應用,髮現對于有結構的文本數據,關聯分類算法未攷慮文本的語義信息導緻分類精度不夠理想,為此提齣瞭基于規則重構的關聯文本分類方法.該方法利用詞共現模型,在已挖掘的分類規則基礎上,將具有高共現程度的詞對組閤在一起進行規則重構,形成瞭有結構的帶有文本語義信息的分類規則,再利用它們對新文本進行分類.實驗結果錶明,該方法在分類精度上優于其它的關聯文本分類方法(ARC).
연구료현유적관련분류산법재문본분류중적응용,발현대우유결구적문본수거,관련분류산법미고필문본적어의신식도치분류정도불구이상,위차제출료기우규칙중구적관련문본분류방법.해방법이용사공현모형,재이알굴적분류규칙기출상,장구유고공현정도적사대조합재일기진행규칙중구,형성료유결구적대유문본어의신식적분류규칙,재이용타문대신문본진행분류.실험결과표명,해방법재분류정도상우우기타적관련문본분류방법(ARC).