现代计算机(专业版)
現代計算機(專業版)
현대계산궤(전업판)
MODERN COMPUTER
2010年
7期
28-31
,共4页
短文本分类%共现关系%特征扩展
短文本分類%共現關繫%特徵擴展
단문본분류%공현관계%특정확전
区别于传统的基于词的中文短文本自动分类方法,以训练数据作为背景语料,利用关联规则挖掘算法挖掘训练集文本中的共现关系,创建特征共现集作为扩展词表.用特征共现集分别对训练文本和测试文本进行特征扩展建立短文本分类模型.实验表明,改进后的两种方法使短文本分类系统具有较高的精度.
區彆于傳統的基于詞的中文短文本自動分類方法,以訓練數據作為揹景語料,利用關聯規則挖掘算法挖掘訓練集文本中的共現關繫,創建特徵共現集作為擴展詞錶.用特徵共現集分彆對訓練文本和測試文本進行特徵擴展建立短文本分類模型.實驗錶明,改進後的兩種方法使短文本分類繫統具有較高的精度.
구별우전통적기우사적중문단문본자동분류방법,이훈련수거작위배경어료,이용관련규칙알굴산법알굴훈련집문본중적공현관계,창건특정공현집작위확전사표.용특정공현집분별대훈련문본화측시문본진행특정확전건립단문본분류모형.실험표명,개진후적량충방법사단문본분류계통구유교고적정도.