计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2006年
15期
165-167
,共3页
中文特征词自动抽取%文本分类%汉字结合模式
中文特徵詞自動抽取%文本分類%漢字結閤模式
중문특정사자동추취%문본분류%한자결합모식
文章根据主流文本分类模型只对词频敏感、且只关注中高频词条的特点,设计实现了一个基于多步过滤汉字结合模式的无词典特征词自动抽取方法,并通过实验与传统的词典分词法进行了比较,结果表明,这种方法对于中高频词条的识别率接近于词典分词法,而分词速度则远远高于词典分词法,能够满足对大规模开放域文本进行快速特征词自动抽取的需求.
文章根據主流文本分類模型隻對詞頻敏感、且隻關註中高頻詞條的特點,設計實現瞭一箇基于多步過濾漢字結閤模式的無詞典特徵詞自動抽取方法,併通過實驗與傳統的詞典分詞法進行瞭比較,結果錶明,這種方法對于中高頻詞條的識彆率接近于詞典分詞法,而分詞速度則遠遠高于詞典分詞法,能夠滿足對大規模開放域文本進行快速特徵詞自動抽取的需求.
문장근거주류문본분류모형지대사빈민감、차지관주중고빈사조적특점,설계실현료일개기우다보과려한자결합모식적무사전특정사자동추취방법,병통과실험여전통적사전분사법진행료비교,결과표명,저충방법대우중고빈사조적식별솔접근우사전분사법,이분사속도칙원원고우사전분사법,능구만족대대규모개방역문본진행쾌속특정사자동추취적수구.