计算机与网络
計算機與網絡
계산궤여망락
CHINA COMPUTER & NETWORK
2012年
17期
56-58
,共3页
文本分类%词语相关度网络%简监督%领域词语
文本分類%詞語相關度網絡%簡鑑督%領域詞語
문본분류%사어상관도망락%간감독%영역사어
text categorization%word correlation net%simple-supervised%domain word
传统的基于规则或统计的文本分类方法存在许多问题。本文利用词语相关度网络提供的大量词语语义知识设计一种“简监督”文本分类方法,从理论和技术上解决文本分类问题,以求在认知心理符合程度、人工标注困难等层面上克服传统方法的缺陷。实验证明文章设计的方法计算结果较为准确,具有一定的可行性和应用前景。
傳統的基于規則或統計的文本分類方法存在許多問題。本文利用詞語相關度網絡提供的大量詞語語義知識設計一種“簡鑑督”文本分類方法,從理論和技術上解決文本分類問題,以求在認知心理符閤程度、人工標註睏難等層麵上剋服傳統方法的缺陷。實驗證明文章設計的方法計算結果較為準確,具有一定的可行性和應用前景。
전통적기우규칙혹통계적문본분류방법존재허다문제。본문이용사어상관도망락제공적대량사어어의지식설계일충“간감독”문본분류방법,종이론화기술상해결문본분류문제,이구재인지심리부합정도、인공표주곤난등층면상극복전통방법적결함。실험증명문장설계적방법계산결과교위준학,구유일정적가행성화응용전경。
There are many problems in traditional text categorization based on rules or statistics. To solve these problems from theoretical and practical aspect, this paper designs a new method named simple-supervised text categorization based on word correlation net, which can overcome the traditional deficiencies on levels of cognitive psychology and words tagging. Experiments show that our method performs better than others and has a promising prospect.