计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2004年
11期
75-77
,共3页
自动文本分类 概念层次 VSM WordNet
自動文本分類 概唸層次 VSM WordNet
자동문본분류 개념층차 VSM WordNet
该文意在设计并且实现一个针对英文文本的自动归类以及检索系统,重点在于提高分类方法的准确率.自动文本分类系统中,一般来说文本内容是以N维特征空间的形式存储的,所以特征提取的方法和准确率极大地影响到分类结果的正确率.传统方法是基于词形的,并不考察词语的意义,忽略了同一意义下词形的多样性、不确定性以及词义之间的关系,尤其是上下位关系.该文提出的方法,在向量空间模型(VSM)的基础上,以"概念"为基础,同时考虑词义的上位关系,使得训练过程中可以从词语中提炼出更加概括性的信息,从而达到提高分类精度的目的.
該文意在設計併且實現一箇針對英文文本的自動歸類以及檢索繫統,重點在于提高分類方法的準確率.自動文本分類繫統中,一般來說文本內容是以N維特徵空間的形式存儲的,所以特徵提取的方法和準確率極大地影響到分類結果的正確率.傳統方法是基于詞形的,併不攷察詞語的意義,忽略瞭同一意義下詞形的多樣性、不確定性以及詞義之間的關繫,尤其是上下位關繫.該文提齣的方法,在嚮量空間模型(VSM)的基礎上,以"概唸"為基礎,同時攷慮詞義的上位關繫,使得訓練過程中可以從詞語中提煉齣更加概括性的信息,從而達到提高分類精度的目的.
해문의재설계병차실현일개침대영문문본적자동귀류이급검색계통,중점재우제고분류방법적준학솔.자동문본분류계통중,일반래설문본내용시이N유특정공간적형식존저적,소이특정제취적방법화준학솔겁대지영향도분류결과적정학솔.전통방법시기우사형적,병불고찰사어적의의,홀략료동일의의하사형적다양성、불학정성이급사의지간적관계,우기시상하위관계.해문제출적방법,재향량공간모형(VSM)적기출상,이"개념"위기출,동시고필사의적상위관계,사득훈련과정중가이종사어중제련출경가개괄성적신식,종이체도제고분류정도적목적.