北京石油化工学院学报
北京石油化工學院學報
북경석유화공학원학보
JOURNAL OF BEIJING INSTITUTE OF PETRO-CHEMICAL TECHNOLOGY
2007年
3期
13-17
,共5页
本体%语义距离%词汇语义相似度%简单向量距离%分类
本體%語義距離%詞彙語義相似度%簡單嚮量距離%分類
본체%어의거리%사회어의상사도%간단향량거리%분류
针对传统简单距离分类方法的特征选择未考虑到不同抽象层次上的词汇语义差异,提出了一种基于本体语义的简单向量距离分类方法,在本体库的支持下有效地将语言学知识融合到文本向量空间的表示中,进一步挖掘出特征项概念间的深层语义联系,用得到的语义特征向量作为最终的文本特征向量.同时定义了基于领域本体计算不同抽象层上的语义相似度,并将其应用到简单向量距离分类算法中.在数据集CWT20G上的实验表明:基于本体语义的简单距离分类算法对同义词、多义词、上下位词区分能力更强;并且分类准确率随着语义分析的深入逐步提高.
針對傳統簡單距離分類方法的特徵選擇未攷慮到不同抽象層次上的詞彙語義差異,提齣瞭一種基于本體語義的簡單嚮量距離分類方法,在本體庫的支持下有效地將語言學知識融閤到文本嚮量空間的錶示中,進一步挖掘齣特徵項概唸間的深層語義聯繫,用得到的語義特徵嚮量作為最終的文本特徵嚮量.同時定義瞭基于領域本體計算不同抽象層上的語義相似度,併將其應用到簡單嚮量距離分類算法中.在數據集CWT20G上的實驗錶明:基于本體語義的簡單距離分類算法對同義詞、多義詞、上下位詞區分能力更彊;併且分類準確率隨著語義分析的深入逐步提高.
침대전통간단거리분류방법적특정선택미고필도불동추상층차상적사회어의차이,제출료일충기우본체어의적간단향량거리분류방법,재본체고적지지하유효지장어언학지식융합도문본향량공간적표시중,진일보알굴출특정항개념간적심층어의련계,용득도적어의특정향량작위최종적문본특정향량.동시정의료기우영역본체계산불동추상층상적어의상사도,병장기응용도간단향량거리분류산법중.재수거집CWT20G상적실험표명:기우본체어의적간단거리분류산법대동의사、다의사、상하위사구분능력경강;병차분류준학솔수착어의분석적심입축보제고.