模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2014年
3期
226-234
,共9页
元数据%子树匹配%语义%文本相似度
元數據%子樹匹配%語義%文本相似度
원수거%자수필배%어의%문본상사도
Metadata%Subtrees Matching%Semantic%Texts Similarity
为降低文本向量维度,提高文本间语义相似度度量性能,综合利用统计方法与语义词典的优势,提出一种文本相似度算法。基于文本生成元数据特征向量,减少向量空间维度,设计基于子树匹配的文本相似度算法,借助子树加速对文本相似度的计算,并通过将文本元数据特征向量与子树进行相似度语义匹配,提高文本相似度计算时语义相似度度量的准确性。该算法考虑到对元数据中同义词的语义理解,加强文本之间相似度度量时的语义覆盖能力。实验结果表明文中所提出的方法是可行和有效的。
為降低文本嚮量維度,提高文本間語義相似度度量性能,綜閤利用統計方法與語義詞典的優勢,提齣一種文本相似度算法。基于文本生成元數據特徵嚮量,減少嚮量空間維度,設計基于子樹匹配的文本相似度算法,藉助子樹加速對文本相似度的計算,併通過將文本元數據特徵嚮量與子樹進行相似度語義匹配,提高文本相似度計算時語義相似度度量的準確性。該算法攷慮到對元數據中同義詞的語義理解,加彊文本之間相似度度量時的語義覆蓋能力。實驗結果錶明文中所提齣的方法是可行和有效的。
위강저문본향량유도,제고문본간어의상사도도량성능,종합이용통계방법여어의사전적우세,제출일충문본상사도산법。기우문본생성원수거특정향량,감소향량공간유도,설계기우자수필배적문본상사도산법,차조자수가속대문본상사도적계산,병통과장문본원수거특정향량여자수진행상사도어의필배,제고문본상사도계산시어의상사도도량적준학성。해산법고필도대원수거중동의사적어의리해,가강문본지간상사도도량시적어의복개능력。실험결과표명문중소제출적방법시가행화유효적。
To reduce the dimensionality of text vectors and improve the performance of semantic similarity measurement, an algorithm for texts similarity computation is proposed, which combines the advantages of the statistical methods and semantic dictionary. The texts are utilized to generate metadata feature vectors, so that it reduces the dimensionality of text vectors space. The algorithm for computing texts similarity is designed based on subtrees matching and the speed of computing texts similarity is improved. The accuracy of texts semantic similarity measurement is improved by utilizing the semantic matching of metadata feature vectors and subtrees. The synonyms widely existing in metadata are processed by the proposed method, and the semantic coverage ability for similarity computation of texts is also enhanced. The experimental results show that the proposed method is feasible and effective.