情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2012年
7期
182-186
,共5页
加权语义网%特征项%文本相似度%语义关系
加權語義網%特徵項%文本相似度%語義關繫
가권어의망%특정항%문본상사도%어의관계
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.
基于詞頻統計思想的傳統文本相似度算法,往往隻攷慮特徵項在文本中的權重,而忽視瞭特徵項之間的語義關繫.綜閤攷慮瞭特徵項在文本中的重要程度以及特徵項之間的語義關繫,提齣構建文本特徵項的加權語義網模型來計算文本之間的相似度,併在模型構建的過程中,對特徵項的選取、權值計算做瞭適噹的改進.最後用實驗驗證瞭基于加權語義網的文本相似度算法相較于傳統的算法,相似度計算的精確度有瞭進一步的提高.
기우사빈통계사상적전통문본상사도산법,왕왕지고필특정항재문본중적권중,이홀시료특정항지간적어의관계.종합고필료특정항재문본중적중요정도이급특정항지간적어의관계,제출구건문본특정항적가권어의망모형래계산문본지간적상사도,병재모형구건적과정중,대특정항적선취、권치계산주료괄당적개진.최후용실험험증료기우가권어의망적문본상사도산법상교우전통적산법,상사도계산적정학도유료진일보적제고.