科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2013年
29期
8651-8656
,共6页
向量空间模型%广义向量空间模型%正交特征项%《知网》%文本语义相似度
嚮量空間模型%廣義嚮量空間模型%正交特徵項%《知網》%文本語義相似度
향량공간모형%엄의향량공간모형%정교특정항%《지망》%문본어의상사도
VSM%GVSM%orthogonal term%HowNet%text semantic similarity
针对向量空间模型特征项正交的假设和缺乏语义的缺点,在广义向量空间模型的基础上,提出了一种基于《知网》义原的向量空间模型,利用义原的相似度实现文本相似度的计算.通过文本特征项的TF-IDF权重将文本表示为《知网》义原空间中的向量,并利用义原向量之间的夹角实现对文本相似度的计算.通过文本聚类实验对比了本文提出的方法与VSM和GVSM模型,实验结果表明本文提出的方法在语义相似度计算方面相比GVSM和VSM有所提高.
針對嚮量空間模型特徵項正交的假設和缺乏語義的缺點,在廣義嚮量空間模型的基礎上,提齣瞭一種基于《知網》義原的嚮量空間模型,利用義原的相似度實現文本相似度的計算.通過文本特徵項的TF-IDF權重將文本錶示為《知網》義原空間中的嚮量,併利用義原嚮量之間的夾角實現對文本相似度的計算.通過文本聚類實驗對比瞭本文提齣的方法與VSM和GVSM模型,實驗結果錶明本文提齣的方法在語義相似度計算方麵相比GVSM和VSM有所提高.
침대향량공간모형특정항정교적가설화결핍어의적결점,재엄의향량공간모형적기출상,제출료일충기우《지망》의원적향량공간모형,이용의원적상사도실현문본상사도적계산.통과문본특정항적TF-IDF권중장문본표시위《지망》의원공간중적향량,병이용의원향량지간적협각실현대문본상사도적계산.통과문본취류실험대비료본문제출적방법여VSM화GVSM모형,실험결과표명본문제출적방법재어의상사도계산방면상비GVSM화VSM유소제고.