计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2014年
7期
419-424
,共6页
向量空间模型%特征领域权重%词序
嚮量空間模型%特徵領域權重%詞序
향량공간모형%특정영역권중%사서
Vector space model%Text feature-weight%Chinese word order
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题.为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度.使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高.
針對傳統的句子相似度算法在句法結構等方麵存在匹配率低的問題.為提高相似度計算的準確性,提齣瞭一種改進的基于嚮量距離詞序的句子相似度算法,從特徵領域權重和詞序方麵進行改進,通過建立相應的領域特徵集,對于相關領域的特徵項給予更高的權重,同時,在嚮量空間模型的基礎上,引入詞序因子,計算句子詞序相似度.使用包含6箇領域的2651箇句子作為語料庫,實驗結果錶明,改進方法使特徵領域內句子相似度計算的準確度得到提高.
침대전통적구자상사도산법재구법결구등방면존재필배솔저적문제.위제고상사도계산적준학성,제출료일충개진적기우향량거리사서적구자상사도산법,종특정영역권중화사서방면진행개진,통과건립상응적영역특정집,대우상관영역적특정항급여경고적권중,동시,재향량공간모형적기출상,인입사서인자,계산구자사서상사도.사용포함6개영역적2651개구자작위어료고,실험결과표명,개진방법사특정영역내구자상사도계산적준학도득도제고.