重庆理工大学学报(自然科学版)
重慶理工大學學報(自然科學版)
중경리공대학학보(자연과학판)
Journal of Chongqing Institute of Technology
2015年
8期
88-93
,共6页
短文本%词序%公共词块%相似度算法
短文本%詞序%公共詞塊%相似度算法
단문본%사서%공공사괴%상사도산법
short text%words order%common chunks%similarity algorithm
短文本相似度计算是自然语言处理方面的研究热点,传统基于词项的文本相似度算法只考虑了词项因素,忽略了词序对短文本相似性的影响.为此提出了一种基于公共词块的短文本相似度计算方法,综合考虑了词项和词序因素,将基于词项重合的重叠相似度算法与公共词块间的词序相似度算法相结合,并采用自适应的加权组合方式得到短文本相似度值.实验结果显示:与传统算法相比,该算法在稳定性和F值方面都具有较好的结果.
短文本相似度計算是自然語言處理方麵的研究熱點,傳統基于詞項的文本相似度算法隻攷慮瞭詞項因素,忽略瞭詞序對短文本相似性的影響.為此提齣瞭一種基于公共詞塊的短文本相似度計算方法,綜閤攷慮瞭詞項和詞序因素,將基于詞項重閤的重疊相似度算法與公共詞塊間的詞序相似度算法相結閤,併採用自適應的加權組閤方式得到短文本相似度值.實驗結果顯示:與傳統算法相比,該算法在穩定性和F值方麵都具有較好的結果.
단문본상사도계산시자연어언처리방면적연구열점,전통기우사항적문본상사도산법지고필료사항인소,홀략료사서대단문본상사성적영향.위차제출료일충기우공공사괴적단문본상사도계산방법,종합고필료사항화사서인소,장기우사항중합적중첩상사도산법여공공사괴간적사서상사도산법상결합,병채용자괄응적가권조합방식득도단문본상사도치.실험결과현시:여전통산법상비,해산법재은정성화F치방면도구유교호적결과.