计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2015年
4期
6-9
,共4页
文本相似度%语义%《知网》%关键词%段频
文本相似度%語義%《知網》%關鍵詞%段頻
문본상사도%어의%《지망》%관건사%단빈
text similarity%semantic%HowNet%keywords%paragraph frequency
利用《知网》计算词语的语义相似度,通过提取关键词进行文本相似度计算.将文本分词并过滤停用词后,结合词语的词性、词频和段频计算词语的权值,以便提取文本的关键词,通过计算关键词之间的相似度来计算文本之间的相似度值.实验结果与对比值进行差异显著性分析表明,本文提出的方法相比传统的语义算法和向量空间模型算法,其精确性有了进一步的提高.
利用《知網》計算詞語的語義相似度,通過提取關鍵詞進行文本相似度計算.將文本分詞併過濾停用詞後,結閤詞語的詞性、詞頻和段頻計算詞語的權值,以便提取文本的關鍵詞,通過計算關鍵詞之間的相似度來計算文本之間的相似度值.實驗結果與對比值進行差異顯著性分析錶明,本文提齣的方法相比傳統的語義算法和嚮量空間模型算法,其精確性有瞭進一步的提高.
이용《지망》계산사어적어의상사도,통과제취관건사진행문본상사도계산.장문본분사병과려정용사후,결합사어적사성、사빈화단빈계산사어적권치,이편제취문본적관건사,통과계산관건사지간적상사도래계산문본지간적상사도치.실험결과여대비치진행차이현저성분석표명,본문제출적방법상비전통적어의산법화향량공간모형산법,기정학성유료진일보적제고.