沈阳建筑大学学报(自然科学版)
瀋暘建築大學學報(自然科學版)
침양건축대학학보(자연과학판)
JOURNAL OF SHENYANG ARCHITECTURAL AND CIVIL ENGINEERING INSTITUTE
2011年
4期
771-775
,共5页
空间向量模型%文本相似度%Shingling算法%分词
空間嚮量模型%文本相似度%Shingling算法%分詞
공간향량모형%문본상사도%Shingling산법%분사
目的 构造一种新的文本查重算法,改变传统的Shingling网页去重算法,提高文本的相似度计算率,提高查准率和查全率.方法 改变传统的Shingling算法,先删除文本中无意义的虚词,再根据语意对文本进行分片,进而利用文本相似度计算公式对文本相似度进行计算.结果 该算法提高了文本相似度计算的准确性,同时文本的查准率提高了10%左右,查全率提高了5%左右.结论 实验表明,笔者所提算法实现简单、可行、具有良好的文本相似度计算效果,具有一定的优越性.
目的 構造一種新的文本查重算法,改變傳統的Shingling網頁去重算法,提高文本的相似度計算率,提高查準率和查全率.方法 改變傳統的Shingling算法,先刪除文本中無意義的虛詞,再根據語意對文本進行分片,進而利用文本相似度計算公式對文本相似度進行計算.結果 該算法提高瞭文本相似度計算的準確性,同時文本的查準率提高瞭10%左右,查全率提高瞭5%左右.結論 實驗錶明,筆者所提算法實現簡單、可行、具有良好的文本相似度計算效果,具有一定的優越性.
목적 구조일충신적문본사중산법,개변전통적Shingling망혈거중산법,제고문본적상사도계산솔,제고사준솔화사전솔.방법 개변전통적Shingling산법,선산제문본중무의의적허사,재근거어의대문본진행분편,진이이용문본상사도계산공식대문본상사도진행계산.결과 해산법제고료문본상사도계산적준학성,동시문본적사준솔제고료10%좌우,사전솔제고료5%좌우.결론 실험표명,필자소제산법실현간단、가행、구유량호적문본상사도계산효과,구유일정적우월성.