计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
26期
146-150
,共5页
文档拓扑%相似性搜索%相似度
文檔拓撲%相似性搜索%相似度
문당탁복%상사성수색%상사도
从海量文档中快速有效地搜索到相似文档是一个重要且耗时的问题.现有的文档相似性搜索算法是先找出候选文档集,再对候选文档进行相关性排序,找出最相关的文档.提出了一种基于文档拓扑的相似性搜索算法-Hub-N,将文档相似性搜索问题转化为图搜索问题,应用相应的剪枝技术,缩小了扫描文档的范围,提高了搜索效率.通过实验验证了算法的有效性和可行性.
從海量文檔中快速有效地搜索到相似文檔是一箇重要且耗時的問題.現有的文檔相似性搜索算法是先找齣候選文檔集,再對候選文檔進行相關性排序,找齣最相關的文檔.提齣瞭一種基于文檔拓撲的相似性搜索算法-Hub-N,將文檔相似性搜索問題轉化為圖搜索問題,應用相應的剪枝技術,縮小瞭掃描文檔的範圍,提高瞭搜索效率.通過實驗驗證瞭算法的有效性和可行性.
종해량문당중쾌속유효지수색도상사문당시일개중요차모시적문제.현유적문당상사성수색산법시선조출후선문당집,재대후선문당진행상관성배서,조출최상관적문당.제출료일충기우문당탁복적상사성수색산법-Hub-N,장문당상사성수색문제전화위도수색문제,응용상응적전지기술,축소료소묘문당적범위,제고료수색효솔.통과실험험증료산법적유효성화가행성.