计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
1期
57-61
,共5页
Web页面网络%相似度搜索%SimRank
Web頁麵網絡%相似度搜索%SimRank
Web혈면망락%상사도수색%SimRank
Web page network%Similarity search%SimRank
Web页面相似度搜索对于网络新闻推荐、近似查询等研究领域具有重要作用。SimRank是经典的相似度计算模型,但其预计算时间和空间开销非常巨大,不适用大规模Web页面网络。利用SimRank快速收敛的特点,在SimRank基础上提出高效Web页面相似度搜索方法(WSR),预计算1步迭代相似度矩阵,根据预计算的1步迭代相似度矩阵在线计算给定查询页面和其他页面的2步迭代相似度。通过对Web网络进行静态剪枝,进一步提高预计算和在线查询处理的效率。实验结果显示,WSR显著降低了存储开销和预计算时间开销,且具有较高精确度和快速查询响应时间。
Web頁麵相似度搜索對于網絡新聞推薦、近似查詢等研究領域具有重要作用。SimRank是經典的相似度計算模型,但其預計算時間和空間開銷非常巨大,不適用大規模Web頁麵網絡。利用SimRank快速收斂的特點,在SimRank基礎上提齣高效Web頁麵相似度搜索方法(WSR),預計算1步迭代相似度矩陣,根據預計算的1步迭代相似度矩陣在線計算給定查詢頁麵和其他頁麵的2步迭代相似度。通過對Web網絡進行靜態剪枝,進一步提高預計算和在線查詢處理的效率。實驗結果顯示,WSR顯著降低瞭存儲開銷和預計算時間開銷,且具有較高精確度和快速查詢響應時間。
Web혈면상사도수색대우망락신문추천、근사사순등연구영역구유중요작용。SimRank시경전적상사도계산모형,단기예계산시간화공간개소비상거대,불괄용대규모Web혈면망락。이용SimRank쾌속수렴적특점,재SimRank기출상제출고효Web혈면상사도수색방법(WSR),예계산1보질대상사도구진,근거예계산적1보질대상사도구진재선계산급정사순혈면화기타혈면적2보질대상사도。통과대Web망락진행정태전지,진일보제고예계산화재선사순처리적효솔。실험결과현시,WSR현저강저료존저개소화예계산시간개소,차구유교고정학도화쾌속사순향응시간。
Web pages similarity search plays important role in many research fields such as Web news recommendation and approximate query,etc.SimRank is a classical similarity computation model,however,it is not adaptable to large Webpage networks because its space and time cost is very high.Utilising the characteristic of SimRank in fast convergence,we propose an efficient Web pages similarity search (WSR)method.It pre-computes 1-hop iterative similarity matrix,and then conducts online computation of 2-hop iterative similarities of the given querying pages and other pages according to the computed 1-hop iterative similarity matrix.The pre-computation and online query processing efficiencies are further improved by static pruning on Web network.Experimental result shows that the WSR evidently reduces the storage cost and pre-computation time cost,and has higher accuracy and fast query responding time.