计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2013年
z2期
121-131
,共11页
多版本文档%top-k查询%时态查询%文书类档案%多版本查询
多版本文檔%top-k查詢%時態查詢%文書類檔案%多版本查詢
다판본문당%top-k사순%시태사순%문서류당안%다판본사순
versioned documents%top-k search%temporal queries%document archive%time-travel search
提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不同的权重.针对这一问题,把现有时空查询和针对多版本文档查询的方法进行扩展,使其支持加权持久性top-k检索问题,并分析总结了该方法的缺点,进而又提出了一种新的基于时间区间窗口的算法.基于时间区间窗口的算法能够支持多种经典top-k算法并有效地解决加权持久性top-k检索问题.最后使用Wikipedia多版本数据进行了一系列性能试验,对比测试了基于区间窗口的算法和扩展算法.结果表明区间窗口算法在各个测试下的效率和可扩展性明显优于扩展算法.
提齣併研究瞭針對海量多版本文檔的加權持久性top-k檢索問題.加權持久性top-k檢索能夠返迴在一箇限定時間區間內與查詢關鍵詞組持續相關的k箇結果,併且攷慮不同時間區間有不同的權重.針對這一問題,把現有時空查詢和針對多版本文檔查詢的方法進行擴展,使其支持加權持久性top-k檢索問題,併分析總結瞭該方法的缺點,進而又提齣瞭一種新的基于時間區間窗口的算法.基于時間區間窗口的算法能夠支持多種經典top-k算法併有效地解決加權持久性top-k檢索問題.最後使用Wikipedia多版本數據進行瞭一繫列性能試驗,對比測試瞭基于區間窗口的算法和擴展算法.結果錶明區間窗口算法在各箇測試下的效率和可擴展性明顯優于擴展算法.
제출병연구료침대해량다판본문당적가권지구성top-k검색문제.가권지구성top-k검색능구반회재일개한정시간구간내여사순관건사조지속상관적k개결과,병차고필불동시간구간유불동적권중.침대저일문제,파현유시공사순화침대다판본문당사순적방법진행확전,사기지지가권지구성top-k검색문제,병분석총결료해방법적결점,진이우제출료일충신적기우시간구간창구적산법.기우시간구간창구적산법능구지지다충경전top-k산법병유효지해결가권지구성top-k검색문제.최후사용Wikipedia다판본수거진행료일계렬성능시험,대비측시료기우구간창구적산법화확전산법.결과표명구간창구산법재각개측시하적효솔화가확전성명현우우확전산법.