计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
2期
65-70
,共6页
吴炜%苏永红%李瑞轩%卢正鼎
吳煒%囌永紅%李瑞軒%盧正鼎
오위%소영홍%리서헌%로정정
分布式索引%分布式哈希表%Chord网络
分佈式索引%分佈式哈希錶%Chord網絡
분포식색인%분포식합희표%Chord망락
Distributed index%Distributed hash table%Chord network
针对索引创建和维护效率不高的问题,设计了一种基于DHT(Distrbuted Hash Table)的分布式倒排索引构建算法.该算法利用基于改进的Chord网络的分布式哈希表技术,将分词后的结果分散到多个索引服务器上并行构建索引,同时采用前驱列表定位和减少服务器定位延迟的技术,大大缩短了索引构建时间.通过采用统一调度的基于分块的增量式倒排索引更新策略,索引更新时不再需要移动已有的索引文件,提高了索引更新效率.利用周期性稳定算法和前驱列表定位提高了系统的稳定性、容错性和索引的一致性.
針對索引創建和維護效率不高的問題,設計瞭一種基于DHT(Distrbuted Hash Table)的分佈式倒排索引構建算法.該算法利用基于改進的Chord網絡的分佈式哈希錶技術,將分詞後的結果分散到多箇索引服務器上併行構建索引,同時採用前驅列錶定位和減少服務器定位延遲的技術,大大縮短瞭索引構建時間.通過採用統一調度的基于分塊的增量式倒排索引更新策略,索引更新時不再需要移動已有的索引文件,提高瞭索引更新效率.利用週期性穩定算法和前驅列錶定位提高瞭繫統的穩定性、容錯性和索引的一緻性.
침대색인창건화유호효솔불고적문제,설계료일충기우DHT(Distrbuted Hash Table)적분포식도배색인구건산법.해산법이용기우개진적Chord망락적분포식합희표기술,장분사후적결과분산도다개색인복무기상병행구건색인,동시채용전구렬표정위화감소복무기정위연지적기술,대대축단료색인구건시간.통과채용통일조도적기우분괴적증량식도배색인경신책략,색인경신시불재수요이동이유적색인문건,제고료색인경신효솔.이용주기성은정산법화전구렬표정위제고료계통적은정성、용착성화색인적일치성.
A distributed inverted index's building method based on DHT(Distributed Hash Table)was adopted to improve the index's creating and updating efficiency.The arithmetic,using the DHT technology based on improved Chord network,hashes the terms and their relationalinformation to the distributed index servers and builds the index parallely.This method reduces the index's building time through distributing a task to many nodes.The strategies of scheduling the index building task through chained index management servers and the incremental distributed inverted index updating method were used,which could assure index's consistency and upaating efficiency.