软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2004年
2期
179-184
,共6页
散列%ELFhash%URL%均匀分布%Web挖掘%负载平衡
散列%ELFhash%URL%均勻分佈%Web挖掘%負載平衡
산렬%ELFhash%URL%균균분포%Web알굴%부재평형
在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列操作.针对两种典型的应用场合,即Web结构分析中的信息查询和并行搜索引擎中的负载平衡,基于一个含有2000多万个URL的序列,进行了大规模的实验评测.说明在许多文献中推荐的对字符串散列效果很好的ELFhash函数对URL的散列效果并不好,同时推荐了两种对URL散列效果很好的函数.
在Web信息處理的研究中,不少情況下需要對很大的URL序列進行散列操作.針對兩種典型的應用場閤,即Web結構分析中的信息查詢和併行搜索引擎中的負載平衡,基于一箇含有2000多萬箇URL的序列,進行瞭大規模的實驗評測.說明在許多文獻中推薦的對字符串散列效果很好的ELFhash函數對URL的散列效果併不好,同時推薦瞭兩種對URL散列效果很好的函數.
재Web신식처리적연구중,불소정황하수요대흔대적URL서렬진행산렬조작.침대량충전형적응용장합,즉Web결구분석중적신식사순화병행수색인경중적부재평형,기우일개함유2000다만개URL적서렬,진행료대규모적실험평측.설명재허다문헌중추천적대자부천산렬효과흔호적ELFhash함수대URL적산렬효과병불호,동시추천료량충대URL산렬효과흔호적함수.