中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
6期
19-26
,共8页
查询结果缓存%用户特性%性能优化
查詢結果緩存%用戶特性%性能優化
사순결과완존%용호특성%성능우화
针对搜索引擎查询结果缓存与预取问题,与传统的基于查询特性相关的方法不同,提出了一种基于用户特性的缓存与预取方法,用于提高搜索引擎系统性能,尤其针对部分用户效果更显著.通过对国内某著名商业搜索引擎用户的查询贡献分析得出,用户对搜索引擎的贡献具有长尾分布特性,结合该特性设计查询结果预测模型来进行预取和分区缓存.在该搜索引擎两个月的大规模真实用户查询日志上的实验结果表明,与传统的基于查询特性的典型方法相比,该方法可以获得3.03%~4.17%的命中率提升,对于查询贡献最大的0.25%的用户群体,可以获得20.52%~28.2%的命中率提升.
針對搜索引擎查詢結果緩存與預取問題,與傳統的基于查詢特性相關的方法不同,提齣瞭一種基于用戶特性的緩存與預取方法,用于提高搜索引擎繫統性能,尤其針對部分用戶效果更顯著.通過對國內某著名商業搜索引擎用戶的查詢貢獻分析得齣,用戶對搜索引擎的貢獻具有長尾分佈特性,結閤該特性設計查詢結果預測模型來進行預取和分區緩存.在該搜索引擎兩箇月的大規模真實用戶查詢日誌上的實驗結果錶明,與傳統的基于查詢特性的典型方法相比,該方法可以穫得3.03%~4.17%的命中率提升,對于查詢貢獻最大的0.25%的用戶群體,可以穫得20.52%~28.2%的命中率提升.
침대수색인경사순결과완존여예취문제,여전통적기우사순특성상관적방법불동,제출료일충기우용호특성적완존여예취방법,용우제고수색인경계통성능,우기침대부분용호효과경현저.통과대국내모저명상업수색인경용호적사순공헌분석득출,용호대수색인경적공헌구유장미분포특성,결합해특성설계사순결과예측모형래진행예취화분구완존.재해수색인경량개월적대규모진실용호사순일지상적실험결과표명,여전통적기우사순특성적전형방법상비,해방법가이획득3.03%~4.17%적명중솔제승,대우사순공헌최대적0.25%적용호군체,가이획득20.52%~28.2%적명중솔제승.