华南理工大学学报(自然科学版)
華南理工大學學報(自然科學版)
화남리공대학학보(자연과학판)
JOURNAL OF SOUTH CHINA UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE EDITION)
2011年
4期
1-6
,共6页
搜索引擎%倒排索引%静态索引剪枝%文档重要度
搜索引擎%倒排索引%靜態索引剪枝%文檔重要度
수색인경%도배색인%정태색인전지%문당중요도
针对网页质量参差不齐、重要程度差别巨大的问题,提出了按照网页重要程度确定其剪枝幅度的静态索引剪枝方法,并在GOV2数据集上进行了验证.实验结果表明:这种方法体现了静态索引剪枝能极大降低存储需求、提高查询效率的优点;当剪枝后的索引大小是原始大小的13%时,P@10、P@20值能达到甚至超过使用完整索引时的结果;在相同的剪枝幅度下,P@10、P@20和MAP都明显好于以往的剪枝方法.
針對網頁質量參差不齊、重要程度差彆巨大的問題,提齣瞭按照網頁重要程度確定其剪枝幅度的靜態索引剪枝方法,併在GOV2數據集上進行瞭驗證.實驗結果錶明:這種方法體現瞭靜態索引剪枝能極大降低存儲需求、提高查詢效率的優點;噹剪枝後的索引大小是原始大小的13%時,P@10、P@20值能達到甚至超過使用完整索引時的結果;在相同的剪枝幅度下,P@10、P@20和MAP都明顯好于以往的剪枝方法.
침대망혈질량삼차불제、중요정도차별거대적문제,제출료안조망혈중요정도학정기전지폭도적정태색인전지방법,병재GOV2수거집상진행료험증.실험결과표명:저충방법체현료정태색인전지능겁대강저존저수구、제고사순효솔적우점;당전지후적색인대소시원시대소적13%시,P@10、P@20치능체도심지초과사용완정색인시적결과;재상동적전지폭도하,P@10、P@20화MAP도명현호우이왕적전지방법.