情报学报
情報學報
정보학보
2011年
4期
361-365
,共5页
信息检索%词出现%相关度改进
信息檢索%詞齣現%相關度改進
신식검색%사출현%상관도개진
对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容.本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来.对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法.我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度.实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到34.68%.本文所描述的方法已经应用到TREC 2009的Web Track中.
對信息檢索繫統返迴結果相關度的改進,一直是信息檢索領域重要的研究內容.本文首先引入查詢詞齣現信息的概唸,隨後給齣瞭查詢詞齣現權重的形式化錶示,進而將其與BM25模型結閤起來.對于查詢詞齣現權重的計算,本文採用瞭兩種方法,即線性加權方法和因數加權方法.我們通過在GOV2數據集上的實驗髮現,無論哪種方法,通過加入查詢詞齣現權重,都可以有效的改進檢索結果的相關度.實驗顯示,對于TREC 2005的查詢,MAP值的改進達到15.78%,p@10的改進達到34.68%.本文所描述的方法已經應用到TREC 2009的Web Track中.
대신식검색계통반회결과상관도적개진,일직시신식검색영역중요적연구내용.본문수선인입사순사출현신식적개념,수후급출료사순사출현권중적형식화표시,진이장기여BM25모형결합기래.대우사순사출현권중적계산,본문채용료량충방법,즉선성가권방법화인수가권방법.아문통과재GOV2수거집상적실험발현,무론나충방법,통과가입사순사출현권중,도가이유효적개진검색결과적상관도.실험현시,대우TREC 2005적사순,MAP치적개진체도15.78%,p@10적개진체도34.68%.본문소묘술적방법이경응용도TREC 2009적Web Track중.