电子与信息学报
電子與信息學報
전자여신식학보
JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY
2008年
3期
725-729
,共5页
信息检索%查询扩展%语言模型%统计机器翻译
信息檢索%查詢擴展%語言模型%統計機器翻譯
신식검색%사순확전%어언모형%통계궤기번역
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响.该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法.通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展.在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12 %~17% 的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率.
在搜索引擎等實際的信息檢索應用中,用戶提交的查詢請求通常都隻包含很少的幾箇關鍵詞,這會引起相關文檔與用戶查詢之間的詞不匹配問題,對檢索性能有較嚴重的負麵影響.該文在分析瞭查詢產生模型的基礎上,提齣瞭一種新的基于統計機器翻譯的查詢擴展方法.通過統計機器翻譯模型提取文檔集中與查詢詞相關聯的詞,用以進行查詢擴展.在TREC數據集上的試驗結果錶明:基于統計翻譯的查詢擴展方法不僅比不擴展的語言模型方法始終有12 %~17% 的提高,而且比流行的查詢擴展方法-偽反饋也具有可比的平均準確率.
재수색인경등실제적신식검색응용중,용호제교적사순청구통상도지포함흔소적궤개관건사,저회인기상관문당여용호사순지간적사불필배문제,대검색성능유교엄중적부면영향.해문재분석료사순산생모형적기출상,제출료일충신적기우통계궤기번역적사순확전방법.통과통계궤기번역모형제취문당집중여사순사상관련적사,용이진행사순확전.재TREC수거집상적시험결과표명:기우통계번역적사순확전방법불부비불확전적어언모형방법시종유12 %~17% 적제고,이차비류행적사순확전방법-위반궤야구유가비적평균준학솔.