中文信息学报
中文信息學報
중문신식학보
Journal of Chinese Information Processing
2015年
4期
183-191
,共9页
龚小龙%王明文%万剑怡%王晓庆
龔小龍%王明文%萬劍怡%王曉慶
공소룡%왕명문%만검이%왕효경
语义位置语言模型%Dirichlet平滑%邻近度信息%检索模型
語義位置語言模型%Dirichlet平滑%鄰近度信息%檢索模型
어의위치어언모형%Dirichlet평활%린근도신식%검색모형
semantic positional language models%Dirichlet smooth%proximity information%retrieval model
在传统的检索模型中,文档与查询的匹配计算主要考虑词项的统计特征,如词频、逆文档频率和文档长度,近年来的研究表明应用查询词项匹配在文档中的位置信息可以提高查询结果的准确性.如何更好地刻画查询词在文档中的位置信息并建模,是研究提高检索效果的问题之一.该文在结合语义的位置语言模型(SPLM)的基础上进一步考虑了词的邻近信息,并给出了用狄利克雷先验分布来计算邻近度的平滑策略,提出了结合邻近度的位置语言检索模型.在标准数据上的实验结果表明,提出的检索模型在性能上要优于结合语义的位置语言模型.
在傳統的檢索模型中,文檔與查詢的匹配計算主要攷慮詞項的統計特徵,如詞頻、逆文檔頻率和文檔長度,近年來的研究錶明應用查詢詞項匹配在文檔中的位置信息可以提高查詢結果的準確性.如何更好地刻畫查詢詞在文檔中的位置信息併建模,是研究提高檢索效果的問題之一.該文在結閤語義的位置語言模型(SPLM)的基礎上進一步攷慮瞭詞的鄰近信息,併給齣瞭用狄利剋雷先驗分佈來計算鄰近度的平滑策略,提齣瞭結閤鄰近度的位置語言檢索模型.在標準數據上的實驗結果錶明,提齣的檢索模型在性能上要優于結閤語義的位置語言模型.
재전통적검색모형중,문당여사순적필배계산주요고필사항적통계특정,여사빈、역문당빈솔화문당장도,근년래적연구표명응용사순사항필배재문당중적위치신식가이제고사순결과적준학성.여하경호지각화사순사재문당중적위치신식병건모,시연구제고검색효과적문제지일.해문재결합어의적위치어언모형(SPLM)적기출상진일보고필료사적린근신식,병급출료용적리극뢰선험분포래계산린근도적평활책략,제출료결합린근도적위치어언검색모형.재표준수거상적실험결과표명,제출적검색모형재성능상요우우결합어의적위치어언모형.