计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
4期
200-204,214
,共6页
钟敏娟%万常选%刘德喜%廖述梅%焦贤沛
鐘敏娟%萬常選%劉德喜%廖述梅%焦賢沛
종민연%만상선%류덕희%료술매%초현패
XML查询扩展%扩展源%词共现%XML结构
XML查詢擴展%擴展源%詞共現%XML結構
XML사순확전%확전원%사공현%XML결구
XML query expansion%Expansion source%Word co-occurrence model%XML structural feature
查询词扩展要解决两个方面的问题:一是扩展词的来源,二是如何在来源集合里挑选扩展词项.对此,首先利用检索结果聚类和排序模型获取了较高质量的相关文档集合,并以此作为扩展源;然后结合XML文档的特点,通过词项间的局部共现特征进行查询扩展.相关实验结果表明,一方面,所采用的检索结果聚类和排序模型的相关文档集扩展源具有较高的用户查询相关性,相比传统的伪反馈扩展源,具有更高的质量;另一方面,提出的结合了XML结构特点的词共现查询扩展方案能获得与用户查询意图相关的扩展信息,与初始查询和无结构的词项扩展方法相比,所提方法能够更有效地提高搜索引擎检索性能.
查詢詞擴展要解決兩箇方麵的問題:一是擴展詞的來源,二是如何在來源集閤裏挑選擴展詞項.對此,首先利用檢索結果聚類和排序模型穫取瞭較高質量的相關文檔集閤,併以此作為擴展源;然後結閤XML文檔的特點,通過詞項間的跼部共現特徵進行查詢擴展.相關實驗結果錶明,一方麵,所採用的檢索結果聚類和排序模型的相關文檔集擴展源具有較高的用戶查詢相關性,相比傳統的偽反饋擴展源,具有更高的質量;另一方麵,提齣的結閤瞭XML結構特點的詞共現查詢擴展方案能穫得與用戶查詢意圖相關的擴展信息,與初始查詢和無結構的詞項擴展方法相比,所提方法能夠更有效地提高搜索引擎檢索性能.
사순사확전요해결량개방면적문제:일시확전사적래원,이시여하재래원집합리도선확전사항.대차,수선이용검색결과취류화배서모형획취료교고질량적상관문당집합,병이차작위확전원;연후결합XML문당적특점,통과사항간적국부공현특정진행사순확전.상관실험결과표명,일방면,소채용적검색결과취류화배서모형적상관문당집확전원구유교고적용호사순상관성,상비전통적위반궤확전원,구유경고적질량;령일방면,제출적결합료XML결구특점적사공현사순확전방안능획득여용호사순의도상관적확전신식,여초시사순화무결구적사항확전방법상비,소제방법능구경유효지제고수색인경검색성능.