中国图书馆学报
中國圖書館學報
중국도서관학보
The Journal of The Library Science in China
2009年
4期
58~63
,共null页
重要句群 检索性能 检索评价 文献检索 比较研究
重要句群 檢索性能 檢索評價 文獻檢索 比較研究
중요구군 검색성능 검색평개 문헌검색 비교연구
Important sentence groups. Retrieval effectiveness. Retrieval evaluation. Document retrieval. Comparative study.
重要句群是指最能表达文献主题的若干句子的集合,客观性强、生成效率高,可在利用自动文摘成果的基础上基于重要句群进行检索。在对句子进行预处理、文献语词权重计算以及句子权重计算后生成重要句群。利用基于向量模型的方法以及构建检索式和检索提问分别对基于文摘、重要句群和全文的检索性能进行对比分析。实验结果表明,基于重要句群的检索性能总体优于作者文摘,但是低于全文,可以将重要句群作为后台数据或搜索引擎的摘要 等。句子级别的文本处理对提升文本检索效果的作用不大,而把文本处理提升至上下文的语义级别是可能的有效方法。图1。表4。参考文献9。
重要句群是指最能錶達文獻主題的若榦句子的集閤,客觀性彊、生成效率高,可在利用自動文摘成果的基礎上基于重要句群進行檢索。在對句子進行預處理、文獻語詞權重計算以及句子權重計算後生成重要句群。利用基于嚮量模型的方法以及構建檢索式和檢索提問分彆對基于文摘、重要句群和全文的檢索性能進行對比分析。實驗結果錶明,基于重要句群的檢索性能總體優于作者文摘,但是低于全文,可以將重要句群作為後檯數據或搜索引擎的摘要 等。句子級彆的文本處理對提升文本檢索效果的作用不大,而把文本處理提升至上下文的語義級彆是可能的有效方法。圖1。錶4。參攷文獻9。
중요구군시지최능표체문헌주제적약간구자적집합,객관성강、생성효솔고,가재이용자동문적성과적기출상기우중요구군진행검색。재대구자진행예처리、문헌어사권중계산이급구자권중계산후생성중요구군。이용기우향량모형적방법이급구건검색식화검색제문분별대기우문적、중요구군화전문적검색성능진행대비분석。실험결과표명,기우중요구군적검색성능총체우우작자문적,단시저우전문,가이장중요구군작위후태수거혹수색인경적적요 등。구자급별적문본처리대제승문본검색효과적작용불대,이파문본처리제승지상하문적어의급별시가능적유효방법。도1。표4。삼고문헌9。
Important sentence groups are sets of several sentences. It is objective with a high generating efficiency. We can retrieval based on them using results of automatic abstraction. Important sentence groups can be generated after pretreating sentences, weighting literature words and sentences. The paper compares and analysizes abstracts' retrieval effectiveness with sentence groups and full text making use of VSM and constructing search strategy and questions. It concludes the result that the effectiveness of sentence group is better than abstract, worse than full text, which can be used as backstage database or abstract of search engine. However, text processing of sentences level doesn't play a significant role on promoting text retrieval effectiveness. Paragraph retrieval may be a useful approach to improve the effective way. 1 fig. 4 tabs. 9 refs.