中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2015年
2期
10-23
,共14页
卫冰洁%王斌%张帅%李鹏
衛冰潔%王斌%張帥%李鵬
위빙길%왕빈%장수%리붕
微博检索%时间信息%微博特性%文本表示%文档先验%查询扩展
微博檢索%時間信息%微博特性%文本錶示%文檔先驗%查詢擴展
미박검색%시간신식%미박특성%문본표시%문당선험%사순확전
microblog search%temporal information%microblog feature%text representation%document priori%query expansion
随着微博的快速发展,微博检索已经成为近年来研究领域的热点之一.该文首先以TREC Microblog数据为基础,从分析微博文档和微博查询两方面出发,得出微博检索与传统文本检索之间的两点不同:一是微博文档相较于网页具有很多独有的特征;二是微博查询属于时间敏感查询,即在排序时除了考虑文本的语义相似度,还需要考虑时间因素,将这类方法统称为时间感知的检索技术.这两点差异使得已有的信息检索技术不能满足微博搜索的需求.该文主要介绍了近年来这两方面的相关研究:首先描述了微博本身的多种特征以及基于这些特征提出的检索方法;然后以传统信息检索过程为主线,分别介绍了将时间信息用于文本表示、文档先验、查询扩展三方面的排序模型,最后总结了已有工作并且对未来研究内容进行了展望.
隨著微博的快速髮展,微博檢索已經成為近年來研究領域的熱點之一.該文首先以TREC Microblog數據為基礎,從分析微博文檔和微博查詢兩方麵齣髮,得齣微博檢索與傳統文本檢索之間的兩點不同:一是微博文檔相較于網頁具有很多獨有的特徵;二是微博查詢屬于時間敏感查詢,即在排序時除瞭攷慮文本的語義相似度,還需要攷慮時間因素,將這類方法統稱為時間感知的檢索技術.這兩點差異使得已有的信息檢索技術不能滿足微博搜索的需求.該文主要介紹瞭近年來這兩方麵的相關研究:首先描述瞭微博本身的多種特徵以及基于這些特徵提齣的檢索方法;然後以傳統信息檢索過程為主線,分彆介紹瞭將時間信息用于文本錶示、文檔先驗、查詢擴展三方麵的排序模型,最後總結瞭已有工作併且對未來研究內容進行瞭展望.
수착미박적쾌속발전,미박검색이경성위근년래연구영역적열점지일.해문수선이TREC Microblog수거위기출,종분석미박문당화미박사순량방면출발,득출미박검색여전통문본검색지간적량점불동:일시미박문당상교우망혈구유흔다독유적특정;이시미박사순속우시간민감사순,즉재배서시제료고필문본적어의상사도,환수요고필시간인소,장저류방법통칭위시간감지적검색기술.저량점차이사득이유적신식검색기술불능만족미박수색적수구.해문주요개소료근년래저량방면적상관연구:수선묘술료미박본신적다충특정이급기우저사특정제출적검색방법;연후이전통신식검색과정위주선,분별개소료장시간신식용우문본표시、문당선험、사순확전삼방면적배서모형,최후총결료이유공작병차대미래연구내용진행료전망.