中文信息学报
中文信息學報
중문신식학보
Journal of Chinese Information Processing
2015年
4期
175-182
,共8页
王书鑫%卫冰洁%鲁骁%王斌
王書鑫%衛冰潔%魯驍%王斌
왕서흠%위빙길%로효%왕빈
时间敏感%排序学习%微博搜索
時間敏感%排序學習%微博搜索
시간민감%배서학습%미박수색
time-sensitive%learning to rank%microblog search
近年来微博检索已经成为信息检索领域的研究热点.相关的研究表明,微博检索具有时间敏感性.已有工作根据不同的时间敏感性假设,例如,时间越新文档越相关,或者时间越接近热点时刻文档越相关,得到多种不同的检索模型,都在一定程度上提高了检索效果.但是这些假设主要来自于观察,是一种直观简化的假设,仅能从某个方面反映时间因素影响微博排序的规律.该文验证了微博检索具有复杂的时间敏感特性,直观的简化假设并不能准确地描述这种特性.在此基础上提出了一个利用微博的时间特征和文本特征,通过机器学习的方式来构建一个针对时间敏感的微博检索的排序学习模型(TLTR).在时间特征上,考察了查询相关的全局时间特征以及查询-文档对的局部时间特征.在TREC Microblog Track 2011-2012数据集上的实验结果表明,TLTR模型优于现有的其他时间敏感的微博排序方法.
近年來微博檢索已經成為信息檢索領域的研究熱點.相關的研究錶明,微博檢索具有時間敏感性.已有工作根據不同的時間敏感性假設,例如,時間越新文檔越相關,或者時間越接近熱點時刻文檔越相關,得到多種不同的檢索模型,都在一定程度上提高瞭檢索效果.但是這些假設主要來自于觀察,是一種直觀簡化的假設,僅能從某箇方麵反映時間因素影響微博排序的規律.該文驗證瞭微博檢索具有複雜的時間敏感特性,直觀的簡化假設併不能準確地描述這種特性.在此基礎上提齣瞭一箇利用微博的時間特徵和文本特徵,通過機器學習的方式來構建一箇針對時間敏感的微博檢索的排序學習模型(TLTR).在時間特徵上,攷察瞭查詢相關的全跼時間特徵以及查詢-文檔對的跼部時間特徵.在TREC Microblog Track 2011-2012數據集上的實驗結果錶明,TLTR模型優于現有的其他時間敏感的微博排序方法.
근년래미박검색이경성위신식검색영역적연구열점.상관적연구표명,미박검색구유시간민감성.이유공작근거불동적시간민감성가설,례여,시간월신문당월상관,혹자시간월접근열점시각문당월상관,득도다충불동적검색모형,도재일정정도상제고료검색효과.단시저사가설주요래자우관찰,시일충직관간화적가설,부능종모개방면반영시간인소영향미박배서적규률.해문험증료미박검색구유복잡적시간민감특성,직관적간화가설병불능준학지묘술저충특성.재차기출상제출료일개이용미박적시간특정화문본특정,통과궤기학습적방식래구건일개침대시간민감적미박검색적배서학습모형(TLTR).재시간특정상,고찰료사순상관적전국시간특정이급사순-문당대적국부시간특정.재TREC Microblog Track 2011-2012수거집상적실험결과표명,TLTR모형우우현유적기타시간민감적미박배서방법.