计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2011年
z2期
567-574
,共8页
半监督%排序学习%桶排列%信息检索
半鑑督%排序學習%桶排列%信息檢索
반감독%배서학습%통배렬%신식검색
排序学习,即用有标记的训练集通过机器学习的方法学习一个排序函数,并对测试集的数据进行排序的技术.当前的文档排序学习算法主要是基于全监督排序学习的框架,它需要大量已标记的文档,而通过人工给文档赋予标记(完美、优秀、好、一般、差)是非常费力费时的.因此这里提出一种基于排列融合的归纳(inductive)式半监督排序算法.首先通过桶排列(bucket orders)的方法对未标记的文档进行标记,然后设计一个把能新标记的文档和手工标记的训练集结合起来的损失函数,接着用RankSVM-Struct的方法来优化,最后通过在TREC2003,TREC2004,OSHUMED,MQ2007和MQ2008数据集上用实验来展现新的归纳式半监督排序学习算法的效果,它比全监督排序学习有显著的提高.
排序學習,即用有標記的訓練集通過機器學習的方法學習一箇排序函數,併對測試集的數據進行排序的技術.噹前的文檔排序學習算法主要是基于全鑑督排序學習的框架,它需要大量已標記的文檔,而通過人工給文檔賦予標記(完美、優秀、好、一般、差)是非常費力費時的.因此這裏提齣一種基于排列融閤的歸納(inductive)式半鑑督排序算法.首先通過桶排列(bucket orders)的方法對未標記的文檔進行標記,然後設計一箇把能新標記的文檔和手工標記的訓練集結閤起來的損失函數,接著用RankSVM-Struct的方法來優化,最後通過在TREC2003,TREC2004,OSHUMED,MQ2007和MQ2008數據集上用實驗來展現新的歸納式半鑑督排序學習算法的效果,它比全鑑督排序學習有顯著的提高.
배서학습,즉용유표기적훈련집통과궤기학습적방법학습일개배서함수,병대측시집적수거진행배서적기술.당전적문당배서학습산법주요시기우전감독배서학습적광가,타수요대량이표기적문당,이통과인공급문당부여표기(완미、우수、호、일반、차)시비상비력비시적.인차저리제출일충기우배렬융합적귀납(inductive)식반감독배서산법.수선통과통배렬(bucket orders)적방법대미표기적문당진행표기,연후설계일개파능신표기적문당화수공표기적훈련집결합기래적손실함수,접착용RankSVM-Struct적방법래우화,최후통과재TREC2003,TREC2004,OSHUMED,MQ2007화MQ2008수거집상용실험래전현신적귀납식반감독배서학습산법적효과,타비전감독배서학습유현저적제고.