计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
8期
1738-1746
,共9页
卢敏%黄亚楼%谢茂强%王扬%刘杰%廖振
盧敏%黃亞樓%謝茂彊%王颺%劉傑%廖振
로민%황아루%사무강%왕양%류걸%료진
排序学习%列表排序算法%代价敏感%序保持%泛化性
排序學習%列錶排序算法%代價敏感%序保持%汎化性
배서학습%렬표배서산법%대개민감%서보지%범화성
排序学习是信息检索与机器学习中的研究热点之一.在信息检索中,预测排序列表中顶部排序非常重要.但是,排序学习中一类经典的排序算法——列表排序算法——无法强调预测排序列表中顶部排序.为了解决此问题,将代价敏感学习的思想融入到列表排序算法中,提出代价敏感的列表排序算法框架.该框架是在列表排序算法的损失函数中对文档引入权重,且基于性能评价指标NDCG计算文档的权重.在此基础之上,进一步证明了代价敏感的列表排序算法的损失函数是NDCG损失的上界.为了验证代价敏感的列表排序算法的有效性,在此框架下提出了一种代价敏感的ListMLE排序算法,并对该算法开展序保持与泛化性的理论研究工作,从理论上验证了该算法具有序保持特性.在基准数据集上的实验结果表明,在预测排序列表中顶部排序中,代价敏感的ListMLE比传统排序学习算法能取得更好的性能.
排序學習是信息檢索與機器學習中的研究熱點之一.在信息檢索中,預測排序列錶中頂部排序非常重要.但是,排序學習中一類經典的排序算法——列錶排序算法——無法彊調預測排序列錶中頂部排序.為瞭解決此問題,將代價敏感學習的思想融入到列錶排序算法中,提齣代價敏感的列錶排序算法框架.該框架是在列錶排序算法的損失函數中對文檔引入權重,且基于性能評價指標NDCG計算文檔的權重.在此基礎之上,進一步證明瞭代價敏感的列錶排序算法的損失函數是NDCG損失的上界.為瞭驗證代價敏感的列錶排序算法的有效性,在此框架下提齣瞭一種代價敏感的ListMLE排序算法,併對該算法開展序保持與汎化性的理論研究工作,從理論上驗證瞭該算法具有序保持特性.在基準數據集上的實驗結果錶明,在預測排序列錶中頂部排序中,代價敏感的ListMLE比傳統排序學習算法能取得更好的性能.
배서학습시신식검색여궤기학습중적연구열점지일.재신식검색중,예측배서렬표중정부배서비상중요.단시,배서학습중일류경전적배서산법——렬표배서산법——무법강조예측배서렬표중정부배서.위료해결차문제,장대개민감학습적사상융입도렬표배서산법중,제출대개민감적렬표배서산법광가.해광가시재렬표배서산법적손실함수중대문당인입권중,차기우성능평개지표NDCG계산문당적권중.재차기출지상,진일보증명료대개민감적렬표배서산법적손실함수시NDCG손실적상계.위료험증대개민감적렬표배서산법적유효성,재차광가하제출료일충대개민감적ListMLE배서산법,병대해산법개전서보지여범화성적이론연구공작,종이론상험증료해산법구유서보지특성.재기준수거집상적실험결과표명,재예측배서렬표중정부배서중,대개민감적ListMLE비전통배서학습산법능취득경호적성능.