计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2011年
4期
558-566
,共9页
王扬%黄亚楼%谢茂强%刘杰%卢敏%廖振
王颺%黃亞樓%謝茂彊%劉傑%盧敏%廖振
왕양%황아루%사무강%류걸%로민%료진
信息检索%查询相关%排序学习%模型融合%排序支持向量机
信息檢索%查詢相關%排序學習%模型融閤%排序支持嚮量機
신식검색%사순상관%배서학습%모형융합%배서지지향량궤
排序学习是目前信息检索与机器学习领域研究的热点问题.现有排序学习算法在学习时把训练样本集中的所有查询及其相关文档等同对待,忽视了查询之间的差异,影响了排序模型的性能.对查询之间的差异进行描述,并在训练过程中考虑这种差异,提出一种基于有监督学习的融合多个与查询相关排序子模型的方法.该方法为每一个查询及其相关文档建立一个子排序模型,并将子排序模型的输出进行向量化表示,将多个查询相关的排序模型转化为体现查询差异的特征数据,实现多排序模型的集成.以排序支持向量机为例,在查询级和样本级建立新的损失函数作为优化目标,并利用此损失函数调节不同查询产生损失之间的权重,提出多查询相关的排序支持向量机融合算法.在文档检索和网页检索中的实验结果表明,使用多查询相关的排序支持向量机融合算法可以取得比传统排序学习模型更好的性能.
排序學習是目前信息檢索與機器學習領域研究的熱點問題.現有排序學習算法在學習時把訓練樣本集中的所有查詢及其相關文檔等同對待,忽視瞭查詢之間的差異,影響瞭排序模型的性能.對查詢之間的差異進行描述,併在訓練過程中攷慮這種差異,提齣一種基于有鑑督學習的融閤多箇與查詢相關排序子模型的方法.該方法為每一箇查詢及其相關文檔建立一箇子排序模型,併將子排序模型的輸齣進行嚮量化錶示,將多箇查詢相關的排序模型轉化為體現查詢差異的特徵數據,實現多排序模型的集成.以排序支持嚮量機為例,在查詢級和樣本級建立新的損失函數作為優化目標,併利用此損失函數調節不同查詢產生損失之間的權重,提齣多查詢相關的排序支持嚮量機融閤算法.在文檔檢索和網頁檢索中的實驗結果錶明,使用多查詢相關的排序支持嚮量機融閤算法可以取得比傳統排序學習模型更好的性能.
배서학습시목전신식검색여궤기학습영역연구적열점문제.현유배서학습산법재학습시파훈련양본집중적소유사순급기상관문당등동대대,홀시료사순지간적차이,영향료배서모형적성능.대사순지간적차이진행묘술,병재훈련과정중고필저충차이,제출일충기우유감독학습적융합다개여사순상관배서자모형적방법.해방법위매일개사순급기상관문당건립일개자배서모형,병장자배서모형적수출진행향양화표시,장다개사순상관적배서모형전화위체현사순차이적특정수거,실현다배서모형적집성.이배서지지향량궤위례,재사순급화양본급건립신적손실함수작위우화목표,병이용차손실함수조절불동사순산생손실지간적권중,제출다사순상관적배서지지향량궤융합산법.재문당검색화망혈검색중적실험결과표명,사용다사순상관적배서지지향량궤융합산법가이취득비전통배서학습모형경호적성능.