中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2012年
5期
53-58,128
,共7页
排序学习%数据质量%噪音敏感
排序學習%數據質量%譟音敏感
배서학습%수거질량%조음민감
排序学习是当前信息检索领域研究热点之一.为了避免训练集中噪音的影响,当前排序学习算法较多关注鲁棒性.已有的工作发现相同的排序学习方法的性能在不同的数据集上会有截然不同的噪音敏感度.模型改变是导致性能下降的直接原因,而模型又是从训练集学习到的,因此根源在于训练数据的某些特性.该文根据具体排序学习场景分析得出影响噪音敏感度的根本原因在于训练集中文档对分布的结论,并在LETOR3.0上的实验验证了这一结论.
排序學習是噹前信息檢索領域研究熱點之一.為瞭避免訓練集中譟音的影響,噹前排序學習算法較多關註魯棒性.已有的工作髮現相同的排序學習方法的性能在不同的數據集上會有截然不同的譟音敏感度.模型改變是導緻性能下降的直接原因,而模型又是從訓練集學習到的,因此根源在于訓練數據的某些特性.該文根據具體排序學習場景分析得齣影響譟音敏感度的根本原因在于訓練集中文檔對分佈的結論,併在LETOR3.0上的實驗驗證瞭這一結論.
배서학습시당전신식검색영역연구열점지일.위료피면훈련집중조음적영향,당전배서학습산법교다관주로봉성.이유적공작발현상동적배서학습방법적성능재불동적수거집상회유절연불동적조음민감도.모형개변시도치성능하강적직접원인,이모형우시종훈련집학습도적,인차근원재우훈련수거적모사특성.해문근거구체배서학습장경분석득출영향조음민감도적근본원인재우훈련집중문당대분포적결론,병재LETOR3.0상적실험험증료저일결론.