计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
11期
2271-2282
,共12页
机器学习%多标记学习%懒惰学习%功能基因组学%图像分类
機器學習%多標記學習%懶惰學習%功能基因組學%圖像分類
궤기학습%다표기학습%라타학습%공능기인조학%도상분류
在多标记学习框架下,每个样本由单个实例进行表示并同时对应于多个概念标记.已有的多标记懒惰学习算法并未充分考察样本多个标记之间的相关性,因此其泛化性能将会受到一定程度的不利影响.针对上述问题,提出一种新型多标记懒惰学习算法 IMLLA.该算法首先找出测试样本在训练集中与各个概念类对应的近邻样本,然后基于近邻样本的多标记信息构造一个标记计数向量,并提交给已训练的线性分类器进行预测.由于IMLLA 在对每个概念类进行预测时利用了蕴含于其他概念类中的信息,因而充分考察了样本多个标记之间的相关性.在人工数据集以及真实世界数据集上的实验表明,IMLLA 算法的性能显著优于常用的多标记学习算法.
在多標記學習框架下,每箇樣本由單箇實例進行錶示併同時對應于多箇概唸標記.已有的多標記懶惰學習算法併未充分攷察樣本多箇標記之間的相關性,因此其汎化性能將會受到一定程度的不利影響.針對上述問題,提齣一種新型多標記懶惰學習算法 IMLLA.該算法首先找齣測試樣本在訓練集中與各箇概唸類對應的近鄰樣本,然後基于近鄰樣本的多標記信息構造一箇標記計數嚮量,併提交給已訓練的線性分類器進行預測.由于IMLLA 在對每箇概唸類進行預測時利用瞭蘊含于其他概唸類中的信息,因而充分攷察瞭樣本多箇標記之間的相關性.在人工數據集以及真實世界數據集上的實驗錶明,IMLLA 算法的性能顯著優于常用的多標記學習算法.
재다표기학습광가하,매개양본유단개실례진행표시병동시대응우다개개념표기.이유적다표기라타학습산법병미충분고찰양본다개표기지간적상관성,인차기범화성능장회수도일정정도적불리영향.침대상술문제,제출일충신형다표기라타학습산법 IMLLA.해산법수선조출측시양본재훈련집중여각개개념류대응적근린양본,연후기우근린양본적다표기신식구조일개표기계수향량,병제교급이훈련적선성분류기진행예측.유우IMLLA 재대매개개념류진행예측시이용료온함우기타개념류중적신식,인이충분고찰료양본다개표기지간적상관성.재인공수거집이급진실세계수거집상적실험표명,IMLLA 산법적성능현저우우상용적다표기학습산법.