计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2015年
8期
963-972
,共10页
杨柳%邹珊%于剑%景丽萍
楊柳%鄒珊%于劍%景麗萍
양류%추산%우검%경려평
多标记学习%共享子空间%类别相关性
多標記學習%共享子空間%類彆相關性
다표기학습%공향자공간%유별상관성
multi-label learning%common subspace%label correlation
在多标记问题中,一个样本对应的多个类别之间经常会存在一定的相关性,这些相关性可以为多标记分类提供有用的信息。已有的多标记学习对于类别之间的相关性研究是建立在原始数据上的,然而原始数据往往是高维且含有噪声的,使得已有学习方法无法达到满意的效果。提出了一种基于共享子空间的多标记学习方法。该方法可以在类别信息的指导下,学到从原始特征空间到高层共享空间的映射函数,从而可以把原始的高维数据映射到一个低维空间中。同时也学到一个从类别空间到高层空间的映射函数,使得数据进行低维的重新表示后,可以直接对应到类别信息。在5个实际的数据集合上进行了测试,实验结果表明该模型可以有效地提高多标记数据的分类性能。
在多標記問題中,一箇樣本對應的多箇類彆之間經常會存在一定的相關性,這些相關性可以為多標記分類提供有用的信息。已有的多標記學習對于類彆之間的相關性研究是建立在原始數據上的,然而原始數據往往是高維且含有譟聲的,使得已有學習方法無法達到滿意的效果。提齣瞭一種基于共享子空間的多標記學習方法。該方法可以在類彆信息的指導下,學到從原始特徵空間到高層共享空間的映射函數,從而可以把原始的高維數據映射到一箇低維空間中。同時也學到一箇從類彆空間到高層空間的映射函數,使得數據進行低維的重新錶示後,可以直接對應到類彆信息。在5箇實際的數據集閤上進行瞭測試,實驗結果錶明該模型可以有效地提高多標記數據的分類性能。
재다표기문제중,일개양본대응적다개유별지간경상회존재일정적상관성,저사상관성가이위다표기분류제공유용적신식。이유적다표기학습대우유별지간적상관성연구시건립재원시수거상적,연이원시수거왕왕시고유차함유조성적,사득이유학습방법무법체도만의적효과。제출료일충기우공향자공간적다표기학습방법。해방법가이재유별신식적지도하,학도종원시특정공간도고층공향공간적영사함수,종이가이파원시적고유수거영사도일개저유공간중。동시야학도일개종유별공간도고층공간적영사함수,사득수거진행저유적중신표시후,가이직접대응도유별신식。재5개실제적수거집합상진행료측시,실험결과표명해모형가이유효지제고다표기수거적분류성능。
In the multi-label classification problems, different labels corresponding with the same instance may have some correlations, and the label correlation can provide some important information. Some multi-label learning methods are presented to combine the label correlation, but they are built on the original data which are high-dimensional and noisy, then they cannot obtain the satisfied results. This paper proposes a common subspace based multi-label learning method to extract high-level information from the original feature space by making use of the label information. Based on the feature mapping function, the original high-dimensional data can be effectively represented in the common low-dimensional subspace. Meanwhile, the proposed method also learns the mapping function from the label space to the common high-level feature space, then the label information of instances can be obtained with the new repre-sentation in the subspace. The experimental results on five real-world data sets show that the model can effectively improve the performance of multi-label classification.