计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2013年
16期
113-116,200
,共5页
多标记分类%多示例学习%权重%K近邻
多標記分類%多示例學習%權重%K近鄰
다표기분류%다시례학습%권중%K근린
multi-label classification%multi-instance learning%weighting%K-Nearest Neighbour(KNN)
多数多标记学习方法通过在输出空间中,单示例同时与多个类别标记相关联表示多义性,目前有研究通过在输入空间将单一示例转化为示例包,建立包中多示例与多标记的联系。算法在生成示例包时采用等权重平均法计算每个标记对应样例的均值。由于数据具有局部分布特征,在计算该均值时考虑数据局部分布,将会使生成的示例包更加准确。本论文充分考虑数据分布特性,提出新的分类算法。实验表明改进算法性能优于其他常用多标记学习算法。
多數多標記學習方法通過在輸齣空間中,單示例同時與多箇類彆標記相關聯錶示多義性,目前有研究通過在輸入空間將單一示例轉化為示例包,建立包中多示例與多標記的聯繫。算法在生成示例包時採用等權重平均法計算每箇標記對應樣例的均值。由于數據具有跼部分佈特徵,在計算該均值時攷慮數據跼部分佈,將會使生成的示例包更加準確。本論文充分攷慮數據分佈特性,提齣新的分類算法。實驗錶明改進算法性能優于其他常用多標記學習算法。
다수다표기학습방법통과재수출공간중,단시례동시여다개유별표기상관련표시다의성,목전유연구통과재수입공간장단일시례전화위시례포,건립포중다시례여다표기적련계。산법재생성시례포시채용등권중평균법계산매개표기대응양례적균치。유우수거구유국부분포특정,재계산해균치시고필수거국부분포,장회사생성적시례포경가준학。본논문충분고필수거분포특성,제출신적분류산법。실험표명개진산법성능우우기타상용다표기학습산법。
In most cases, the inherent ambiguity of each instance is explicitly expressed in the output space based on associa-tions with multiple class labels. Recent studies indicate that the instance ambiguity can be expressed in the input space by trans-forming a single instance into a bag of instances and establishing the relations between sets of labels and bags of transformed in-stances. However, the bags of instances are generated by calculating the mean values of instances corresponding to the each la-bel with equal weight for each instance. Because of the local distribution characteristics of data, taking the local distribution of data will generate more accurate instance bags. This paper fully considers the local distribution characteristics, and proposes a new multi-label classification algorithm. Experimental results show that it outperforms other proposed multi-label algorithms.