中国科技论文在线
中國科技論文在線
중국과기논문재선
SCIENCEPAPER ONLINE
2011年
7期
507-511
,共5页
汪婵%程玉虎%王雪松
汪嬋%程玉虎%王雪鬆
왕선%정옥호%왕설송
主动学习%信息熵%孤立点%K近邻密度
主動學習%信息熵%孤立點%K近鄰密度
주동학습%신식적%고립점%K근린밀도
在选择含信息量大的样本时,基于不确定度缩减的主动学习算法通常会将孤立点一并加入训练集,从而影响分类效果。为此,提出一种基于局部稀疏K近邻密度的主动学习算法,采用近邻密度来判定未标记样本是否为孤立点,并考虑未标记样本周边样本的稀疏程度,减少将非均匀分布样本集中的孤立点当作正常样本点及将正常样本点当作孤立点的错误。典型UCI和人工数据集上的仿真结果表明,与基于密度重排序的主动学习算法相比,所提算法能够取得较好的分类性能。
在選擇含信息量大的樣本時,基于不確定度縮減的主動學習算法通常會將孤立點一併加入訓練集,從而影響分類效果。為此,提齣一種基于跼部稀疏K近鄰密度的主動學習算法,採用近鄰密度來判定未標記樣本是否為孤立點,併攷慮未標記樣本週邊樣本的稀疏程度,減少將非均勻分佈樣本集中的孤立點噹作正常樣本點及將正常樣本點噹作孤立點的錯誤。典型UCI和人工數據集上的倣真結果錶明,與基于密度重排序的主動學習算法相比,所提算法能夠取得較好的分類性能。
재선택함신식량대적양본시,기우불학정도축감적주동학습산법통상회장고립점일병가입훈련집,종이영향분류효과。위차,제출일충기우국부희소K근린밀도적주동학습산법,채용근린밀도래판정미표기양본시부위고립점,병고필미표기양본주변양본적희소정도,감소장비균균분포양본집중적고립점당작정상양본점급장정상양본점당작고립점적착오。전형UCI화인공수거집상적방진결과표명,여기우밀도중배서적주동학습산법상비,소제산법능구취득교호적분류성능。