计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2013年
6期
1718-1720
,共3页
K-均值算法%主动学习策略%半监督学习%聚类
K-均值算法%主動學習策略%半鑑督學習%聚類
K-균치산법%주동학습책략%반감독학습%취류
K-means algorithm%active learning strategy%semi-supervised learning%clustering
提出一种选择最富信息数据并予以标记的基于主动学习策略的半监督聚类算法.首先,采用传统K-均值聚类算法对数据集进行粗聚类;其次,根据粗聚类结果计算出每个数据隶属于每个类簇的隶属度,筛选出满足最大与次大隶属度差值小于阈值的候选数据,并从中选择差值较小的数据作为最富信息的数据进行标记;最后,将候选数据集合中未标记数据分组到与每类已被标记数据平均距离最小的类簇中.实验表明,提出的主动学习策略能够很好地学习到最富信息数据,基于该学习策略的半监督聚类算法在测试不同数据集时均获得了较高的准确率.
提齣一種選擇最富信息數據併予以標記的基于主動學習策略的半鑑督聚類算法.首先,採用傳統K-均值聚類算法對數據集進行粗聚類;其次,根據粗聚類結果計算齣每箇數據隸屬于每箇類簇的隸屬度,篩選齣滿足最大與次大隸屬度差值小于閾值的候選數據,併從中選擇差值較小的數據作為最富信息的數據進行標記;最後,將候選數據集閤中未標記數據分組到與每類已被標記數據平均距離最小的類簇中.實驗錶明,提齣的主動學習策略能夠很好地學習到最富信息數據,基于該學習策略的半鑑督聚類算法在測試不同數據集時均穫得瞭較高的準確率.
제출일충선택최부신식수거병여이표기적기우주동학습책략적반감독취류산법.수선,채용전통K-균치취류산법대수거집진행조취류;기차,근거조취류결과계산출매개수거대속우매개류족적대속도,사선출만족최대여차대대속도차치소우역치적후선수거,병종중선택차치교소적수거작위최부신식적수거진행표기;최후,장후선수거집합중미표기수거분조도여매류이피표기수거평균거리최소적류족중.실험표명,제출적주동학습책략능구흔호지학습도최부신식수거,기우해학습책략적반감독취류산법재측시불동수거집시균획득료교고적준학솔.