计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2013年
2期
1-6
,共6页
半监督聚类%未标注数据%标注数据%相似度%多项式模型%模糊聚类
半鑑督聚類%未標註數據%標註數據%相似度%多項式模型%模糊聚類
반감독취류%미표주수거%표주수거%상사도%다항식모형%모호취류
semi-supervised clustering%unlabeled data%labeled data%similarity%multinomial model%fuzzy clustering
半监督聚类算法通常利用标注数据优化类别描述参数(如类的中心),然后通过类别描述参数划分无标注数据的类别,但是没有考虑标注数据对其周围无标注数据的类别划分的直接作用.文中提出一种双向选择调整策略,在根据类别描述参数对数据进行类别划分之后,利用标注数据调整其周围未标注数据的类别标签,从而提高类别划分的准确度.该方法根据标注数据周围的数据密度来动态确定数据调整范围,并采用新的相似度计算方法提高被调整的数据准确度.文中利用双向选择调整策略改进了基于多项式模型的半监督聚类算法和半监督模糊聚类算法,并使用多个标准数据集进行实验.实验结果表明改进的算法有效提高了半监督聚类的准确性.
半鑑督聚類算法通常利用標註數據優化類彆描述參數(如類的中心),然後通過類彆描述參數劃分無標註數據的類彆,但是沒有攷慮標註數據對其週圍無標註數據的類彆劃分的直接作用.文中提齣一種雙嚮選擇調整策略,在根據類彆描述參數對數據進行類彆劃分之後,利用標註數據調整其週圍未標註數據的類彆標籤,從而提高類彆劃分的準確度.該方法根據標註數據週圍的數據密度來動態確定數據調整範圍,併採用新的相似度計算方法提高被調整的數據準確度.文中利用雙嚮選擇調整策略改進瞭基于多項式模型的半鑑督聚類算法和半鑑督模糊聚類算法,併使用多箇標準數據集進行實驗.實驗結果錶明改進的算法有效提高瞭半鑑督聚類的準確性.
반감독취류산법통상이용표주수거우화유별묘술삼수(여류적중심),연후통과유별묘술삼수화분무표주수거적유별,단시몰유고필표주수거대기주위무표주수거적유별화분적직접작용.문중제출일충쌍향선택조정책략,재근거유별묘술삼수대수거진행유별화분지후,이용표주수거조정기주위미표주수거적유별표첨,종이제고유별화분적준학도.해방법근거표주수거주위적수거밀도래동태학정수거조정범위,병채용신적상사도계산방법제고피조정적수거준학도.문중이용쌍향선택조정책략개진료기우다항식모형적반감독취류산법화반감독모호취류산법,병사용다개표준수거집진행실험.실험결과표명개진적산법유효제고료반감독취류적준학성.
Usually,semi-supervised clustering algorithms utilize a small amount of labeled data to improve cluster parameters which guide the clustering of unlabeled data. However,the existing semi-supervised clustering algorithms (such as cluster centroid) ignore the labeled data could directly affect the clustering of unlabeled data. It proposes a double adjustment strategy which adjusts unlabeled data clustering with the labeled information,after the data is clustered according to the cluster parameters. Thus,the proposed method improves the cluste-ring accuracy. The adjustment extension is changed dynamically by the local density around the labeled data. And a novel similarity meas-ure is proposed to improve the accuracy of the adjusted unlabeled data. It modifies two algorithms,based on multinomial model semi-su-pervised clustering algorithm and semi-supervised fuzzy clustering algorithm,with the double adjustment method. Experimental results show that the method could improve the accuracy of semi-supervised clustering.