计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
8期
205-211,223
,共8页
聚类%K-means算法%方差%紧密度%初始聚类中心
聚類%K-means算法%方差%緊密度%初始聚類中心
취류%K-means산법%방차%긴밀도%초시취류중심
clustering%K-means algorithm%deviation%intensive degree%initialized clustering centers
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性.为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法.该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类.在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能.
傳統K-means算法隨機選取初始聚類中心,容易導緻聚類結果不穩定,而優化初始聚類中心的K-means算法需要一定的參數選擇,也會使聚類結果缺乏客觀性.為此,根據樣本空間分佈緊密度信息,提齣利用最小方差優化初始聚類中心的K-means算法.該算法運用樣本空間分佈信息,通過計算樣本空間分佈的方差得到樣本緊密度信息,選擇方差最小(即緊密度最高)且相距一定距離的樣本作為初始聚類中心,實現優化的K-means聚類.在UCI機器學習數據庫數據集和含有譟音的人工模擬數據集上的實驗結果錶明,該算法不僅能得到較好的聚類結果,且聚類結果穩定,對譟音具有較彊的免疫性能.
전통K-means산법수궤선취초시취류중심,용역도치취류결과불은정,이우화초시취류중심적K-means산법수요일정적삼수선택,야회사취류결과결핍객관성.위차,근거양본공간분포긴밀도신식,제출이용최소방차우화초시취류중심적K-means산법.해산법운용양본공간분포신식,통과계산양본공간분포적방차득도양본긴밀도신식,선택방차최소(즉긴밀도최고)차상거일정거리적양본작위초시취류중심,실현우화적K-means취류.재UCI궤기학습수거고수거집화함유조음적인공모의수거집상적실험결과표명,해산법불부능득도교호적취류결과,차취류결과은정,대조음구유교강적면역성능.