科技信息
科技信息
과기신식
SCIENTIFIC & TECHNICAL INFORMATION
2008年
28期
170-172
,共3页
数据挖掘%聚类算法%K-means%DBSCAN
數據挖掘%聚類算法%K-means%DBSCAN
수거알굴%취류산법%K-means%DBSCAN
对原始K-means算法<行了研究,通过改进,算法能够自动找出合适的k值,并且最大限度的找出孤立点.首先,寻找样本客量的最大可能初始聚类数n.然后做样本圆,将样本圆等分为n份,依据样本点的位置将样本归属到相应的份里,对初始的n个类进行聚类.最后通过应用DBSCAN算法的小类合并策略将需要合并的小类进行了合并.为了测试改进算法的聚类性能,将改进后的算法源码放在新西兰怀卡托大学所开发的开源平台"weka"上,在多个数据集上与原始K-means算法进行了对比实验.验证了改进算法在聚类质量和聚类稳定性上都远优于原始K-means算法.
對原始K-means算法<行瞭研究,通過改進,算法能夠自動找齣閤適的k值,併且最大限度的找齣孤立點.首先,尋找樣本客量的最大可能初始聚類數n.然後做樣本圓,將樣本圓等分為n份,依據樣本點的位置將樣本歸屬到相應的份裏,對初始的n箇類進行聚類.最後通過應用DBSCAN算法的小類閤併策略將需要閤併的小類進行瞭閤併.為瞭測試改進算法的聚類性能,將改進後的算法源碼放在新西蘭懷卡託大學所開髮的開源平檯"weka"上,在多箇數據集上與原始K-means算法進行瞭對比實驗.驗證瞭改進算法在聚類質量和聚類穩定性上都遠優于原始K-means算法.
대원시K-means산법<행료연구,통과개진,산법능구자동조출합괄적k치,병차최대한도적조출고립점.수선,심조양본객량적최대가능초시취류수n.연후주양본원,장양본원등분위n빈,의거양본점적위치장양본귀속도상응적빈리,대초시적n개류진행취류.최후통과응용DBSCAN산법적소류합병책략장수요합병적소류진행료합병.위료측시개진산법적취류성능,장개진후적산법원마방재신서란부잡탁대학소개발적개원평태"weka"상,재다개수거집상여원시K-means산법진행료대비실험.험증료개진산법재취류질량화취류은정성상도원우우원시K-means산법.