计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2011年
1期
78-80,90
,共4页
李米娜%朱玉全%陈耿%郝洪星
李米娜%硃玉全%陳耿%郝洪星
리미나%주옥전%진경%학홍성
数据挖掘%局部密度%K-means
數據挖掘%跼部密度%K-means
수거알굴%국부밀도%K-means
针对核K-means算法初始聚类中心点难以确定等问题,提出了一种基于局部密度的核K-means算法,该方法利用每个样本的局部相对密度来选择具有高密度且低相似性的样本来生成初始类中心点.实验结果表明,该算法能够很好地排除类边缘点和噪声点的影响,并且能够适应数据集中各个实际类别密度分布不平衡的情况,最终可以生成质量较高且波动性较小的聚类.
針對覈K-means算法初始聚類中心點難以確定等問題,提齣瞭一種基于跼部密度的覈K-means算法,該方法利用每箇樣本的跼部相對密度來選擇具有高密度且低相似性的樣本來生成初始類中心點.實驗結果錶明,該算法能夠很好地排除類邊緣點和譟聲點的影響,併且能夠適應數據集中各箇實際類彆密度分佈不平衡的情況,最終可以生成質量較高且波動性較小的聚類.
침대핵K-means산법초시취류중심점난이학정등문제,제출료일충기우국부밀도적핵K-means산법,해방법이용매개양본적국부상대밀도래선택구유고밀도차저상사성적양본래생성초시류중심점.실험결과표명,해산법능구흔호지배제류변연점화조성점적영향,병차능구괄응수거집중각개실제유별밀도분포불평형적정황,최종가이생성질량교고차파동성교소적취류.