太原理工大学学报
太原理工大學學報
태원리공대학학보
JOURNAL OF TAIYUAN UNIVERSITY OF TECHNOLOGY
2011年
4期
334-337
,共4页
聚类中心初始化%密度估计法%限定初值算法%K-means算法
聚類中心初始化%密度估計法%限定初值算法%K-means算法
취류중심초시화%밀도고계법%한정초치산법%K-means산법
针对大数据集的初始聚类中心选取问题,在基于密度的划分算法和适用于大规模数据集限定初值的采样算法基础上,提出了一种用于初始聚类中心的划分采样算法.对聚类子空间在每一维上进行均匀划分形成不同的数据区域,根据数据区域的数据点数的多少进行采样来提高采样的准确性.利用采样思想缩小了数据集的规模,保证了算法在时间上的优势.通过不同规模、不同形状的数据集对算法进行验证,实验结果表明,与其它初始聚类中心算法相比,该算法在准确率和时间上都具有一定的优势.
針對大數據集的初始聚類中心選取問題,在基于密度的劃分算法和適用于大規模數據集限定初值的採樣算法基礎上,提齣瞭一種用于初始聚類中心的劃分採樣算法.對聚類子空間在每一維上進行均勻劃分形成不同的數據區域,根據數據區域的數據點數的多少進行採樣來提高採樣的準確性.利用採樣思想縮小瞭數據集的規模,保證瞭算法在時間上的優勢.通過不同規模、不同形狀的數據集對算法進行驗證,實驗結果錶明,與其它初始聚類中心算法相比,該算法在準確率和時間上都具有一定的優勢.
침대대수거집적초시취류중심선취문제,재기우밀도적화분산법화괄용우대규모수거집한정초치적채양산법기출상,제출료일충용우초시취류중심적화분채양산법.대취류자공간재매일유상진행균균화분형성불동적수거구역,근거수거구역적수거점수적다소진행채양래제고채양적준학성.이용채양사상축소료수거집적규모,보증료산법재시간상적우세.통과불동규모、불동형상적수거집대산법진행험증,실험결과표명,여기타초시취류중심산법상비,해산법재준학솔화시간상도구유일정적우세.