软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2008年
12期
3147-3160
,共14页
数据聚类%多项式核%邻域密度因子%有向树%图论%重叠数据%结构性作用%结构化聚类
數據聚類%多項式覈%鄰域密度因子%有嚮樹%圖論%重疊數據%結構性作用%結構化聚類
수거취류%다항식핵%린역밀도인자%유향수%도론%중첩수거%결구성작용%결구화취류
各个点在数据内部的组织结构中自然地扮演着3种不同的结构性角色,分别是毂、质心和野值.在基于邻域的聚类算法中,邻域密度因子能够识别分离数据集中的毂、质心和野值.但是,邻域密度因子对有噪声和重叠的数据往往失效.为了解决该问题,引入了基于多项式核的邻域密度因子,并在有向树框架下,提出了一种结构化的数据聚类算法,其计算复杂度线性于输入数据的大小.对带有噪声和重叠的数据集,该算法能够找到所有显著的、任意形状的不均衡聚类.在人工和真实数据集上的实验结果都证实了该算法的有效性和快速性.
各箇點在數據內部的組織結構中自然地扮縯著3種不同的結構性角色,分彆是轂、質心和野值.在基于鄰域的聚類算法中,鄰域密度因子能夠識彆分離數據集中的轂、質心和野值.但是,鄰域密度因子對有譟聲和重疊的數據往往失效.為瞭解決該問題,引入瞭基于多項式覈的鄰域密度因子,併在有嚮樹框架下,提齣瞭一種結構化的數據聚類算法,其計算複雜度線性于輸入數據的大小.對帶有譟聲和重疊的數據集,該算法能夠找到所有顯著的、任意形狀的不均衡聚類.在人工和真實數據集上的實驗結果都證實瞭該算法的有效性和快速性.
각개점재수거내부적조직결구중자연지분연착3충불동적결구성각색,분별시곡、질심화야치.재기우린역적취류산법중,린역밀도인자능구식별분리수거집중적곡、질심화야치.단시,린역밀도인자대유조성화중첩적수거왕왕실효.위료해결해문제,인입료기우다항식핵적린역밀도인자,병재유향수광가하,제출료일충결구화적수거취류산법,기계산복잡도선성우수입수거적대소.대대유조성화중첩적수거집,해산법능구조도소유현저적、임의형상적불균형취류.재인공화진실수거집상적실험결과도증실료해산법적유효성화쾌속성.