北京邮电大学学报
北京郵電大學學報
북경유전대학학보
JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOMMUNICATIONS
2007年
3期
1-5
,共5页
子空间聚类%高维数据%属性聚类
子空間聚類%高維數據%屬性聚類
자공간취류%고유수거%속성취류
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法. 算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意2个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇. 在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.
為瞭解決現有子空間聚類算法時間複雜度偏高以及對輸入參數敏感的問題,提齣瞭一種基于屬性聚類方法的高效子空間聚類算法. 算法首先通過計算每箇屬性的基尼值來過濾冗餘屬性,而後通過基于二維聯閤基尼值的關繫函數建立非冗餘屬性的關繫矩陣,以衡量任意2箇非冗餘屬性的相關度, 進而在關繫矩陣上應用可產生交疊的聚類算法,聚類結果即為所有興趣度子空間的候選集閤,最後調用聚類算法得到所有存在于這些子空間內的簇. 在人工數據集和真實數據集上的實驗錶明,新算法不僅在時間複雜度和子空間簇的尋找能力方麵均有較優錶現,而且對輸入參數的取值不甚敏感.
위료해결현유자공간취류산법시간복잡도편고이급대수입삼수민감적문제,제출료일충기우속성취류방법적고효자공간취류산법. 산법수선통과계산매개속성적기니치래과려용여속성,이후통과기우이유연합기니치적관계함수건립비용여속성적관계구진,이형량임의2개비용여속성적상관도, 진이재관계구진상응용가산생교첩적취류산법,취류결과즉위소유흥취도자공간적후선집합,최후조용취류산법득도소유존재우저사자공간내적족. 재인공수거집화진실수거집상적실험표명,신산법불부재시간복잡도화자공간족적심조능력방면균유교우표현,이차대수입삼수적취치불심민감.