计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2010年
23期
22-24
,共3页
谷瑞军%汪加才%陈耿%陈圣磊
穀瑞軍%汪加纔%陳耿%陳聖磊
곡서군%왕가재%진경%진골뢰
近邻传播聚类%大规模数据集%数据挖掘
近鄰傳播聚類%大規模數據集%數據挖掘
근린전파취류%대규모수거집%수거알굴
近邻传播聚类在计算过程中需构建相似度矩阵,该矩阵的规模随样本数急剧增长,限制了算法在大规模数据集上的直接应用.为此,提出一种改进的近邻传播聚类算法,利用数据点的局部分布,借鉴半监督聚类的思想构造稀疏化的相似度矩阵,并对聚类结果中的簇代表点再次或多次聚类,直至得到合适的簇划分.实验结果表明,该算法在处理能力和运算速度上优于原算法.
近鄰傳播聚類在計算過程中需構建相似度矩陣,該矩陣的規模隨樣本數急劇增長,限製瞭算法在大規模數據集上的直接應用.為此,提齣一種改進的近鄰傳播聚類算法,利用數據點的跼部分佈,藉鑒半鑑督聚類的思想構造稀疏化的相似度矩陣,併對聚類結果中的簇代錶點再次或多次聚類,直至得到閤適的簇劃分.實驗結果錶明,該算法在處理能力和運算速度上優于原算法.
근린전파취류재계산과정중수구건상사도구진,해구진적규모수양본수급극증장,한제료산법재대규모수거집상적직접응용.위차,제출일충개진적근린전파취류산법,이용수거점적국부분포,차감반감독취류적사상구조희소화적상사도구진,병대취류결과중적족대표점재차혹다차취류,직지득도합괄적족화분.실험결과표명,해산법재처리능력화운산속도상우우원산법.