计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2012年
8期
2837-2840
,共4页
巨瑜芳%雷小锋%戴斌%庄伟%宋丰泰
巨瑜芳%雷小鋒%戴斌%莊偉%宋豐泰
거유방%뢰소봉%대빈%장위%송봉태
聚类分析%离散傅里叶变换%连通图%最短路径K近邻查询%最佳阈值
聚類分析%離散傅裏葉變換%連通圖%最短路徑K近鄰查詢%最佳閾值
취류분석%리산부리협변환%련통도%최단로경K근린사순%최가역치
聚类是假设数据在具有某种群聚结构的前提下根据观察到的无标记的样本发现数据的最优划分.针对已有的聚类算法存在的缺点,假设数据样本的结果簇是密集的,且簇与簇之间区别明显,基于该假设提出一种基于傅里叶变换和连通图的聚类分析方法FGClus.首先针对每个样本点计算k阶距离矩阵并序列化作为离散傅里叶变换的输入信号;然后抽取频域内幅值最小的复数项并构造输入序列进行傅里叶逆变换,得到在时域空间中的最佳阈值;最后利用该阈值结合连通图指导最终的聚类过程.实验表明,FGClus算法克服了K-means算法聚类前需确定聚类个数、聚类结果对初始代表点的选取敏感、只能聚类球状数据等缺点,取得了良好的聚类效果.
聚類是假設數據在具有某種群聚結構的前提下根據觀察到的無標記的樣本髮現數據的最優劃分.針對已有的聚類算法存在的缺點,假設數據樣本的結果簇是密集的,且簇與簇之間區彆明顯,基于該假設提齣一種基于傅裏葉變換和連通圖的聚類分析方法FGClus.首先針對每箇樣本點計算k階距離矩陣併序列化作為離散傅裏葉變換的輸入信號;然後抽取頻域內幅值最小的複數項併構造輸入序列進行傅裏葉逆變換,得到在時域空間中的最佳閾值;最後利用該閾值結閤連通圖指導最終的聚類過程.實驗錶明,FGClus算法剋服瞭K-means算法聚類前需確定聚類箇數、聚類結果對初始代錶點的選取敏感、隻能聚類毬狀數據等缺點,取得瞭良好的聚類效果.
취류시가설수거재구유모충군취결구적전제하근거관찰도적무표기적양본발현수거적최우화분.침대이유적취류산법존재적결점,가설수거양본적결과족시밀집적,차족여족지간구별명현,기우해가설제출일충기우부리협변환화련통도적취류분석방법FGClus.수선침대매개양본점계산k계거리구진병서렬화작위리산부리협변환적수입신호;연후추취빈역내폭치최소적복수항병구조수입서렬진행부리협역변환,득도재시역공간중적최가역치;최후이용해역치결합련통도지도최종적취류과정.실험표명,FGClus산법극복료K-means산법취류전수학정취류개수、취류결과대초시대표점적선취민감、지능취류구상수거등결점,취득료량호적취류효과.