小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2013年
11期
2451-2455
,共5页
流数据%框架%聚类%微簇
流數據%框架%聚類%微簇
류수거%광가%취류%미족
stream data%framework%clustering%micro-cluster
面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人为摸索.针对这些不足和流数据环境普遍采用的两层聚类框架,提出了基于微簇优化的三层流数据聚类框架,并在此基础上提出了基于最优2k近邻的流数据聚类算法.该算法的在线层不断地凝聚微簇的密集状态,优化微簇并自适应地调整微簇半径,而离线聚类层还利用先验聚类结果调整聚类参数.实验结果表明,所提出的算法提高了流数据聚类的稳定性、精确性和可扩展性,具有良好的聚类效果.
麵嚮流數據的傳統聚類算法主要有3箇方麵的不足,一是對流數據不斷進入的動態環境不太適應;二是其微簇半徑不能隨流數據分佈的密度變化進行相應的伸縮;三是其聚類閾值嚴重依賴人為摸索.針對這些不足和流數據環境普遍採用的兩層聚類框架,提齣瞭基于微簇優化的三層流數據聚類框架,併在此基礎上提齣瞭基于最優2k近鄰的流數據聚類算法.該算法的在線層不斷地凝聚微簇的密集狀態,優化微簇併自適應地調整微簇半徑,而離線聚類層還利用先驗聚類結果調整聚類參數.實驗結果錶明,所提齣的算法提高瞭流數據聚類的穩定性、精確性和可擴展性,具有良好的聚類效果.
면향류수거적전통취류산법주요유3개방면적불족,일시대류수거불단진입적동태배경불태괄응;이시기미족반경불능수류수거분포적밀도변화진행상응적신축;삼시기취류역치엄중의뢰인위모색.침대저사불족화류수거배경보편채용적량층취류광가,제출료기우미족우화적삼층류수거취류광가,병재차기출상제출료기우최우2k근린적류수거취류산법.해산법적재선층불단지응취미족적밀집상태,우화미족병자괄응지조정미족반경,이리선취류층환이용선험취류결과조정취류삼수.실험결과표명,소제출적산법제고료류수거취류적은정성、정학성화가확전성,구유량호적취류효과.