计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2014年
4期
146-150
,共5页
数据挖掘%数据流%聚类%聚类分析%密度%双层网格
數據挖掘%數據流%聚類%聚類分析%密度%雙層網格
수거알굴%수거류%취류%취류분석%밀도%쌍층망격
data mining%data stream%clustering%clustering analysis%density%double-layer grid
传统的基于网格的数据流聚类算法在同一粒度的网格上进行聚类,虽然提高了处理速度,但聚类准确性较低.针对此问题,提出一种新的基于双层网格和密度的数据流聚类算法DBG-Stream.在2种粒度的网格上对数据流进行聚类,并借鉴CluStream 算法的思想,将聚类过程分为2个阶段.在线过程中利用粗粒度的网格单元形成初始聚类,离线过程中在细粒度网格单元上,对位于簇边界的网格单元进行二次聚类以提高聚类精度,并实现了关键参数的自动设置,通过删格策略提高算法效率.实验结果表明,DBG-Stream算法的聚类精确度较D-Stream算法有较大提高,有效解决了传统基于网格聚类算法的聚类精度较低的问题.
傳統的基于網格的數據流聚類算法在同一粒度的網格上進行聚類,雖然提高瞭處理速度,但聚類準確性較低.針對此問題,提齣一種新的基于雙層網格和密度的數據流聚類算法DBG-Stream.在2種粒度的網格上對數據流進行聚類,併藉鑒CluStream 算法的思想,將聚類過程分為2箇階段.在線過程中利用粗粒度的網格單元形成初始聚類,離線過程中在細粒度網格單元上,對位于簇邊界的網格單元進行二次聚類以提高聚類精度,併實現瞭關鍵參數的自動設置,通過刪格策略提高算法效率.實驗結果錶明,DBG-Stream算法的聚類精確度較D-Stream算法有較大提高,有效解決瞭傳統基于網格聚類算法的聚類精度較低的問題.
전통적기우망격적수거류취류산법재동일립도적망격상진행취류,수연제고료처리속도,단취류준학성교저.침대차문제,제출일충신적기우쌍층망격화밀도적수거류취류산법DBG-Stream.재2충립도적망격상대수거류진행취류,병차감CluStream 산법적사상,장취류과정분위2개계단.재선과정중이용조립도적망격단원형성초시취류,리선과정중재세립도망격단원상,대위우족변계적망격단원진행이차취류이제고취류정도,병실현료관건삼수적자동설치,통과산격책략제고산법효솔.실험결과표명,DBG-Stream산법적취류정학도교D-Stream산법유교대제고,유효해결료전통기우망격취류산법적취류정도교저적문제.