计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2013年
1期
202-206
,共5页
数据流%聚类%物元%关联函数%经典域%节域
數據流%聚類%物元%關聯函數%經典域%節域
수거류%취류%물원%관련함수%경전역%절역
传统数据流聚类算法大多基于距离或密度,聚类质量和处理效率都不高.针对以上问题,提出了一种基于关联函数的数据流聚类算法.首先,将数据点以物元的形式模型化,建立解决问题所需要的关联函数;其次,计算关联函数的值,以此值的大小来判断数据点属于某簇的程度;然后,将所提方法运用到数据流聚类的在线-离线框架中;最后,采用真实数据集KDD-CUP99和随机生成的人工数据集进行算法的测试.实验结果表明,所提方法的聚类纯度在92%以上,每秒能处理约6300条记录,与传统算法相比,处理效率有了较大的提高,在维度和簇数目方面的可扩展性较强,适用于处理大规模的动态数据集.
傳統數據流聚類算法大多基于距離或密度,聚類質量和處理效率都不高.針對以上問題,提齣瞭一種基于關聯函數的數據流聚類算法.首先,將數據點以物元的形式模型化,建立解決問題所需要的關聯函數;其次,計算關聯函數的值,以此值的大小來判斷數據點屬于某簇的程度;然後,將所提方法運用到數據流聚類的在線-離線框架中;最後,採用真實數據集KDD-CUP99和隨機生成的人工數據集進行算法的測試.實驗結果錶明,所提方法的聚類純度在92%以上,每秒能處理約6300條記錄,與傳統算法相比,處理效率有瞭較大的提高,在維度和簇數目方麵的可擴展性較彊,適用于處理大規模的動態數據集.
전통수거류취류산법대다기우거리혹밀도,취류질량화처리효솔도불고.침대이상문제,제출료일충기우관련함수적수거류취류산법.수선,장수거점이물원적형식모형화,건립해결문제소수요적관련함수;기차,계산관련함수적치,이차치적대소래판단수거점속우모족적정도;연후,장소제방법운용도수거류취류적재선-리선광가중;최후,채용진실수거집KDD-CUP99화수궤생성적인공수거집진행산법적측시.실험결과표명,소제방법적취류순도재92%이상,매초능처리약6300조기록,여전통산법상비,처리효솔유료교대적제고,재유도화족수목방면적가확전성교강,괄용우처리대규모적동태수거집.