计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2008年
3期
206-208
,共3页
任家东%李可%冯佳音%杨楠
任傢東%李可%馮佳音%楊楠
임가동%리가%풍가음%양남
分布式数据流%频繁项%算法
分佈式數據流%頻繁項%算法
분포식수거류%빈번항%산법
传统的分布式数据流挖掘模型是一种挖掘结果中逐层进行的层次模型,通信带宽是一个瓶颈.为了减少分布式数据流结点的通信,本文采用一种基于数据密度的偏倚抽样方法对分布式数据流组中的每个流进行抽样,只维护抽样数据中最近期的元素.在频繁项挖掘过程中,设计了一种哈希计数方法(不同于传统哈希计数算法),可以同时对数据的计数进行增加和删减,计数的值是有一定误差保证的近似值,算法称为FFIDDS算法.实验结果证明,通信负担和处理时间均明显比传统HCS模型的算法优秀.
傳統的分佈式數據流挖掘模型是一種挖掘結果中逐層進行的層次模型,通信帶寬是一箇瓶頸.為瞭減少分佈式數據流結點的通信,本文採用一種基于數據密度的偏倚抽樣方法對分佈式數據流組中的每箇流進行抽樣,隻維護抽樣數據中最近期的元素.在頻繁項挖掘過程中,設計瞭一種哈希計數方法(不同于傳統哈希計數算法),可以同時對數據的計數進行增加和刪減,計數的值是有一定誤差保證的近似值,算法稱為FFIDDS算法.實驗結果證明,通信負擔和處理時間均明顯比傳統HCS模型的算法優秀.
전통적분포식수거류알굴모형시일충알굴결과중축층진행적층차모형,통신대관시일개병경.위료감소분포식수거류결점적통신,본문채용일충기우수거밀도적편의추양방법대분포식수거류조중적매개류진행추양,지유호추양수거중최근기적원소.재빈번항알굴과정중,설계료일충합희계수방법(불동우전통합희계수산법),가이동시대수거적계수진행증가화산감,계수적치시유일정오차보증적근사치,산법칭위FFIDDS산법.실험결과증명,통신부담화처리시간균명현비전통HCS모형적산법우수.