华北科技学院学报
華北科技學院學報
화북과기학원학보
Journal of North China Institute of Science and Technology
2015年
4期
119-124
,共6页
分布式数据流%数据挖掘%分类
分佈式數據流%數據挖掘%分類
분포식수거류%수거알굴%분류
随着数据采集和生成技术的不断成熟,能够生成数据流的应用越来越多,近些年,网络应用进一步普及,单一数据流的应用向着多节点的分布式数据流方向转移,如传感器网络、网络监控、WEB日志以及多站点的信用卡交易数据.这些数据不仅具有实时、连续、规模大的特点,还具有分布式的特征,如何管理和分析大规模的分布式的动态数据集,是研究人员面临的重要课题.针对这种现状,本文给出了同构分布式数据流和异构分布式数据流的形式化描述,分析了集中式流处理架构与分布式流处理架构的优势与不足,讨论了分布式数据流分类算法的最新进展,归纳了分布式数据流挖掘面临的问题和挑战,以及未来可能的研究方向.
隨著數據採集和生成技術的不斷成熟,能夠生成數據流的應用越來越多,近些年,網絡應用進一步普及,單一數據流的應用嚮著多節點的分佈式數據流方嚮轉移,如傳感器網絡、網絡鑑控、WEB日誌以及多站點的信用卡交易數據.這些數據不僅具有實時、連續、規模大的特點,還具有分佈式的特徵,如何管理和分析大規模的分佈式的動態數據集,是研究人員麵臨的重要課題.針對這種現狀,本文給齣瞭同構分佈式數據流和異構分佈式數據流的形式化描述,分析瞭集中式流處理架構與分佈式流處理架構的優勢與不足,討論瞭分佈式數據流分類算法的最新進展,歸納瞭分佈式數據流挖掘麵臨的問題和挑戰,以及未來可能的研究方嚮.
수착수거채집화생성기술적불단성숙,능구생성수거류적응용월래월다,근사년,망락응용진일보보급,단일수거류적응용향착다절점적분포식수거류방향전이,여전감기망락、망락감공、WEB일지이급다참점적신용잡교역수거.저사수거불부구유실시、련속、규모대적특점,환구유분포식적특정,여하관리화분석대규모적분포식적동태수거집,시연구인원면림적중요과제.침대저충현상,본문급출료동구분포식수거류화이구분포식수거류적형식화묘술,분석료집중식류처리가구여분포식류처리가구적우세여불족,토론료분포식수거류분류산법적최신진전,귀납료분포식수거류알굴면림적문제화도전,이급미래가능적연구방향.