东莞理工学院学报
東莞理工學院學報
동완리공학원학보
JOURNAL OF DONGGUAN INSTITUTE OF TECHNOLOGY
2014年
3期
35-40
,共6页
分布式%关联规则%挖掘模型
分佈式%關聯規則%挖掘模型
분포식%관련규칙%알굴모형
distributed%association rule%mining model
数据挖掘本质上是一种新的商业信息处理技术,通过对数据进行统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识,用以指导高级商务活动。由于需要,对数据间的关联性的数据挖掘算法模型已成为数据库及相关领域的一个研究热点,给出了一种基于分布式数据库的挖掘模型及其相应的一种有效的挖掘算法,其由若干个站点集合而成,各个站点拥有各自的数据库、中央处理机、客户端,以及各自的局部数据库管理系统,依靠通讯网络连接。采用购物篮分析式关联规则,将各个数据库文件的数据合成,从而得到挖掘结果,对挖掘的方法又进一步挖掘,即将不满足条件的规则重新传送到各分布式站点上进行更加精确的挖掘处理,从而避免了频繁的网络通讯。该算法在减轻网络频繁的通讯负担,体现并行计算以及异构数据挖掘方面具有独特优点。
數據挖掘本質上是一種新的商業信息處理技術,通過對數據進行統計、分析、綜閤和推理,髮現數據間的關聯性、未來趨勢以及一般性的概括知識,用以指導高級商務活動。由于需要,對數據間的關聯性的數據挖掘算法模型已成為數據庫及相關領域的一箇研究熱點,給齣瞭一種基于分佈式數據庫的挖掘模型及其相應的一種有效的挖掘算法,其由若榦箇站點集閤而成,各箇站點擁有各自的數據庫、中央處理機、客戶耑,以及各自的跼部數據庫管理繫統,依靠通訊網絡連接。採用購物籃分析式關聯規則,將各箇數據庫文件的數據閤成,從而得到挖掘結果,對挖掘的方法又進一步挖掘,即將不滿足條件的規則重新傳送到各分佈式站點上進行更加精確的挖掘處理,從而避免瞭頻繁的網絡通訊。該算法在減輕網絡頻繁的通訊負擔,體現併行計算以及異構數據挖掘方麵具有獨特優點。
수거알굴본질상시일충신적상업신식처리기술,통과대수거진행통계、분석、종합화추리,발현수거간적관련성、미래추세이급일반성적개괄지식,용이지도고급상무활동。유우수요,대수거간적관련성적수거알굴산법모형이성위수거고급상관영역적일개연구열점,급출료일충기우분포식수거고적알굴모형급기상응적일충유효적알굴산법,기유약간개참점집합이성,각개참점옹유각자적수거고、중앙처리궤、객호단,이급각자적국부수거고관리계통,의고통신망락련접。채용구물람분석식관련규칙,장각개수거고문건적수거합성,종이득도알굴결과,대알굴적방법우진일보알굴,즉장불만족조건적규칙중신전송도각분포식참점상진행경가정학적알굴처리,종이피면료빈번적망락통신。해산법재감경망락빈번적통신부담,체현병행계산이급이구수거알굴방면구유독특우점。
Data mining is a new business information processing technology .Through microcosmic , medium even macro-scopic statistic, analysis, synthesizing and inference , it can find the co-relation between data, trends and generality of knowledge in order to guide senior business activities .Data mining algorithm model has been a hot topic in the database and relational field .This paper introduces a mining model based on distributed database and presents an efficient mining algorithm .It includes a few stations , and each station has individual database , CPU, client-side and the manage system of local database , connected by communication internet.Through shopping basket analysis association rule and integrating every database file , it gets a mining result, and then makes a further mining upon the mining method , transports the rules which are not fit with the requirements back to each distributed station to make a more accurate mining process , thus avoiding the frequent internet communication .This algorithm can reduce fre-quent communication burden , owning an distinguishing virtue in parallel arithmetic computing and asynchronous operation&hetero -geneous mining .