微型机与应用
微型機與應用
미형궤여응용
MICROCOMPUTER & ITS APPLICATIONS
2014年
1期
67-70
,共4页
增量数据挖掘%MapReduce%增量挖掘二叉树%频繁项集
增量數據挖掘%MapReduce%增量挖掘二扠樹%頻繁項集
증량수거알굴%MapReduce%증량알굴이차수%빈번항집
incremental data mining%MapReduce%IMBT%frequent itemset
频繁项集挖掘是数据挖掘过程中的重要部分,传统数据挖掘算法中常用 Apriori 算法和FP 增长算法来挖掘频繁项集。在实际应用中,传统算法往往不能用于频繁更新的数据库,采用 IMBT数据结构能从不断更新的数据库中挖掘频繁项集,但是这将导致存储空间不足和运行效率低下的问题。基于 MapReduce 的增量数据挖掘能够有效解决这些问题,通过对比基于 MapReduce 的增量数据挖掘和传统增量数据挖掘的运行时间可以证明,基于 Mapeduce 的增量数据挖掘更高效。
頻繁項集挖掘是數據挖掘過程中的重要部分,傳統數據挖掘算法中常用 Apriori 算法和FP 增長算法來挖掘頻繁項集。在實際應用中,傳統算法往往不能用于頻繁更新的數據庫,採用 IMBT數據結構能從不斷更新的數據庫中挖掘頻繁項集,但是這將導緻存儲空間不足和運行效率低下的問題。基于 MapReduce 的增量數據挖掘能夠有效解決這些問題,通過對比基于 MapReduce 的增量數據挖掘和傳統增量數據挖掘的運行時間可以證明,基于 Mapeduce 的增量數據挖掘更高效。
빈번항집알굴시수거알굴과정중적중요부분,전통수거알굴산법중상용 Apriori 산법화FP 증장산법래알굴빈번항집。재실제응용중,전통산법왕왕불능용우빈번경신적수거고,채용 IMBT수거결구능종불단경신적수거고중알굴빈번항집,단시저장도치존저공간불족화운행효솔저하적문제。기우 MapReduce 적증량수거알굴능구유효해결저사문제,통과대비기우 MapReduce 적증량수거알굴화전통증량수거알굴적운행시간가이증명,기우 Mapeduce 적증량수거알굴경고효。
Frequent itemset mining is an important part of data mining. Apriori and FP-tree are often used to mine frequent itemsets in traditional data mining algorithms. In practical situation, the traditional algorithms often cannot be used in the database which updates frequently. IMBT data structure is used to mine frequent itemsets from a continuously updated database , but this will lead to lack of storage space and the low efficiency. Incremental data mining based on MapReduce can solve these problems , To compare the running time of incremental data mining based on MapReduce and traditional incremental data mining can demonstrate the incremental data mining based on MapReduce is more efficient.