计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2013年
9期
63-65,198
,共4页
频繁项集%海量数据%PFP-Growth
頻繁項集%海量數據%PFP-Growth
빈번항집%해량수거%PFP-Growth
frequent itemset%massive data%PFP-Growth
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。
隨著互聯網技術的髮展,網絡數據變得越來越巨大,如何從中挖掘有效信息成為人們研究的重點。近年來頻繁項集挖掘由于其在關聯規則挖掘、相關挖掘等任務中的相關重要作用,越來越受到人們的重視。文中針對分佈式計算環境下頻繁項集挖掘算法的研究,對PFP-Growth算法進行瞭改進,通過MapReduce編程模型對改進的PFP-Growth算法進行瞭實現和應用,使用戶可以從海量數據中高效地穫得所有需要的頻繁項集。實驗結果錶明算法在針對海量數據時具有較高的效率和伸縮性。
수착호련망기술적발전,망락수거변득월래월거대,여하종중알굴유효신식성위인문연구적중점。근년래빈번항집알굴유우기재관련규칙알굴、상관알굴등임무중적상관중요작용,월래월수도인문적중시。문중침대분포식계산배경하빈번항집알굴산법적연구,대PFP-Growth산법진행료개진,통과MapReduce편정모형대개진적PFP-Growth산법진행료실현화응용,사용호가이종해량수거중고효지획득소유수요적빈번항집。실험결과표명산법재침대해량수거시구유교고적효솔화신축성。
As the development of Internet,the data on it becomes more massive. How to mine useful information from the Internet is the key of study. In recent years,frequent item mining which plays an important role in associations rule mining and correlations mining be-comes popular among researchers. By the study of mining frequent itemsets based on cloud computing,the PFP-Growth algorithm is im-proved. Run the algorithm under the MapReduce model which allows users to obtain all required frequent itemsets efficiently from mas-sive data,the results of experiment shows the algorithm has good efficiency and flexibility.