计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2015年
z1期
459-461,483
,共4页
日志文件%频繁集%Hadoop%Fp-growth
日誌文件%頻繁集%Hadoop%Fp-growth
일지문건%빈번집%Hadoop%Fp-growth
Log file%Frequent itemset%Hadoop%Fp-growth
针对用户历史检索过程产生的Web日志文件,研究其查询词和点击链接是否为频繁集,以及在分布式条件下频繁集挖掘的效率问题.基于Hadoop框架,设计了并行Fp-growth算法,对搜索引擎Web日志进行挖掘.仿真实验结果显示,满足支持度的查询词和点击链接频繁集在Web日志中普遍存在.随着Hadoop节点数的增加,并行Fp-growth算法性能将得到大幅提高.由此,频繁集挖掘效率得到明显提高,且数据量越大,效率提升越明显.
針對用戶歷史檢索過程產生的Web日誌文件,研究其查詢詞和點擊鏈接是否為頻繁集,以及在分佈式條件下頻繁集挖掘的效率問題.基于Hadoop框架,設計瞭併行Fp-growth算法,對搜索引擎Web日誌進行挖掘.倣真實驗結果顯示,滿足支持度的查詢詞和點擊鏈接頻繁集在Web日誌中普遍存在.隨著Hadoop節點數的增加,併行Fp-growth算法性能將得到大幅提高.由此,頻繁集挖掘效率得到明顯提高,且數據量越大,效率提升越明顯.
침대용호역사검색과정산생적Web일지문건,연구기사순사화점격련접시부위빈번집,이급재분포식조건하빈번집알굴적효솔문제.기우Hadoop광가,설계료병행Fp-growth산법,대수색인경Web일지진행알굴.방진실험결과현시,만족지지도적사순사화점격련접빈번집재Web일지중보편존재.수착Hadoop절점수적증가,병행Fp-growth산법성능장득도대폭제고.유차,빈번집알굴효솔득도명현제고,차수거량월대,효솔제승월명현.