电子世界
電子世界
전자세계
ELECTRONICS WORLD
2013年
10期
17-19
,共3页
数据挖掘%单向FP_tree%最大频繁项集
數據挖掘%單嚮FP_tree%最大頻繁項集
수거알굴%단향FP_tree%최대빈번항집
频繁项集挖掘算法是数据挖掘的主要研究方向.目前主流的频繁项集挖掘算法有:产生候选频繁项集和不产生候选频繁项集两种,分别是Apriori算法、FP_growth算法.这两种算法各有优缺点.本文在分析现有算法的基础上,充分利用FP_tree信息压缩的优点,设计出一种产生候选项集的最大频繁项集挖掘算法.该算法首先构造一棵单向FP_tree,再利用最大频繁项集特性对候选项集进行剪枝,不需要扫描数据库计算候选项集的支持数.仿真实验表明,与现有算法相比,该算法的时、空效率都有巨大提高.
頻繁項集挖掘算法是數據挖掘的主要研究方嚮.目前主流的頻繁項集挖掘算法有:產生候選頻繁項集和不產生候選頻繁項集兩種,分彆是Apriori算法、FP_growth算法.這兩種算法各有優缺點.本文在分析現有算法的基礎上,充分利用FP_tree信息壓縮的優點,設計齣一種產生候選項集的最大頻繁項集挖掘算法.該算法首先構造一棵單嚮FP_tree,再利用最大頻繁項集特性對候選項集進行剪枝,不需要掃描數據庫計算候選項集的支持數.倣真實驗錶明,與現有算法相比,該算法的時、空效率都有巨大提高.
빈번항집알굴산법시수거알굴적주요연구방향.목전주류적빈번항집알굴산법유:산생후선빈번항집화불산생후선빈번항집량충,분별시Apriori산법、FP_growth산법.저량충산법각유우결점.본문재분석현유산법적기출상,충분이용FP_tree신식압축적우점,설계출일충산생후선항집적최대빈번항집알굴산법.해산법수선구조일과단향FP_tree,재이용최대빈번항집특성대후선항집진행전지,불수요소묘수거고계산후선항집적지지수.방진실험표명,여현유산법상비,해산법적시、공효솔도유거대제고.