小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2012年
8期
1747-1751
,共5页
频繁项集%二进制数组%倒排索引%深度优先搜索
頻繁項集%二進製數組%倒排索引%深度優先搜索
빈번항집%이진제수조%도배색인%심도우선수색
频繁项集挖掘是关联规则挖掘中的关键任务,非常耗费时间.为提高频繁项集的产生效率,提出一种基于倒排索引位运算的深度优先频繁项集挖掘算法(DF-FIMBIIⅡ).该算法以二进制数组存储项目到事务的倒排索引,通过位运算计算两个项目的支持计数,并采用深度优先搜索策略递归地挖掘不同的k-频繁项集.在chess、mushroom、pumb_star、T40I10D100K等数据集上,对DF-FIMBⅡ、Apriori、ECLAT、BitTableFI、Index-BitTableFI等算法进行了实验比较.实验结果表明,在数据规模不是非常巨大和支持度较小的情况下,无论数据集的稠密程度如何,DF-FIMBⅡ均具有较好的时间优越性.
頻繁項集挖掘是關聯規則挖掘中的關鍵任務,非常耗費時間.為提高頻繁項集的產生效率,提齣一種基于倒排索引位運算的深度優先頻繁項集挖掘算法(DF-FIMBIIⅡ).該算法以二進製數組存儲項目到事務的倒排索引,通過位運算計算兩箇項目的支持計數,併採用深度優先搜索策略遞歸地挖掘不同的k-頻繁項集.在chess、mushroom、pumb_star、T40I10D100K等數據集上,對DF-FIMBⅡ、Apriori、ECLAT、BitTableFI、Index-BitTableFI等算法進行瞭實驗比較.實驗結果錶明,在數據規模不是非常巨大和支持度較小的情況下,無論數據集的稠密程度如何,DF-FIMBⅡ均具有較好的時間優越性.
빈번항집알굴시관련규칙알굴중적관건임무,비상모비시간.위제고빈번항집적산생효솔,제출일충기우도배색인위운산적심도우선빈번항집알굴산법(DF-FIMBIIⅡ).해산법이이진제수조존저항목도사무적도배색인,통과위운산계산량개항목적지지계수,병채용심도우선수색책략체귀지알굴불동적k-빈번항집.재chess、mushroom、pumb_star、T40I10D100K등수거집상,대DF-FIMBⅡ、Apriori、ECLAT、BitTableFI、Index-BitTableFI등산법진행료실험비교.실험결과표명,재수거규모불시비상거대화지지도교소적정황하,무론수거집적주밀정도여하,DF-FIMBⅡ균구유교호적시간우월성.