情报学报
情報學報
정보학보
2010年
5期
864-871
,共8页
数据流%最大频繁项集%滑动窗口%有序复合FP-tree
數據流%最大頻繁項集%滑動窗口%有序複閤FP-tree
수거류%최대빈번항집%활동창구%유서복합FP-tree
挖掘最大频繁项集的优势在于得到的项目数量较少.相比频繁项集和频繁闭合项集挖掘算法,此类算法具有较高的时间和空间效率.根据数据流的特点,结合滑动窗口,提出一种基于有序复合策略的数据流最大频繁项集挖掘算法(E-FPMFI).当数据流流过时,以基本窗口为单位,更新获取数据流片段信息,单遍扫描片段信息得到频繁项目并存储于频繁项目列表内.算法的核心思想:构建有序FP-tree,采用混合子集剪枝技术削减搜索空间,合并同一分支中支持数相等的邻接结点,压缩生成有序复合FP-tree,挖掘最大频繁项集时避免超集检验.经实验验证, E-FPMFI算法具有较好的时空效率和良好的可扩展性.
挖掘最大頻繁項集的優勢在于得到的項目數量較少.相比頻繁項集和頻繁閉閤項集挖掘算法,此類算法具有較高的時間和空間效率.根據數據流的特點,結閤滑動窗口,提齣一種基于有序複閤策略的數據流最大頻繁項集挖掘算法(E-FPMFI).噹數據流流過時,以基本窗口為單位,更新穫取數據流片段信息,單遍掃描片段信息得到頻繁項目併存儲于頻繁項目列錶內.算法的覈心思想:構建有序FP-tree,採用混閤子集剪枝技術削減搜索空間,閤併同一分支中支持數相等的鄰接結點,壓縮生成有序複閤FP-tree,挖掘最大頻繁項集時避免超集檢驗.經實驗驗證, E-FPMFI算法具有較好的時空效率和良好的可擴展性.
알굴최대빈번항집적우세재우득도적항목수량교소.상비빈번항집화빈번폐합항집알굴산법,차류산법구유교고적시간화공간효솔.근거수거류적특점,결합활동창구,제출일충기우유서복합책략적수거류최대빈번항집알굴산법(E-FPMFI).당수거류류과시,이기본창구위단위,경신획취수거류편단신식,단편소묘편단신식득도빈번항목병존저우빈번항목렬표내.산법적핵심사상:구건유서FP-tree,채용혼합자집전지기술삭감수색공간,합병동일분지중지지수상등적린접결점,압축생성유서복합FP-tree,알굴최대빈번항집시피면초집검험.경실험험증, E-FPMFI산법구유교호적시공효솔화량호적가확전성.