燕山大学学报
燕山大學學報
연산대학학보
JOURNAL OF YANSHAN UNIVERSITY
2011年
2期
115-120
,共6页
数据流%频繁模式%频繁模式有向无环图
數據流%頻繁模式%頻繁模式有嚮無環圖
수거류%빈번모식%빈번모식유향무배도
频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据.本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号.通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式.实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少.
頻繁模式挖掘中基于FP-growth的算法需要掃描兩次事務數據庫,預先給定支持度,且不支持時間敏感型數據.本文提齣瞭一種基于頻繁模式有嚮無環圖的數據流頻繁模式挖掘算法,它根據事務到來的時間給每箇事務一箇序號,每箇事務中的數據項在存儲前按數據項的順序進行調整,頻繁模式有嚮無環圖的構建遵循這箇順序併用序號來記錄事務與數據項的包含關繫,模式增長過程隻需要增加有嚮邊上的序號.通過逆嚮遍歷帶有相同序號的有嚮邊,產生條件模式基,根據動態定義的閾值抽取條件模式基信息,一次掃描數據庫得到頻繁模式.實驗結果錶明,本文算法的執行效率優于FP-growth算法,且存儲節點的數目明顯減少.
빈번모식알굴중기우FP-growth적산법수요소묘량차사무수거고,예선급정지지도,차불지지시간민감형수거.본문제출료일충기우빈번모식유향무배도적수거류빈번모식알굴산법,타근거사무도래적시간급매개사무일개서호,매개사무중적수거항재존저전안수거항적순서진행조정,빈번모식유향무배도적구건준순저개순서병용서호래기록사무여수거항적포함관계,모식증장과정지수요증가유향변상적서호.통과역향편력대유상동서호적유향변,산생조건모식기,근거동태정의적역치추취조건모식기신식,일차소묘수거고득도빈번모식.실험결과표명,본문산법적집행효솔우우FP-growth산법,차존저절점적수목명현감소.