计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2005年
14期
179-181,228
,共4页
孟祥萍%王华金%王贤勇%任纪川%鞠传香
孟祥萍%王華金%王賢勇%任紀川%鞠傳香
맹상평%왕화금%왕현용%임기천%국전향
数据挖掘%关联规则%最大频繁模式%改进FP-树
數據挖掘%關聯規則%最大頻繁模式%改進FP-樹
수거알굴%관련규칙%최대빈번모식%개진FP-수
频繁模式挖掘是数据挖掘领域中的一个非常重要的分支,但是由于其内在的计算复杂性,挖掘密集型数据的频繁模式完全集非常困难而且数量往往大得惊人,难以理解和应用.最大频繁模式(最大模式)压缩隐含了所有的频繁模式,存储所占用的空间远远小于完全集,因而最大模式挖掘具有十分重要的意义.该文改进了传统的FP-树结构并提出了一种有效的基于改进FP-树的最大模式挖掘算法IFP-Max;通过引入后缀子树的概念,算法在挖掘过程中不用生成最大频繁模式候选集,从而大大提高了算法的时间效率和空间可伸缩性.实验表明,IFP-Max的挖掘速度比MAFIA和GenMax大约快一个数量级.
頻繁模式挖掘是數據挖掘領域中的一箇非常重要的分支,但是由于其內在的計算複雜性,挖掘密集型數據的頻繁模式完全集非常睏難而且數量往往大得驚人,難以理解和應用.最大頻繁模式(最大模式)壓縮隱含瞭所有的頻繁模式,存儲所佔用的空間遠遠小于完全集,因而最大模式挖掘具有十分重要的意義.該文改進瞭傳統的FP-樹結構併提齣瞭一種有效的基于改進FP-樹的最大模式挖掘算法IFP-Max;通過引入後綴子樹的概唸,算法在挖掘過程中不用生成最大頻繁模式候選集,從而大大提高瞭算法的時間效率和空間可伸縮性.實驗錶明,IFP-Max的挖掘速度比MAFIA和GenMax大約快一箇數量級.
빈번모식알굴시수거알굴영역중적일개비상중요적분지,단시유우기내재적계산복잡성,알굴밀집형수거적빈번모식완전집비상곤난이차수량왕왕대득량인,난이리해화응용.최대빈번모식(최대모식)압축은함료소유적빈번모식,존저소점용적공간원원소우완전집,인이최대모식알굴구유십분중요적의의.해문개진료전통적FP-수결구병제출료일충유효적기우개진FP-수적최대모식알굴산법IFP-Max;통과인입후철자수적개념,산법재알굴과정중불용생성최대빈번모식후선집,종이대대제고료산법적시간효솔화공간가신축성.실험표명,IFP-Max적알굴속도비MAFIA화GenMax대약쾌일개수량급.