软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2011年
12期
2965-2980
,共16页
分类数据%多层关联规则%概化关联规则%层次聚类%约简划分
分類數據%多層關聯規則%概化關聯規則%層次聚類%約簡劃分
분류수거%다층관련규칙%개화관련규칙%층차취류%약간화분
通过对分类数据的深入研究,提出了一种高效的多层关联规则挖掘方法:首先,根据分类数据所在的领域知识构建基于领域知识的项相关性模型DICM(domain knowledge-based item correlation model),并通过该模型对分类数据的项进行层次聚类;然后,基于项的聚类结果对事务数据库进行约简划分;最后,将约简划分后的事务数据库映射至一种压缩的AFOPT树形结构,并通过遍历AFOPT树替代原事务数据库来挖掘频繁项集,由于缩小了事务数据库规模,并采用了压缩的AFOPT结构,所提出的方法有效地节省了算法的I/O时间,极大地提升了多层关联规则的挖掘效率.基于该方法,给出了一种自顶向下的多层关联规则挖掘算法TD-CBP-MLARM和一种自底向上的多层关联规则挖掘算法BU-CBP-MLARM.此外,还将该挖掘方法成功扩展至概化关联规则挖掘领域,提出了一种高效的概化关联规则挖掘算法CBP-GARM通过大量人工随机生成数据的实验证明,所提出的多层和概化关联规则挖掘算法不仅可以确保频繁项集挖掘结果的正确性和完整性,还比现有同类最新算法具有更好的挖掘效率和扩展性.
通過對分類數據的深入研究,提齣瞭一種高效的多層關聯規則挖掘方法:首先,根據分類數據所在的領域知識構建基于領域知識的項相關性模型DICM(domain knowledge-based item correlation model),併通過該模型對分類數據的項進行層次聚類;然後,基于項的聚類結果對事務數據庫進行約簡劃分;最後,將約簡劃分後的事務數據庫映射至一種壓縮的AFOPT樹形結構,併通過遍歷AFOPT樹替代原事務數據庫來挖掘頻繁項集,由于縮小瞭事務數據庫規模,併採用瞭壓縮的AFOPT結構,所提齣的方法有效地節省瞭算法的I/O時間,極大地提升瞭多層關聯規則的挖掘效率.基于該方法,給齣瞭一種自頂嚮下的多層關聯規則挖掘算法TD-CBP-MLARM和一種自底嚮上的多層關聯規則挖掘算法BU-CBP-MLARM.此外,還將該挖掘方法成功擴展至概化關聯規則挖掘領域,提齣瞭一種高效的概化關聯規則挖掘算法CBP-GARM通過大量人工隨機生成數據的實驗證明,所提齣的多層和概化關聯規則挖掘算法不僅可以確保頻繁項集挖掘結果的正確性和完整性,還比現有同類最新算法具有更好的挖掘效率和擴展性.
통과대분류수거적심입연구,제출료일충고효적다층관련규칙알굴방법:수선,근거분류수거소재적영역지식구건기우영역지식적항상관성모형DICM(domain knowledge-based item correlation model),병통과해모형대분류수거적항진행층차취류;연후,기우항적취류결과대사무수거고진행약간화분;최후,장약간화분후적사무수거고영사지일충압축적AFOPT수형결구,병통과편력AFOPT수체대원사무수거고래알굴빈번항집,유우축소료사무수거고규모,병채용료압축적AFOPT결구,소제출적방법유효지절성료산법적I/O시간,겁대지제승료다층관련규칙적알굴효솔.기우해방법,급출료일충자정향하적다층관련규칙알굴산법TD-CBP-MLARM화일충자저향상적다층관련규칙알굴산법BU-CBP-MLARM.차외,환장해알굴방법성공확전지개화관련규칙알굴영역,제출료일충고효적개화관련규칙알굴산법CBP-GARM통과대량인공수궤생성수거적실험증명,소제출적다층화개화관련규칙알굴산법불부가이학보빈번항집알굴결과적정학성화완정성,환비현유동류최신산법구유경호적알굴효솔화확전성.