计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2012年
11期
4235-4239
,共5页
频繁项集%矩阵%数据挖掘%关联规则%支持度
頻繁項集%矩陣%數據挖掘%關聯規則%支持度
빈번항집%구진%수거알굴%관련규칙%지지도
针对Apriori算法效率不高的问题,提出一种基于频繁模式矩阵的方法来挖掘最大频繁项目集.算法的基本思想是:只需扫描原始事务数据集一次,将事务数据转换成压缩矩阵,矩阵中保留了项目间的关联信息,同时只存放逻辑型数据,数据挖掘只采用逻辑运算,在挖掘过程中根据条件不断的对事务数据集和候选集进行剪枝,减少了不必要的开销.当数据量较大时,在效率上有一定的优势.实验结果表明改进后的算法具有良好的性能,提高了挖掘的速度.
針對Apriori算法效率不高的問題,提齣一種基于頻繁模式矩陣的方法來挖掘最大頻繁項目集.算法的基本思想是:隻需掃描原始事務數據集一次,將事務數據轉換成壓縮矩陣,矩陣中保留瞭項目間的關聯信息,同時隻存放邏輯型數據,數據挖掘隻採用邏輯運算,在挖掘過程中根據條件不斷的對事務數據集和候選集進行剪枝,減少瞭不必要的開銷.噹數據量較大時,在效率上有一定的優勢.實驗結果錶明改進後的算法具有良好的性能,提高瞭挖掘的速度.
침대Apriori산법효솔불고적문제,제출일충기우빈번모식구진적방법래알굴최대빈번항목집.산법적기본사상시:지수소묘원시사무수거집일차,장사무수거전환성압축구진,구진중보류료항목간적관련신식,동시지존방라집형수거,수거알굴지채용라집운산,재알굴과정중근거조건불단적대사무수거집화후선집진행전지,감소료불필요적개소.당수거량교대시,재효솔상유일정적우세.실험결과표명개진후적산법구유량호적성능,제고료알굴적속도.