科技信息
科技信息
과기신식
SCIENTIFIC & TECHNICAL INFORMATION
2010年
36期
106-107
,共2页
关联规则%Apriori%二维数组
關聯規則%Apriori%二維數組
관련규칙%Apriori%이유수조
本文分析了经典关联规则算法Apriori,发现了算法中存在的不健全的地方:(1)在每一步产生候选项目集时循环产生的组合过多,没有排除不应该参与组合的元素,可能产生庞大的候选集;(2)每次计算项集的支持度时,都对数据库D中的全部记录进行了一遍扫描比较,如果是一个大型的数据库,这种扫描会大大增加计算机系统的运行时间.针对这些不足之处,根据二维数组算法,得到了一种较高效的算法--TSAprioriTid算法.
本文分析瞭經典關聯規則算法Apriori,髮現瞭算法中存在的不健全的地方:(1)在每一步產生候選項目集時循環產生的組閤過多,沒有排除不應該參與組閤的元素,可能產生龐大的候選集;(2)每次計算項集的支持度時,都對數據庫D中的全部記錄進行瞭一遍掃描比較,如果是一箇大型的數據庫,這種掃描會大大增加計算機繫統的運行時間.針對這些不足之處,根據二維數組算法,得到瞭一種較高效的算法--TSAprioriTid算法.
본문분석료경전관련규칙산법Apriori,발현료산법중존재적불건전적지방:(1)재매일보산생후선항목집시순배산생적조합과다,몰유배제불응해삼여조합적원소,가능산생방대적후선집;(2)매차계산항집적지지도시,도대수거고D중적전부기록진행료일편소묘비교,여과시일개대형적수거고,저충소묘회대대증가계산궤계통적운행시간.침대저사불족지처,근거이유수조산법,득도료일충교고효적산법--TSAprioriTid산법.