计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
12期
145-148
,共4页
Apriori%频繁项集%位表%散列
Apriori%頻繁項集%位錶%散列
Apriori%빈번항집%위표%산렬
在频繁项集的挖掘中,很多算法都是基于Apriori的.这些算法有两个共同的问题:一是把整个数据库装入内存,占用大量的空间;二是在产生候选项集和计算支持度时花费了大量的时间.为了提高效率,提出了一种基于位表挖掘频繁项目集的算法Hash-BFI.按照水平和垂直的方向把数据库压缩到位表内,以大大节省内存空间.引入散列函数计算频繁二项集,完全通过AND,OR运算得到候选项集和计算候选项集支持度,并进行剪枝,从而提高了算法效率.
在頻繁項集的挖掘中,很多算法都是基于Apriori的.這些算法有兩箇共同的問題:一是把整箇數據庫裝入內存,佔用大量的空間;二是在產生候選項集和計算支持度時花費瞭大量的時間.為瞭提高效率,提齣瞭一種基于位錶挖掘頻繁項目集的算法Hash-BFI.按照水平和垂直的方嚮把數據庫壓縮到位錶內,以大大節省內存空間.引入散列函數計算頻繁二項集,完全通過AND,OR運算得到候選項集和計算候選項集支持度,併進行剪枝,從而提高瞭算法效率.
재빈번항집적알굴중,흔다산법도시기우Apriori적.저사산법유량개공동적문제:일시파정개수거고장입내존,점용대량적공간;이시재산생후선항집화계산지지도시화비료대량적시간.위료제고효솔,제출료일충기우위표알굴빈번항목집적산법Hash-BFI.안조수평화수직적방향파수거고압축도위표내,이대대절성내존공간.인입산렬함수계산빈번이항집,완전통과AND,OR운산득도후선항집화계산후선항집지지도,병진행전지,종이제고료산법효솔.