计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2010年
1期
137-140
,共4页
蔡宏果%元昌安%彭昱忠%陶俊剑
蔡宏果%元昌安%彭昱忠%陶俊劍
채굉과%원창안%팽욱충%도준검
基因表达式编程%多层关联规则%Web使用挖掘%泛化%数据挖掘%抽象频繁项集
基因錶達式編程%多層關聯規則%Web使用挖掘%汎化%數據挖掘%抽象頻繁項集
기인표체식편정%다층관련규칙%Web사용알굴%범화%수거알굴%추상빈번항집
GEP%multiple-layers association rule%web usage mining%generalizing%data mining%abstract frequency items
为了在Web使用挖掘中挖掘网站服务器日志数据库的热点Web页面访问集及发现其关联规则,提出了一种新的基于GEP(gene expression programming,基因表达式编程)的适用于挖掘多层关联规则的算法.将泛化技术应用于GEP作为它的适应性函数度量,引入GEP强大的自搜索功能,进化到较优的种群后,再利用传统的支持度一置信度的方法在子数据库的多个层及层间挖掘频繁项及关联规则.该算法改进了传统多层关联规则挖掘框架,实验结果表明了该算法在大数据库中的有效性和高效性.
為瞭在Web使用挖掘中挖掘網站服務器日誌數據庫的熱點Web頁麵訪問集及髮現其關聯規則,提齣瞭一種新的基于GEP(gene expression programming,基因錶達式編程)的適用于挖掘多層關聯規則的算法.將汎化技術應用于GEP作為它的適應性函數度量,引入GEP彊大的自搜索功能,進化到較優的種群後,再利用傳統的支持度一置信度的方法在子數據庫的多箇層及層間挖掘頻繁項及關聯規則.該算法改進瞭傳統多層關聯規則挖掘框架,實驗結果錶明瞭該算法在大數據庫中的有效性和高效性.
위료재Web사용알굴중알굴망참복무기일지수거고적열점Web혈면방문집급발현기관련규칙,제출료일충신적기우GEP(gene expression programming,기인표체식편정)적괄용우알굴다층관련규칙적산법.장범화기술응용우GEP작위타적괄응성함수도량,인입GEP강대적자수색공능,진화도교우적충군후,재이용전통적지지도일치신도적방법재자수거고적다개층급층간알굴빈번항급관련규칙.해산법개진료전통다층관련규칙알굴광가,실험결과표명료해산법재대수거고중적유효성화고효성.
To mine popular accessed web pages items and find out their association rule from the web server log database in WUM (web usage mining).A novel GEP-based algorithm for mining multiple-layers association rules is presented.Firstly,generalizing technology is taken as a way to value fitness function in GEP (gene expression programming).Then,relying on the significant self-search function of GEP,the most optional species is evolved.The frequent items and association rules in the next deeper layers can be mined by using traditional support-confidence method in sub-database.The algorithm improves on the frame of traditional association rule mining.Finally,the validity and efficiency of the presented method is demonstrated by the application in big database.