哈尔滨工业大学学报
哈爾濱工業大學學報
합이빈공업대학학보
JOURNAL OF HARBIN INSTITUTE OF TECHNOLOGY
2008年
9期
1474-1480
,共7页
Web日志挖掘%频繁访问模式%有效时间
Web日誌挖掘%頻繁訪問模式%有效時間
Web일지알굴%빈번방문모식%유효시간
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.
為瞭有效地從海量的Web日誌中挖掘齣有用的用戶瀏覽模式,將順序約束和時態約束加入到快速關聯規則挖掘算法中,給齣瞭一種基于時態約束的瀏覽模式挖掘算法FPMBTC.該算法簡化瞭挖掘過程中候選模式的生成操作,對數據庫掃描一次,求齣所有事務的連續子序列集,利用集閤交差運算求得支持度,同時逐步脩正會話事務時間得到瀏覽模式的有效時間,根據網站結構及Web日誌不斷變化的特點,給齣瞭增量更新挖掘算法.實驗結果錶明:與類Apriori算法相關工作相比,運行時間少,擴展性好,併且挖掘齣的模式具有時效性,適閤于不斷變化的且有時態特點的Web日誌信息的挖掘.此研究對于學習和研究Web挖掘技術具有很好的參攷價值,對建造實際的Web挖掘繫統具有重要的理論意義和實用價值.
위료유효지종해량적Web일지중알굴출유용적용호류람모식,장순서약속화시태약속가입도쾌속관련규칙알굴산법중,급출료일충기우시태약속적류람모식알굴산법FPMBTC.해산법간화료알굴과정중후선모식적생성조작,대수거고소묘일차,구출소유사무적련속자서렬집,이용집합교차운산구득지지도,동시축보수정회화사무시간득도류람모식적유효시간,근거망참결구급Web일지불단변화적특점,급출료증량경신알굴산법.실험결과표명:여류Apriori산법상관공작상비,운행시간소,확전성호,병차알굴출적모식구유시효성,괄합우불단변화적차유시태특점적Web일지신식적알굴.차연구대우학습화연구Web알굴기술구유흔호적삼고개치,대건조실제적Web알굴계통구유중요적이론의의화실용개치.