计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2015年
4期
43-47
,共5页
Web应用%日志%关联规则%算法改进%Apriori算法
Web應用%日誌%關聯規則%算法改進%Apriori算法
Web응용%일지%관련규칙%산법개진%Apriori산법
Web applications%log%association rules%improved algorithm%Apriori algorithm
由于企业的Web日志中隐藏着大量有价值的信息,Apriori算法的缺点在于产生大量的候选集以及频繁扫描数据集,文中是基于协同门户和网站的日志信息进行研究。企业的协同门户里企业通知栏目可以随时发布企业的相关通知信息,是企业第一时间想让用户看到的。而网站里企业的新闻栏目也是想给用户展示企业的相关新闻信息和企业的经营活动信息,完成企业品牌以及企业文化的宣传等。基于协同门户和网站在企业的这点共性,文中提出了针对企业的一种改进Apriori算法,即在企业主动向访问者展现通知公告或者企业的经营新闻信息的前提下,挖掘出其他一级主栏目在访客心中的地位,以及访客对这些栏目的关注度和兴趣度,以便于企业实现如何调整其他栏目布局,更好地为企业宣传做服务,同时又能满足访问者的便捷访问,等等。文中算法改进的核心思想是减少候选集来对Apriori算法进行改进。在Aprio-ri算法的扫描过程中,某个ID不参与,当算法挖掘出最大频繁集后再将这个ID添加到最大频繁项集的每个项集中,开展关联规则的挖掘。这样在数据集的扫描次数及候选集的产生上都有较大程度的优化。对比实验结果表明,改进的Apriori算法效果明显,对企业有较强的实际应用价值。
由于企業的Web日誌中隱藏著大量有價值的信息,Apriori算法的缺點在于產生大量的候選集以及頻繁掃描數據集,文中是基于協同門戶和網站的日誌信息進行研究。企業的協同門戶裏企業通知欄目可以隨時髮佈企業的相關通知信息,是企業第一時間想讓用戶看到的。而網站裏企業的新聞欄目也是想給用戶展示企業的相關新聞信息和企業的經營活動信息,完成企業品牌以及企業文化的宣傳等。基于協同門戶和網站在企業的這點共性,文中提齣瞭針對企業的一種改進Apriori算法,即在企業主動嚮訪問者展現通知公告或者企業的經營新聞信息的前提下,挖掘齣其他一級主欄目在訪客心中的地位,以及訪客對這些欄目的關註度和興趣度,以便于企業實現如何調整其他欄目佈跼,更好地為企業宣傳做服務,同時又能滿足訪問者的便捷訪問,等等。文中算法改進的覈心思想是減少候選集來對Apriori算法進行改進。在Aprio-ri算法的掃描過程中,某箇ID不參與,噹算法挖掘齣最大頻繁集後再將這箇ID添加到最大頻繁項集的每箇項集中,開展關聯規則的挖掘。這樣在數據集的掃描次數及候選集的產生上都有較大程度的優化。對比實驗結果錶明,改進的Apriori算法效果明顯,對企業有較彊的實際應用價值。
유우기업적Web일지중은장착대량유개치적신식,Apriori산법적결점재우산생대량적후선집이급빈번소묘수거집,문중시기우협동문호화망참적일지신식진행연구。기업적협동문호리기업통지란목가이수시발포기업적상관통지신식,시기업제일시간상양용호간도적。이망참리기업적신문란목야시상급용호전시기업적상관신문신식화기업적경영활동신식,완성기업품패이급기업문화적선전등。기우협동문호화망참재기업적저점공성,문중제출료침대기업적일충개진Apriori산법,즉재기업주동향방문자전현통지공고혹자기업적경영신문신식적전제하,알굴출기타일급주란목재방객심중적지위,이급방객대저사란목적관주도화흥취도,이편우기업실현여하조정기타란목포국,경호지위기업선전주복무,동시우능만족방문자적편첩방문,등등。문중산법개진적핵심사상시감소후선집래대Apriori산법진행개진。재Aprio-ri산법적소묘과정중,모개ID불삼여,당산법알굴출최대빈번집후재장저개ID첨가도최대빈번항집적매개항집중,개전관련규칙적알굴。저양재수거집적소묘차수급후선집적산생상도유교대정도적우화。대비실험결과표명,개진적Apriori산법효과명현,대기업유교강적실제응용개치。
A large number of valuable information is hidden in the enterprise Web log,the disadvantage of Apriori algorithm is to produce a large number of candidate set and frequent scan data set. In this paper,study based on Web log information from collaborative Web por-tal. The enterprises collaborative Web portal can release the relevant notice of enterprise information at the announcements column at any time,which is what the enterprise want visitors to see at the first time. The Website news is to show visitors for enterprise related news, information and enterprise management activities,it’ s also to complete the enterprise brand and enterprise culture propaganda,etc. Based on the general character of collaborative Web portal,present an improved Apriori algorithm for enterprises,the enterprises show visitors announcements or business news and information actively,dig out the status of the other main column in visitors,and the degree of these columns’ attention and interest in visitors. In this way,the enterprises can adjust the other column layout,do better service for enterprise propaganda,and meet the visitors’ convenient access, etc. The core of the improved algorithm is to reduce the candidate set. In the process of scanning of Apriori algorithm,an ID is not to participate in,when the algorithm mining the maximum frequent sets and then adding the ID to the maximum frequent item sets concentration of each item,to carry out the association rules mining. There is a larger degree of optimization in the number of data sets of scanning and candidate set generation. After the contrast experiments,it shows that the improved Apriori algorithm is effective and has the strong practical application value for enterprises.