数字技术与应用
數字技術與應用
수자기술여응용
DIGITAL TECHNOLOGY AND APPLICATION
2015年
3期
122-123
,共2页
阈值%高效模式%候选集
閾值%高效模式%候選集
역치%고효모식%후선집
Threshold%High value Patterns%Candidate
在通常的模式挖掘中,为了筛选出有效模式,用户需要设置阈值。但是,如何设定一个合适的阈值却是一件困难的事情。Top-k高效模式挖掘算法避免设置阈值,同时考虑了现实数据的一些属性的重要性。尽管相关算法近年已经提出,但是往往会产生大量的候选模式。本文提出了一种挖掘k个最有价值模式的算法,并且不会产生太多的候选项。它通过伺机选择阈值提高策略,从而有效缩小在挖掘过程中的候选集大小。
在通常的模式挖掘中,為瞭篩選齣有效模式,用戶需要設置閾值。但是,如何設定一箇閤適的閾值卻是一件睏難的事情。Top-k高效模式挖掘算法避免設置閾值,同時攷慮瞭現實數據的一些屬性的重要性。儘管相關算法近年已經提齣,但是往往會產生大量的候選模式。本文提齣瞭一種挖掘k箇最有價值模式的算法,併且不會產生太多的候選項。它通過伺機選擇閾值提高策略,從而有效縮小在挖掘過程中的候選集大小。
재통상적모식알굴중,위료사선출유효모식,용호수요설치역치。단시,여하설정일개합괄적역치각시일건곤난적사정。Top-k고효모식알굴산법피면설치역치,동시고필료현실수거적일사속성적중요성。진관상관산법근년이경제출,단시왕왕회산생대량적후선모식。본문제출료일충알굴k개최유개치모식적산법,병차불회산생태다적후선항。타통과사궤선택역치제고책략,종이유효축소재알굴과정중적후선집대소。
In the usual pattern mining,in order to find out the utility pattern,the user needs to set a threshold.But to set an appropriate threshold is dif icult.Top-k efficient pattern mining algorithm avoids setting threshold,taking into account the importance of some properties of real data.Although related algorithms have been proposed in recent years,but they tend to produce a large number of candidate patterns.This paper presents a top-k high utility pattern mining algorithms,and does not produce too many candidates.It increasesthreshold by opportune select strategy,which can ef ectively reduce the candidates set during mining process.