计算机应用研究
計算機應用研究
계산궤응용연구
Application Research of Computers
2015年
10期
2924-2929
,共6页
柳萌萌%赵书良%陈敏%李晓超
柳萌萌%趙書良%陳敏%李曉超
류맹맹%조서량%진민%리효초
多尺度%概念分层%频繁项集%尺度上推%多尺度关联规则挖掘
多呎度%概唸分層%頻繁項集%呎度上推%多呎度關聯規則挖掘
다척도%개념분층%빈번항집%척도상추%다척도관련규칙알굴
multi-scale%concept hierarchy%frequent itemset%scaling-up%multi-scale association rules mining
多尺度理论已被引入到数据挖掘领域中,但目前多尺度数据挖掘的研究并不深入,缺乏普适性理论与方法.针对上述问题,研究了普适的多尺度数据挖掘理论,提出了尺度上推关联规则挖掘算法.首先基于概念分层理论给出了数据尺度划分和数据尺度的定义;然后根据多尺度理论的研究重点阐明了多尺度数据挖掘的实质及研究核心;最后在多尺度数据理论研究的基础上提出了尺度上推关联规则挖掘算法SU-ARMA(scaling-up association rules mining algorithm).该算法利用采样理论和Jaccard相似性系数对数据集挖掘结果中的频繁项集进行处理,实现了多尺度数据间知识的向上推导.利用人造数据集和H省全员人口真实数据集对算法进行了实验和分析,实验结果表明算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的.
多呎度理論已被引入到數據挖掘領域中,但目前多呎度數據挖掘的研究併不深入,缺乏普適性理論與方法.針對上述問題,研究瞭普適的多呎度數據挖掘理論,提齣瞭呎度上推關聯規則挖掘算法.首先基于概唸分層理論給齣瞭數據呎度劃分和數據呎度的定義;然後根據多呎度理論的研究重點闡明瞭多呎度數據挖掘的實質及研究覈心;最後在多呎度數據理論研究的基礎上提齣瞭呎度上推關聯規則挖掘算法SU-ARMA(scaling-up association rules mining algorithm).該算法利用採樣理論和Jaccard相似性繫數對數據集挖掘結果中的頻繁項集進行處理,實現瞭多呎度數據間知識的嚮上推導.利用人造數據集和H省全員人口真實數據集對算法進行瞭實驗和分析,實驗結果錶明算法具有較高的覆蓋率、精確度和較低的支持度估計誤差,是可行且有效的.
다척도이론이피인입도수거알굴영역중,단목전다척도수거알굴적연구병불심입,결핍보괄성이론여방법.침대상술문제,연구료보괄적다척도수거알굴이론,제출료척도상추관련규칙알굴산법.수선기우개념분층이론급출료수거척도화분화수거척도적정의;연후근거다척도이론적연구중점천명료다척도수거알굴적실질급연구핵심;최후재다척도수거이론연구적기출상제출료척도상추관련규칙알굴산법SU-ARMA(scaling-up association rules mining algorithm).해산법이용채양이론화Jaccard상사성계수대수거집알굴결과중적빈번항집진행처리,실현료다척도수거간지식적향상추도.이용인조수거집화H성전원인구진실수거집대산법진행료실험화분석,실험결과표명산법구유교고적복개솔、정학도화교저적지지도고계오차,시가행차유효적.