计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2014年
7期
2123-2126
,共4页
边婧%彭新光%王颖%付东来
邊婧%彭新光%王穎%付東來
변청%팽신광%왕영%부동래
子群发现%不平衡数据集%数据简化%实例选择%特征选择
子群髮現%不平衡數據集%數據簡化%實例選擇%特徵選擇
자군발현%불평형수거집%수거간화%실례선택%특정선택
subgroup discovery%imbalanced dataset%data reduction%instance selection%feature selection
为突破数据不平衡对算法的限制,更好地将子群发现技术应用到数据不平衡领域,设计了一个适合入侵检测数据集与子群发现算法的数据简化策略.实例简化阶段,应用均匀分布随机点定理与数据空间稀疏度构造属性相异度函数,借鉴稀有类信息仿制技术并结合进化学习实例选择算法提出稀有类拓展实例选择算法;属性简化阶段,采用主成分分析法,针对数据集特点保留相关兴趣特征以提高算法发现效率.实验证明,此方法适用于子群发现算法,能有效减少时间开销并提高规则发现效果.
為突破數據不平衡對算法的限製,更好地將子群髮現技術應用到數據不平衡領域,設計瞭一箇適閤入侵檢測數據集與子群髮現算法的數據簡化策略.實例簡化階段,應用均勻分佈隨機點定理與數據空間稀疏度構造屬性相異度函數,藉鑒稀有類信息倣製技術併結閤進化學習實例選擇算法提齣稀有類拓展實例選擇算法;屬性簡化階段,採用主成分分析法,針對數據集特點保留相關興趣特徵以提高算法髮現效率.實驗證明,此方法適用于子群髮現算法,能有效減少時間開銷併提高規則髮現效果.
위돌파수거불평형대산법적한제,경호지장자군발현기술응용도수거불평형영역,설계료일개괄합입침검측수거집여자군발현산법적수거간화책략.실례간화계단,응용균균분포수궤점정리여수거공간희소도구조속성상이도함수,차감희유류신식방제기술병결합진화학습실례선택산법제출희유류탁전실례선택산법;속성간화계단,채용주성분분석법,침대수거집특점보류상관흥취특정이제고산법발현효솔.실험증명,차방법괄용우자군발현산법,능유효감소시간개소병제고규칙발현효과.