计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
4期
131-135
,共5页
江颉%王卓芳%GONG Rong-sheng%陈铁明
江頡%王卓芳%GONG Rong-sheng%陳鐵明
강힐%왕탁방%GONG Rong-sheng%진철명
不平衡数据%K-S统计%逻辑回归%入侵检测
不平衡數據%K-S統計%邏輯迴歸%入侵檢測
불평형수거%K-S통계%라집회귀%입침검측
直接将传统的分类方法应用于不平衡数据集时,往往导致少数类的分类精度低下.提出一种基于K-S统计的不平衡数据分类方法,以有效提高少数类的识别率.利用K-S统计评估分类与特征之间的关系,去除冗余特征,并且构建K-S决策树获得数据分片,调整数据的不平衡度;最后对分片数据双向抽样调整,进行分类学习.该方法使用的K-S统计假设条件极易满足,其效率高且适用性强.通过KDD99入侵检测数据的分析对比表明,对于不平衡的数据集,该方法对多数类及少数类都具有较高的分类精度.
直接將傳統的分類方法應用于不平衡數據集時,往往導緻少數類的分類精度低下.提齣一種基于K-S統計的不平衡數據分類方法,以有效提高少數類的識彆率.利用K-S統計評估分類與特徵之間的關繫,去除冗餘特徵,併且構建K-S決策樹穫得數據分片,調整數據的不平衡度;最後對分片數據雙嚮抽樣調整,進行分類學習.該方法使用的K-S統計假設條件極易滿足,其效率高且適用性彊.通過KDD99入侵檢測數據的分析對比錶明,對于不平衡的數據集,該方法對多數類及少數類都具有較高的分類精度.
직접장전통적분류방법응용우불평형수거집시,왕왕도치소수류적분류정도저하.제출일충기우K-S통계적불평형수거분류방법,이유효제고소수류적식별솔.이용K-S통계평고분류여특정지간적관계,거제용여특정,병차구건K-S결책수획득수거분편,조정수거적불평형도;최후대분편수거쌍향추양조정,진행분류학습.해방법사용적K-S통계가설조건겁역만족,기효솔고차괄용성강.통과KDD99입침검측수거적분석대비표명,대우불평형적수거집,해방법대다수류급소수류도구유교고적분류정도.