管理科学学报
管理科學學報
관이과학학보
JOURNAL OF MANAGEMENT SCIENCES IN CHINA
2013年
4期
8-21
,共14页
熊海涛%吴俊杰%刘洪甫%刘鲁
熊海濤%吳俊傑%劉洪甫%劉魯
웅해도%오준걸%류홍보%류로
数据挖掘%分类%类重叠%类不均衡%支持向量数据描述
數據挖掘%分類%類重疊%類不均衡%支持嚮量數據描述
수거알굴%분류%류중첩%류불균형%지지향량수거묘술
类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的重叠样本识别,对类重叠问题及其与类不均衡问题的相互影响进行了系统研究.在真实数据上采用五种分类器的实验结果表明:1)多数情况下“分隔法”是表现最佳的类重叠学习算法;2)分隔法通常对基于分界面而非规则的分类器更为有效;3)分隔法在类不均衡问题中表现很好,当基础分类器为支持向量机时尤为突出.最后针对支持向量机的实验结果给出了理论分析.
類重疊問題是數據挖掘與機器學習領域的瓶頸問題之一.如果其中還存在類不均衡問題時,情況變得更加複雜.有鑒于此,本文在已有文獻基礎上歸納瞭三種類重疊學習算法及提齣一種新的方法:分隔法,併首次將支持嚮量數據描述算法用于實際數據的重疊樣本識彆,對類重疊問題及其與類不均衡問題的相互影響進行瞭繫統研究.在真實數據上採用五種分類器的實驗結果錶明:1)多數情況下“分隔法”是錶現最佳的類重疊學習算法;2)分隔法通常對基于分界麵而非規則的分類器更為有效;3)分隔法在類不均衡問題中錶現很好,噹基礎分類器為支持嚮量機時尤為突齣.最後針對支持嚮量機的實驗結果給齣瞭理論分析.
류중첩문제시수거알굴여궤기학습영역적병경문제지일.여과기중환존재류불균형문제시,정황변득경가복잡.유감우차,본문재이유문헌기출상귀납료삼충류중첩학습산법급제출일충신적방법:분격법,병수차장지지향량수거묘술산법용우실제수거적중첩양본식별,대류중첩문제급기여류불균형문제적상호영향진행료계통연구.재진실수거상채용오충분류기적실험결과표명:1)다수정황하“분격법”시표현최가적류중첩학습산법;2)분격법통상대기우분계면이비규칙적분류기경위유효;3)분격법재류불균형문제중표현흔호,당기출분류기위지지향량궤시우위돌출.최후침대지지향량궤적실험결과급출료이론분석.