西安电子科技大学学报(自然科学版)
西安電子科技大學學報(自然科學版)
서안전자과기대학학보(자연과학판)
JOURNAL OF XIDIAN UNIVERSITY(NATURAL SCIENCE)
2015年
2期
58-64,121
,共8页
刘家辰%苗启广%宋建锋%曹莹
劉傢辰%苗啟廣%宋建鋒%曹瑩
류가신%묘계엄%송건봉%조형
单类学习%离群点分析%聚类分析%聚类稳定性%支持向量数据描述
單類學習%離群點分析%聚類分析%聚類穩定性%支持嚮量數據描述
단류학습%리군점분석%취류분석%취류은정성%지지향량수거묘술
one-class learning%outlier analysis%cluster analysis%cluster stability%support vector data description
针对传统单类学习模型对多模态或多密度分布数据描述能力不足的问题,将集成聚类和聚类稳定性分析引入单类学习.首先将确定聚类簇个数与确定聚类簇分布统一到同一个增强单类学习框架中,之后各聚类簇互为正负类分别建起立多个单类分类模型,最后采用最大融合体积方法融合其决策边界.以经典的支持向量数据描述(SVDD)为例,设计了基于集成聚类的稳定支持向量数据描述算法———ECS-SVDD.在标准 UCI数据集和一个真实恶意程序行为数据集上的实验结果表明,ECS-SVDD的性能较单个支持向量数据描述及同类单类学习方法更优.该方法可直接推广到其他最小包含体积集合类型的单类学习算法上,以增强单类学习算法处理多模态和多密度分布数据的能力.
針對傳統單類學習模型對多模態或多密度分佈數據描述能力不足的問題,將集成聚類和聚類穩定性分析引入單類學習.首先將確定聚類簇箇數與確定聚類簇分佈統一到同一箇增彊單類學習框架中,之後各聚類簇互為正負類分彆建起立多箇單類分類模型,最後採用最大融閤體積方法融閤其決策邊界.以經典的支持嚮量數據描述(SVDD)為例,設計瞭基于集成聚類的穩定支持嚮量數據描述算法———ECS-SVDD.在標準 UCI數據集和一箇真實噁意程序行為數據集上的實驗結果錶明,ECS-SVDD的性能較單箇支持嚮量數據描述及同類單類學習方法更優.該方法可直接推廣到其他最小包含體積集閤類型的單類學習算法上,以增彊單類學習算法處理多模態和多密度分佈數據的能力.
침대전통단류학습모형대다모태혹다밀도분포수거묘술능력불족적문제,장집성취류화취류은정성분석인입단류학습.수선장학정취류족개수여학정취류족분포통일도동일개증강단류학습광가중,지후각취류족호위정부류분별건기립다개단류분류모형,최후채용최대융합체적방법융합기결책변계.이경전적지지향량수거묘술(SVDD)위례,설계료기우집성취류적은정지지향량수거묘술산법———ECS-SVDD.재표준 UCI수거집화일개진실악의정서행위수거집상적실험결과표명,ECS-SVDD적성능교단개지지향량수거묘술급동류단류학습방법경우.해방법가직접추엄도기타최소포함체적집합류형적단류학습산법상,이증강단류학습산법처리다모태화다밀도분포수거적능력.
Conventional one-class learning models perform poorly when data are multi-modal or multi-density.To address this problem,ensemble clustering and clustering stability analysis for one class learning are introduced. Firstly, identifying the number of clusters and their distributions are unified in one enhancing framework.Then multiple one-class learning models are constructed to describe clusters of the target class. Lastly these one-class learning models are fused following the maximum fusion volume method.Using classic support vector data description (SVDD) as an instance of one-class learning algorithm,an ensemble cluster based stable SVDD,ECS-SVDD,is proposed.Experimental results on UCI benchmark datasets and a real-world malware detection dataset show that the ECS-SVDD outperforms the single SVDD and some other related one-class learning algorithms.Besides,the method proposed can also enhance the abilities of handling multi-modal and multi-density data of other one-class learning algorithms that follow the volume set minimizing scheme.