信息工程大学学报
信息工程大學學報
신식공정대학학보
JOURNAL OF INFORMATION ENGINEERING UNIVERSITY
2015年
2期
234-239
,共6页
李林林%张效义%张霞%李青
李林林%張效義%張霞%李青
리림림%장효의%장하%리청
流量分类%非均衡%半监督%K均值%k近邻
流量分類%非均衡%半鑑督%K均值%k近鄰
류량분류%비균형%반감독%K균치%k근린
针对流量分类中样本标注瓶颈和类不均衡问题,提出一种基于K均值和k近邻的半监督流量分类算法.采用K均值聚类算法将混有少量标记样本和大量未标记样本的数据聚成若干个簇,然后采用k近邻算法利用簇中标记样本对未标记样本进行分类.在分类过程中根据簇中标记样本分布调整参与分类的最近邻居数,从而克服了类不均衡对识别小类流的不利影响.理论分析和实验结果都表明,算法在面对非均衡协议流时提高了小类流的识别率.
針對流量分類中樣本標註瓶頸和類不均衡問題,提齣一種基于K均值和k近鄰的半鑑督流量分類算法.採用K均值聚類算法將混有少量標記樣本和大量未標記樣本的數據聚成若榦箇簇,然後採用k近鄰算法利用簇中標記樣本對未標記樣本進行分類.在分類過程中根據簇中標記樣本分佈調整參與分類的最近鄰居數,從而剋服瞭類不均衡對識彆小類流的不利影響.理論分析和實驗結果都錶明,算法在麵對非均衡協議流時提高瞭小類流的識彆率.
침대류량분류중양본표주병경화류불균형문제,제출일충기우K균치화k근린적반감독류량분류산법.채용K균치취류산법장혼유소량표기양본화대량미표기양본적수거취성약간개족,연후채용k근린산법이용족중표기양본대미표기양본진행분류.재분류과정중근거족중표기양본분포조정삼여분류적최근린거수,종이극복료류불균형대식별소류류적불리영향.이론분석화실험결과도표명,산법재면대비균형협의류시제고료소류류적식별솔.