计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2013年
1期
80-82,87
,共4页
聚类集成%K均值%流量分类%互信息
聚類集成%K均值%流量分類%互信息
취류집성%K균치%류량분류%호신식
针对互联网流量标注困难以及单个聚类器的泛化能力较弱,提出一种基于互信息(MI)理论的选择聚类集成方法,以提高流量分类的精度.首先计算不同初始簇个数K的K均值聚类结果与训练集中流量协议的真实分布之间的规范化互信息(NMI);然后基于NMI的值来选择用于聚类集成的K均值基聚类器的K值序列;最后采用二次互信息(QMI)的一致函数生成一致聚类结果,并使用一种半监督方法对聚类簇进行标注.通过实验比较了聚类集成方法与单个聚类算法在4个不同测试集上总体分类精度.实验结果表明,聚类集成方法的流量分类总体精度能达到90%.所提方法将聚类集成模型应用到网络流量分类中,提高了流量分类的精度和在不同数据集上的分类稳定性.
針對互聯網流量標註睏難以及單箇聚類器的汎化能力較弱,提齣一種基于互信息(MI)理論的選擇聚類集成方法,以提高流量分類的精度.首先計算不同初始簇箇數K的K均值聚類結果與訓練集中流量協議的真實分佈之間的規範化互信息(NMI);然後基于NMI的值來選擇用于聚類集成的K均值基聚類器的K值序列;最後採用二次互信息(QMI)的一緻函數生成一緻聚類結果,併使用一種半鑑督方法對聚類簇進行標註.通過實驗比較瞭聚類集成方法與單箇聚類算法在4箇不同測試集上總體分類精度.實驗結果錶明,聚類集成方法的流量分類總體精度能達到90%.所提方法將聚類集成模型應用到網絡流量分類中,提高瞭流量分類的精度和在不同數據集上的分類穩定性.
침대호련망류량표주곤난이급단개취류기적범화능력교약,제출일충기우호신식(MI)이론적선택취류집성방법,이제고류량분류적정도.수선계산불동초시족개수K적K균치취류결과여훈련집중류량협의적진실분포지간적규범화호신식(NMI);연후기우NMI적치래선택용우취류집성적K균치기취류기적K치서렬;최후채용이차호신식(QMI)적일치함수생성일치취류결과,병사용일충반감독방법대취류족진행표주.통과실험비교료취류집성방법여단개취류산법재4개불동측시집상총체분류정도.실험결과표명,취류집성방법적류량분류총체정도능체도90%.소제방법장취류집성모형응용도망락류량분류중,제고료류량분류적정도화재불동수거집상적분류은정성.