计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
12期
4690-4693
,共4页
对等网%流量特征%决策树%流量分类%C4.5
對等網%流量特徵%決策樹%流量分類%C4.5
대등망%류량특정%결책수%류량분류%C4.5
P2P%traffic characteristic%decision-tree%traffic classification%C4.5
P2P流量逐渐成为互联网流量的重要组成部分,精确分类P2P流量对于有效管理网络和合理利用网络资源都具有重要意义.近年来,利用机器学习方法处理P2P流量分类问题已成为流量识别领域的一个新兴研究方向.利用决策树中的C4.5算法和P2P流量的特征属性来构建决策树模型,进而完成P2P流量分类问题.实验结果表明,基于决策树模型的方法能有效避免P2P网络流分布变化所带来的不稳定性;与SVM(support vector machine,支持向量机)、NBK(na(i)ve Bayes using kernel density estimation,改进的朴素贝叶斯)方法相比,其平均分类准确率能提高至少3.83个百分点.
P2P流量逐漸成為互聯網流量的重要組成部分,精確分類P2P流量對于有效管理網絡和閤理利用網絡資源都具有重要意義.近年來,利用機器學習方法處理P2P流量分類問題已成為流量識彆領域的一箇新興研究方嚮.利用決策樹中的C4.5算法和P2P流量的特徵屬性來構建決策樹模型,進而完成P2P流量分類問題.實驗結果錶明,基于決策樹模型的方法能有效避免P2P網絡流分佈變化所帶來的不穩定性;與SVM(support vector machine,支持嚮量機)、NBK(na(i)ve Bayes using kernel density estimation,改進的樸素貝葉斯)方法相比,其平均分類準確率能提高至少3.83箇百分點.
P2P류량축점성위호련망류량적중요조성부분,정학분류P2P류량대우유효관리망락화합리이용망락자원도구유중요의의.근년래,이용궤기학습방법처리P2P류량분류문제이성위류량식별영역적일개신흥연구방향.이용결책수중적C4.5산법화P2P류량적특정속성래구건결책수모형,진이완성P2P류량분류문제.실험결과표명,기우결책수모형적방법능유효피면P2P망락류분포변화소대래적불은정성;여SVM(support vector machine,지지향량궤)、NBK(na(i)ve Bayes using kernel density estimation,개진적박소패협사)방법상비,기평균분류준학솔능제고지소3.83개백분점.
P2P traffic has become one of the most significant portions of the network traffic. Accurate identification of P2P traffic makes great sense for efficient network management and reasonable utility of network resources. In recent years, P2P traffic classification using machine learning has been a new direction in traffic identification. This paper proposed a new method based on decision-tree model, using C4.5 and P2P traffic characteristic. The experiments show this method can effectively avoid the instability of P2P traffic distribution change. Compared with SVM and NBK method, the average of classified precision can increase at least 3.83 percentage points.