现代计算机(专业版)
現代計算機(專業版)
현대계산궤(전업판)
MODERN COMPUTER
2014年
8期
3-6,15
,共5页
P2P网络流识别%主动学习%动态阈值%过拟合样本
P2P網絡流識彆%主動學習%動態閾值%過擬閤樣本
P2P망락류식별%주동학습%동태역치%과의합양본
针对被动机器学习在P2P网络流识别中需要大量标记训练数据的问题,提出一种改进的主动学习机制,并将其与SVM分类模型相结合运用到P2P网络流识别.在采用锦标赛方法对未标记样本筛选过程中,引入样本差异性概念以避免标记样本同化而导致主动学习的早熟问题;在通过动态阈值调节因子加快主动学习收敛速度的同时,加入过拟合样本过滤策略以增强分类模型的泛化能力.理论分析和实验结果表明,该机制能有效提高未标记样本的利用率,避免主动学习可能产生的早熟收敛和过学习现象,提高P2P网络流识别精度.
針對被動機器學習在P2P網絡流識彆中需要大量標記訓練數據的問題,提齣一種改進的主動學習機製,併將其與SVM分類模型相結閤運用到P2P網絡流識彆.在採用錦標賽方法對未標記樣本篩選過程中,引入樣本差異性概唸以避免標記樣本同化而導緻主動學習的早熟問題;在通過動態閾值調節因子加快主動學習收斂速度的同時,加入過擬閤樣本過濾策略以增彊分類模型的汎化能力.理論分析和實驗結果錶明,該機製能有效提高未標記樣本的利用率,避免主動學習可能產生的早熟收斂和過學習現象,提高P2P網絡流識彆精度.
침대피동궤기학습재P2P망락류식별중수요대량표기훈련수거적문제,제출일충개진적주동학습궤제,병장기여SVM분류모형상결합운용도P2P망락류식별.재채용금표새방법대미표기양본사선과정중,인입양본차이성개념이피면표기양본동화이도치주동학습적조숙문제;재통과동태역치조절인자가쾌주동학습수렴속도적동시,가입과의합양본과려책략이증강분류모형적범화능력.이론분석화실험결과표명,해궤제능유효제고미표기양본적이용솔,피면주동학습가능산생적조숙수렴화과학습현상,제고P2P망락류식별정도.