计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2015年
2期
99-102
,共4页
模式分类%UCI数据库%数据分类%模式识别
模式分類%UCI數據庫%數據分類%模式識彆
모식분류%UCI수거고%수거분류%모식식별
pattern classification%UCI database%data classification%pattern recognition
模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、类别数对每一种模式分类方法的准确率和运行时间的影响。结果表明,在对一些小数据进行分类时,可以采用朴素贝叶斯、K近邻、线性判别分析方法,而对于大的数据集,支持向量机、BP神经网络、二次判别分析分类方法则比较适合,但对运行时间要求严格的分类不能采用BP神经网络方法。
模式分類方法是模式識彆的關鍵。文中重點研究瞭支持嚮量機、BP神經網絡、K近鄰、樸素貝葉斯、線性判彆分析和二次判彆分析共六種模式分類方法,併利用MATLAB對UCI上的數據集進行瞭分類測試,根據測試結果分析瞭數據集的樣本數、特徵數、類彆數對每一種模式分類方法的準確率和運行時間的影響。結果錶明,在對一些小數據進行分類時,可以採用樸素貝葉斯、K近鄰、線性判彆分析方法,而對于大的數據集,支持嚮量機、BP神經網絡、二次判彆分析分類方法則比較適閤,但對運行時間要求嚴格的分類不能採用BP神經網絡方法。
모식분류방법시모식식별적관건。문중중점연구료지지향량궤、BP신경망락、K근린、박소패협사、선성판별분석화이차판별분석공륙충모식분류방법,병이용MATLAB대UCI상적수거집진행료분류측시,근거측시결과분석료수거집적양본수、특정수、유별수대매일충모식분류방법적준학솔화운행시간적영향。결과표명,재대일사소수거진행분류시,가이채용박소패협사、K근린、선성판별분석방법,이대우대적수거집,지지향량궤、BP신경망락、이차판별분석분류방법칙비교괄합,단대운행시간요구엄격적분류불능채용BP신경망락방법。
Pattern classification method is the key to pattern recognition. It focuses on six pattern classification methods,including support vector machine,BP neural network,k-nearest neighbor,naive Bayes,linear discriminant analysis and quadratic discriminant analysis,and tested by using the MATLAB on UCI data sets. According to the results,analyze the influence of the number of samples,features,catego-ries from data sets to the accuracy and running time of six classification methods. The results showed that naive Bayes,k-nearest neigh-bor,linear discriminant analysis are suitable for small data sets,support vector machine,BP neural network,quadratic discriminant analysis for large data sets. However,when it is strict to the running time,cannot use the BP neural network.