计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2014年
11期
3268-3272
,共5页
区间不确定性数据%代数插值%朴素贝叶斯%Parzen窗估计%分类
區間不確定性數據%代數插值%樸素貝葉斯%Parzen窗估計%分類
구간불학정성수거%대수삽치%박소패협사%Parzen창고계%분류
interval uncertain data%algebraic interpolation%Naive Bayes (NB)%Parzen Window Estimation (PWE)%classification
基于Parzen窗的朴素贝叶斯在区间不确定性数据分类中存在计算复杂度高、空间需求大的不足.针对该问题,提出一种改进的区间不确定性数据分类方法IU-PNBC.首先采用Parzen窗估计区间样本的类条件概率密度函数(CCPDF);然后通过代数插值得到类条件概率密度函数的近似函数;最后利用近似代数插值函数计算样本的后验概率,并用于预测.通过人工生成的仿真数据和UCI标准数据集验证了算法假设的合理性以及插值点数对IU-PNBC算法分类精度的影响.实验结果表明,当插值点数大于15时,IU-PNBC算法的分类精度趋于稳定,且插值点数越多,算法分类精度越高;该算法可以避免原Parzen窗估计对训练样本的依赖,并有效降低计算复杂度;同时由于该算法具有远低于基于Parzen窗的朴素贝叶斯的运行时间和空间需求,因此适合解决数据量较大的区间不确定性数据分类问题.
基于Parzen窗的樸素貝葉斯在區間不確定性數據分類中存在計算複雜度高、空間需求大的不足.針對該問題,提齣一種改進的區間不確定性數據分類方法IU-PNBC.首先採用Parzen窗估計區間樣本的類條件概率密度函數(CCPDF);然後通過代數插值得到類條件概率密度函數的近似函數;最後利用近似代數插值函數計算樣本的後驗概率,併用于預測.通過人工生成的倣真數據和UCI標準數據集驗證瞭算法假設的閤理性以及插值點數對IU-PNBC算法分類精度的影響.實驗結果錶明,噹插值點數大于15時,IU-PNBC算法的分類精度趨于穩定,且插值點數越多,算法分類精度越高;該算法可以避免原Parzen窗估計對訓練樣本的依賴,併有效降低計算複雜度;同時由于該算法具有遠低于基于Parzen窗的樸素貝葉斯的運行時間和空間需求,因此適閤解決數據量較大的區間不確定性數據分類問題.
기우Parzen창적박소패협사재구간불학정성수거분류중존재계산복잡도고、공간수구대적불족.침대해문제,제출일충개진적구간불학정성수거분류방법IU-PNBC.수선채용Parzen창고계구간양본적류조건개솔밀도함수(CCPDF);연후통과대수삽치득도류조건개솔밀도함수적근사함수;최후이용근사대수삽치함수계산양본적후험개솔,병용우예측.통과인공생성적방진수거화UCI표준수거집험증료산법가설적합이성이급삽치점수대IU-PNBC산법분류정도적영향.실험결과표명,당삽치점수대우15시,IU-PNBC산법적분류정도추우은정,차삽치점수월다,산법분류정도월고;해산법가이피면원Parzen창고계대훈련양본적의뢰,병유효강저계산복잡도;동시유우해산법구유원저우기우Parzen창적박소패협사적운행시간화공간수구,인차괄합해결수거량교대적구간불학정성수거분류문제.