计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2006年
z1期
171-175
,共5页
乔珠峰%田凤占%黄厚宽%陈景年
喬珠峰%田鳳佔%黃厚寬%陳景年
교주봉%전봉점%황후관%진경년
数据挖掘%缺失值%朴素贝叶斯分类器%Robust%交叉验证
數據挖掘%缺失值%樸素貝葉斯分類器%Robust%交扠驗證
수거알굴%결실치%박소패협사분류기%Robust%교차험증
由于数据挖掘技术日益广泛地应用于各个领域,而大多数领域中数据都存在缺失值,因此基于缺失数据的数据挖掘方法的研究具有重要意义.利用直接删除、特殊值填充、平均值填充、Robust方法4种处理缺失值的方法建立4个缺失值处理模型以及相应的朴素贝叶斯分类器模型.通过在5个实际数据集上进行实验比较,并采用五重交叉验证来检验这些模型的性能.结果表明,用这些模型处理缺失值构建的朴素贝叶斯分类器是有效的.
由于數據挖掘技術日益廣汎地應用于各箇領域,而大多數領域中數據都存在缺失值,因此基于缺失數據的數據挖掘方法的研究具有重要意義.利用直接刪除、特殊值填充、平均值填充、Robust方法4種處理缺失值的方法建立4箇缺失值處理模型以及相應的樸素貝葉斯分類器模型.通過在5箇實際數據集上進行實驗比較,併採用五重交扠驗證來檢驗這些模型的性能.結果錶明,用這些模型處理缺失值構建的樸素貝葉斯分類器是有效的.
유우수거알굴기술일익엄범지응용우각개영역,이대다수영역중수거도존재결실치,인차기우결실수거적수거알굴방법적연구구유중요의의.이용직접산제、특수치전충、평균치전충、Robust방법4충처리결실치적방법건립4개결실치처리모형이급상응적박소패협사분류기모형.통과재5개실제수거집상진행실험비교,병채용오중교차험증래검험저사모형적성능.결과표명,용저사모형처리결실치구건적박소패협사분류기시유효적.