计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2011年
4期
135-139
,共5页
徐宇明%陈诚%熊赟%朱扬勇
徐宇明%陳誠%熊赟%硃颺勇
서우명%진성%웅빈%주양용
分类%缺失值填充%索引%数据挖掘%数据准备
分類%缺失值填充%索引%數據挖掘%數據準備
분류%결실치전충%색인%수거알굴%수거준비
分类是一种常见的数据挖掘方法,而属性值缺失是分类过程中常见的一类数据质量问题,缺失值填充可以减少属性值缺失造成的分类错误.缺失值填充首先要求准确率高,在许多实际应用当中,缺失值填充还必须保证较高的计算效率.提出了一种填充缺失属性值算法APT-KNN,APT-KNN算法利用属性与属性之间的相互关系,根据与目标最相似的几个实例属性值来估计缺失值,以保证填充结果具有更高的准确性,同时设计了一种优化的AntiPole树索引结构,提高了缺失属性值的填充效率.实验表明,APT-KNN方法与现有的几种缺失属性填充方法相比,具有更高的准确率和填充效率.
分類是一種常見的數據挖掘方法,而屬性值缺失是分類過程中常見的一類數據質量問題,缺失值填充可以減少屬性值缺失造成的分類錯誤.缺失值填充首先要求準確率高,在許多實際應用噹中,缺失值填充還必鬚保證較高的計算效率.提齣瞭一種填充缺失屬性值算法APT-KNN,APT-KNN算法利用屬性與屬性之間的相互關繫,根據與目標最相似的幾箇實例屬性值來估計缺失值,以保證填充結果具有更高的準確性,同時設計瞭一種優化的AntiPole樹索引結構,提高瞭缺失屬性值的填充效率.實驗錶明,APT-KNN方法與現有的幾種缺失屬性填充方法相比,具有更高的準確率和填充效率.
분류시일충상견적수거알굴방법,이속성치결실시분류과정중상견적일류수거질량문제,결실치전충가이감소속성치결실조성적분류착오.결실치전충수선요구준학솔고,재허다실제응용당중,결실치전충환필수보증교고적계산효솔.제출료일충전충결실속성치산법APT-KNN,APT-KNN산법이용속성여속성지간적상호관계,근거여목표최상사적궤개실례속성치래고계결실치,이보증전충결과구유경고적준학성,동시설계료일충우화적AntiPole수색인결구,제고료결실속성치적전충효솔.실험표명,APT-KNN방법여현유적궤충결실속성전충방법상비,구유경고적준학솔화전충효솔.