计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2013年
9期
2490-2492,2504
,共4页
不确定性数据%数据清理%信息熵%不确定度%可信区间
不確定性數據%數據清理%信息熵%不確定度%可信區間
불학정성수거%수거청리%신식적%불학정도%가신구간
uncertain data%data cleansing%information entropy%uncertainty degree%confidence interval
针对不确定性数据中往往包含一些异常数据而导致相应的查询结果出现错误的问题,提出了一种基于信息熵的不确定性数据清理方法以减少异常数据并提高不确定性数据的质量.首先使用信息熵来度量数据的不确定度,然后结合统计学方法计算出不确定性数据的可信区间,最后去除那些不在可信区间内的数据.实验结果验证了该方法的高效性和有效性.
針對不確定性數據中往往包含一些異常數據而導緻相應的查詢結果齣現錯誤的問題,提齣瞭一種基于信息熵的不確定性數據清理方法以減少異常數據併提高不確定性數據的質量.首先使用信息熵來度量數據的不確定度,然後結閤統計學方法計算齣不確定性數據的可信區間,最後去除那些不在可信區間內的數據.實驗結果驗證瞭該方法的高效性和有效性.
침대불학정성수거중왕왕포함일사이상수거이도치상응적사순결과출현착오적문제,제출료일충기우신식적적불학정성수거청리방법이감소이상수거병제고불학정성수거적질량.수선사용신식적래도량수거적불학정도,연후결합통계학방법계산출불학정성수거적가신구간,최후거제나사불재가신구간내적수거.실험결과험증료해방법적고효성화유효성.