计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2011年
7期
148-151,161
,共5页
张净%孙志挥%宋余庆%倪巍伟%晏燕华
張淨%孫誌揮%宋餘慶%倪巍偉%晏燕華
장정%손지휘%송여경%예외위%안연화
离群点挖掘%信息论%属性选择%熵%互信息
離群點挖掘%信息論%屬性選擇%熵%互信息
리군점알굴%신식론%속성선택%적%호신식
针对高维海量数据集离群点挖掘存在“维数灾难”的问题,提出了基于信息论的高维海量数据的离群点挖掘算法.该算法采用属性选择,去除冗余属性降维.利用信息熵作为离群点判断的度量标准,消除距离和密度量纲的弊端.在真实数据集上的实验结果表明,算法对高维海量数据离群点挖掘是有效可行的,其效率和精度得到了明显提高.
針對高維海量數據集離群點挖掘存在“維數災難”的問題,提齣瞭基于信息論的高維海量數據的離群點挖掘算法.該算法採用屬性選擇,去除冗餘屬性降維.利用信息熵作為離群點判斷的度量標準,消除距離和密度量綱的弊耑.在真實數據集上的實驗結果錶明,算法對高維海量數據離群點挖掘是有效可行的,其效率和精度得到瞭明顯提高.
침대고유해량수거집리군점알굴존재“유수재난”적문제,제출료기우신식론적고유해량수거적리군점알굴산법.해산법채용속성선택,거제용여속성강유.이용신식적작위리군점판단적도량표준,소제거리화밀도량강적폐단.재진실수거집상적실험결과표명,산법대고유해량수거리군점알굴시유효가행적,기효솔화정도득도료명현제고.