计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2010年
5期
788-795
,共8页
陈冠华%马秀莉%杨冬青%唐世渭%帅猛%谢昆青
陳冠華%馬秀莉%楊鼕青%唐世渭%帥猛%謝昆青
진관화%마수리%양동청%당세위%수맹%사곤청
数据挖掘%异常检测%高维数据%低冗余%异常度量
數據挖掘%異常檢測%高維數據%低冗餘%異常度量
수거알굴%이상검측%고유수거%저용여%이상도량
异常发现是数据挖掘领域的一类重要任务.针对高维对象的异常度量问题和异常点集合的冗余问题,提出了一种新的面向高维数据的异常点发现方法.该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含不同类型属性的高维数据.为了解决top-k异常点集合中的冗余问题,提出了低冗余top-k异常点的概念.由于精确计算低冗余的top-k异常点是NP-hard问题,设计了计算近似低冗余的top-k异常点的启发式方法k-AnomaliesHD算法.从在真实和人工数据集上的实验结果可以看出,该方法具有较好的扩展性;而且与不考虑冗余的异常点发现方法相比较,能够更有效地概括数据中的异常模式.
異常髮現是數據挖掘領域的一類重要任務.針對高維對象的異常度量問題和異常點集閤的冗餘問題,提齣瞭一種新的麵嚮高維數據的異常點髮現方法.該方法通過採用高維數據的二部圖錶示,以高維對象的壓縮能力作為其異常程度的度量,能夠有效支持包含不同類型屬性的高維數據.為瞭解決top-k異常點集閤中的冗餘問題,提齣瞭低冗餘top-k異常點的概唸.由于精確計算低冗餘的top-k異常點是NP-hard問題,設計瞭計算近似低冗餘的top-k異常點的啟髮式方法k-AnomaliesHD算法.從在真實和人工數據集上的實驗結果可以看齣,該方法具有較好的擴展性;而且與不攷慮冗餘的異常點髮現方法相比較,能夠更有效地概括數據中的異常模式.
이상발현시수거알굴영역적일류중요임무.침대고유대상적이상도량문제화이상점집합적용여문제,제출료일충신적면향고유수거적이상점발현방법.해방법통과채용고유수거적이부도표시,이고유대상적압축능력작위기이상정도적도량,능구유효지지포함불동류형속성적고유수거.위료해결top-k이상점집합중적용여문제,제출료저용여top-k이상점적개념.유우정학계산저용여적top-k이상점시NP-hard문제,설계료계산근사저용여적top-k이상점적계발식방법k-AnomaliesHD산법.종재진실화인공수거집상적실험결과가이간출,해방법구유교호적확전성;이차여불고필용여적이상점발현방법상비교,능구경유효지개괄수거중적이상모식.