计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2014年
1期
73-86
,共14页
高赟%周薇%韩冀中%孟丹
高赟%週薇%韓冀中%孟丹
고빈%주미%한기중%맹단
异常检测%文法压缩%日志挖掘%相对熵
異常檢測%文法壓縮%日誌挖掘%相對熵
이상검측%문법압축%일지알굴%상대적
anomaly detection%grammar compression%log mining%relative entropy
近年来日志挖掘是一种广泛使用的检测应用状态异常的方法.现有的异常检测算法需要大量计算,或者它们的有效性依赖于测试日志满足一些预先定义的日志事件概率分布.因此,它们无法用于在线检测并且在假设不成立时会失效.为了解决这些问题,该文提出了一种新的异常检测算法CADM.CADM使用正常日志和待检测日志之间的相对熵作为异常程度的标识.为了计算相对熵,CADM充分利用了相对熵和文法压缩编码大小之间的关系而不是预先定义日志事件概率分布的族.通过这种方式,CADM避免了对日志分布的预先假设.除此之外,CADM的计算复杂度为O(n),因此在日志较大的情况下有较好的扩展性.通过在仿真的日志和公开日志集上的评测结果可以看出,CADM不仅可以应用在更广泛的程序日志上,也有更高的检测精度,因此更适合在线日志挖掘异常检测的工作.
近年來日誌挖掘是一種廣汎使用的檢測應用狀態異常的方法.現有的異常檢測算法需要大量計算,或者它們的有效性依賴于測試日誌滿足一些預先定義的日誌事件概率分佈.因此,它們無法用于在線檢測併且在假設不成立時會失效.為瞭解決這些問題,該文提齣瞭一種新的異常檢測算法CADM.CADM使用正常日誌和待檢測日誌之間的相對熵作為異常程度的標識.為瞭計算相對熵,CADM充分利用瞭相對熵和文法壓縮編碼大小之間的關繫而不是預先定義日誌事件概率分佈的族.通過這種方式,CADM避免瞭對日誌分佈的預先假設.除此之外,CADM的計算複雜度為O(n),因此在日誌較大的情況下有較好的擴展性.通過在倣真的日誌和公開日誌集上的評測結果可以看齣,CADM不僅可以應用在更廣汎的程序日誌上,也有更高的檢測精度,因此更適閤在線日誌挖掘異常檢測的工作.
근년래일지알굴시일충엄범사용적검측응용상태이상적방법.현유적이상검측산법수요대량계산,혹자타문적유효성의뢰우측시일지만족일사예선정의적일지사건개솔분포.인차,타문무법용우재선검측병차재가설불성립시회실효.위료해결저사문제,해문제출료일충신적이상검측산법CADM.CADM사용정상일지화대검측일지지간적상대적작위이상정도적표식.위료계산상대적,CADM충분이용료상대적화문법압축편마대소지간적관계이불시예선정의일지사건개솔분포적족.통과저충방식,CADM피면료대일지분포적예선가설.제차지외,CADM적계산복잡도위O(n),인차재일지교대적정황하유교호적확전성.통과재방진적일지화공개일지집상적평측결과가이간출,CADM불부가이응용재경엄범적정서일지상,야유경고적검측정도,인차경괄합재선일지알굴이상검측적공작.