解放军理工大学学报(自然科学版)
解放軍理工大學學報(自然科學版)
해방군리공대학학보(자연과학판)
JOURNAL OF PLA UNIVERSITY OF SCIENCE AND TECHNOLOGY(NATURAL SCIENCE EDITION)
2014年
5期
441-450
,共10页
韩晓光%姚宣霞%曲武%郭长友
韓曉光%姚宣霞%麯武%郭長友
한효광%요선하%곡무%곽장우
恶意代码%增量聚类%纹理特征%标注
噁意代碼%增量聚類%紋理特徵%標註
악의대마%증량취류%문리특정%표주
malware%incremental clustering%texture features%labeling
针对传统恶意代码标注分析方法中特征提取能力不足以及家族标注不统一、不规范、不精确且时效性差等问题,通过对大量恶意样本PE文件纹理构成和分布的研究,提出了基于内容纹理聚类的恶意代码深度标注方法。该方法对恶意代码的纹理指纹进行统计分析,从基准标注和深度标注这2个步骤对恶意代码家族进行归纳和分析,并结合VirusTotal分析方法、基于GLCM纹理特征空间构建方法和基于P-Stable LSH的近邻增量聚类算法,对恶意代码家族进行深度标注。实验结果表明,基于上述方法开发的原型系统具有家族标注准确率高、支持增量标注等优势,通过深度标注生成的基准标签实用性强,且对未知恶意代码检测具有积极意义。
針對傳統噁意代碼標註分析方法中特徵提取能力不足以及傢族標註不統一、不規範、不精確且時效性差等問題,通過對大量噁意樣本PE文件紋理構成和分佈的研究,提齣瞭基于內容紋理聚類的噁意代碼深度標註方法。該方法對噁意代碼的紋理指紋進行統計分析,從基準標註和深度標註這2箇步驟對噁意代碼傢族進行歸納和分析,併結閤VirusTotal分析方法、基于GLCM紋理特徵空間構建方法和基于P-Stable LSH的近鄰增量聚類算法,對噁意代碼傢族進行深度標註。實驗結果錶明,基于上述方法開髮的原型繫統具有傢族標註準確率高、支持增量標註等優勢,通過深度標註生成的基準標籤實用性彊,且對未知噁意代碼檢測具有積極意義。
침대전통악의대마표주분석방법중특정제취능력불족이급가족표주불통일、불규범、불정학차시효성차등문제,통과대대량악의양본PE문건문리구성화분포적연구,제출료기우내용문리취류적악의대마심도표주방법。해방법대악의대마적문리지문진행통계분석,종기준표주화심도표주저2개보취대악의대마가족진행귀납화분석,병결합VirusTotal분석방법、기우GLCM문리특정공간구건방법화기우P-Stable LSH적근린증량취류산법,대악의대마가족진행심도표주。실험결과표명,기우상술방법개발적원형계통구유가족표주준학솔고、지지증량표주등우세,통과심도표주생성적기준표첨실용성강,차대미지악의대마검측구유적겁의의。
Through the study of the portable executable( PE) file texture structure and distribution of a large number of malicious samples, this paper proposes a malicious code in-depth annotation method based on the content texture clustering technology. After a statistical analysis of a large number of the malware texture fingerprint, the algorithm summarized and onalyzed the family of the malware from three steps:VirusTotal vote analysis method, texture fea-ture space creation method based on the gray level co-occurence matrix ( GLCM ) feature and efficient incremental clustering algorithm based on the P-Stable locality sensitive hashing( LSH) , and thus obtained the depth of annota-tions to malicious code family. Experimental results show that the prototype system developed based on the above method has marked a malware family with high accuracy,and supported incremental tagging, and has positive sig-nificance for the detection of unknown malicious code.