计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2014年
7期
2082-2084,2087
,共4页
特征提取%特征选择%信息增益%特征频率
特徵提取%特徵選擇%信息增益%特徵頻率
특정제취%특정선택%신식증익%특정빈솔
feature extracting%feature selection%information gain%feature frequency
在传统的k-gram方法提取的特征的基础上,为了选出更加有效的特征,提出了一种新的特征选择方法——信息增益.由于针对信息增益方法中未对特征碎片的词频给予足够重视,从而导致特征分布不均的问题,将特征频率应用于信息增益方法上,提出了一种基于信息增益的改进方法.实验表明,该方法有很好的可信性和鲁棒性,与同类方法相比有明显优势,是对软件特征技术有意义的探索.
在傳統的k-gram方法提取的特徵的基礎上,為瞭選齣更加有效的特徵,提齣瞭一種新的特徵選擇方法——信息增益.由于針對信息增益方法中未對特徵碎片的詞頻給予足夠重視,從而導緻特徵分佈不均的問題,將特徵頻率應用于信息增益方法上,提齣瞭一種基于信息增益的改進方法.實驗錶明,該方法有很好的可信性和魯棒性,與同類方法相比有明顯優勢,是對軟件特徵技術有意義的探索.
재전통적k-gram방법제취적특정적기출상,위료선출경가유효적특정,제출료일충신적특정선택방법——신식증익.유우침대신식증익방법중미대특정쇄편적사빈급여족구중시,종이도치특정분포불균적문제,장특정빈솔응용우신식증익방법상,제출료일충기우신식증익적개진방법.실험표명,해방법유흔호적가신성화로봉성,여동류방법상비유명현우세,시대연건특정기술유의의적탐색.