电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2012年
15期
3656-3658
,共3页
高脂血症%文本分类%特征选择
高脂血癥%文本分類%特徵選擇
고지혈증%문본분류%특정선택
以高脂血症文献分类为背景,通过对传统特征选择算法的研究,结合特征出现概率、特征与类别的相关度,提出一种基于二类信息差值的特征选择方法.使用该算法及k近邻距离分类法在高脂血症文献数据集上进行分类,实验显示该算法优于文档频率和信息增益,可提高文本分类的查准率.
以高脂血癥文獻分類為揹景,通過對傳統特徵選擇算法的研究,結閤特徵齣現概率、特徵與類彆的相關度,提齣一種基于二類信息差值的特徵選擇方法.使用該算法及k近鄰距離分類法在高脂血癥文獻數據集上進行分類,實驗顯示該算法優于文檔頻率和信息增益,可提高文本分類的查準率.
이고지혈증문헌분류위배경,통과대전통특정선택산법적연구,결합특정출현개솔、특정여유별적상관도,제출일충기우이류신식차치적특정선택방법.사용해산법급k근린거리분류법재고지혈증문헌수거집상진행분류,실험현시해산법우우문당빈솔화신식증익,가제고문본분류적사준솔.