计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2011年
1期
222-225
,共4页
文本分类%遗传算法%支持向量机%特征选择
文本分類%遺傳算法%支持嚮量機%特徵選擇
문본분류%유전산법%지지향량궤%특정선택
文本特征维数通常高达几万且特征之间存在大量冗余和不相关信息,从而导致传统的分类方法效率低、分类准确率低.为了提高文本分类的快速性和准确性,提出了一种遗传算法(GA)和支持向量机(SVM)相结合的文本分类方法.把文本特征组合看作遗传算法中一个染色体,并进行二进制编码,将支持向量机分类准确率作为遗传算法的适应度函数,对每一个个体适应度的评价,通过选择、交叉和变异的遗传操作,得到文本最优特征,最后通过支持向量机利用最优特征进行分类.对复旦大学中文文本分类库进行仿真实验,实验结果表明,相对于传统的文本分类方法,能够快速地得到最优分类特征子集,大大提高文本分类的准确率,在文本挖掘中具有较好的应用前景.
文本特徵維數通常高達幾萬且特徵之間存在大量冗餘和不相關信息,從而導緻傳統的分類方法效率低、分類準確率低.為瞭提高文本分類的快速性和準確性,提齣瞭一種遺傳算法(GA)和支持嚮量機(SVM)相結閤的文本分類方法.把文本特徵組閤看作遺傳算法中一箇染色體,併進行二進製編碼,將支持嚮量機分類準確率作為遺傳算法的適應度函數,對每一箇箇體適應度的評價,通過選擇、交扠和變異的遺傳操作,得到文本最優特徵,最後通過支持嚮量機利用最優特徵進行分類.對複旦大學中文文本分類庫進行倣真實驗,實驗結果錶明,相對于傳統的文本分類方法,能夠快速地得到最優分類特徵子集,大大提高文本分類的準確率,在文本挖掘中具有較好的應用前景.
문본특정유수통상고체궤만차특정지간존재대량용여화불상관신식,종이도치전통적분류방법효솔저、분류준학솔저.위료제고문본분류적쾌속성화준학성,제출료일충유전산법(GA)화지지향량궤(SVM)상결합적문본분류방법.파문본특정조합간작유전산법중일개염색체,병진행이진제편마,장지지향량궤분류준학솔작위유전산법적괄응도함수,대매일개개체괄응도적평개,통과선택、교차화변이적유전조작,득도문본최우특정,최후통과지지향량궤이용최우특정진행분류.대복단대학중문문본분류고진행방진실험,실험결과표명,상대우전통적문본분류방법,능구쾌속지득도최우분류특정자집,대대제고문본분류적준학솔,재문본알굴중구유교호적응용전경.