计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
27期
131-134
,共4页
文本分类%特征选择%遗传算法%粗糙集
文本分類%特徵選擇%遺傳算法%粗糙集
문본분류%특정선택%유전산법%조조집
从海量文本集中选择较优秀的特征子集是文本分类中的一个NP-难问题.而对于NP-问题,遗传算法往往能够有效地加以解决.为了克服传统遗传算法的"漂移"和"早敛"问题,首先引入了粗糙集并在此基础上详细设计了适应度函数、自适应交叉算子、自适应变异算子以及合理的终止条件.以此遗传算法为基础设计了一个特征选择算法.在复旦大学提供的语料库上进行了试验验证.实验结果表明此特征选择算法性能良好.
從海量文本集中選擇較優秀的特徵子集是文本分類中的一箇NP-難問題.而對于NP-問題,遺傳算法往往能夠有效地加以解決.為瞭剋服傳統遺傳算法的"漂移"和"早斂"問題,首先引入瞭粗糙集併在此基礎上詳細設計瞭適應度函數、自適應交扠算子、自適應變異算子以及閤理的終止條件.以此遺傳算法為基礎設計瞭一箇特徵選擇算法.在複旦大學提供的語料庫上進行瞭試驗驗證.實驗結果錶明此特徵選擇算法性能良好.
종해량문본집중선택교우수적특정자집시문본분류중적일개NP-난문제.이대우NP-문제,유전산법왕왕능구유효지가이해결.위료극복전통유전산법적"표이"화"조렴"문제,수선인입료조조집병재차기출상상세설계료괄응도함수、자괄응교차산자、자괄응변이산자이급합리적종지조건.이차유전산법위기출설계료일개특정선택산법.재복단대학제공적어료고상진행료시험험증.실험결과표명차특정선택산법성능량호.