微型电脑应用
微型電腦應用
미형전뇌응용
MICROCOMPUTER APPLICATIONS
2012年
2期
55-58
,共4页
李华昱%刘亚南%欧阳纯萍
李華昱%劉亞南%歐暘純萍
리화욱%류아남%구양순평
文本分类%特征提取%统计方法%遗传算法
文本分類%特徵提取%統計方法%遺傳算法
문본분류%특정제취%통계방법%유전산법
特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优解的产生.针对特征提取技术中的问题,提出基于x2统计-遗传算法的特征提取算法,此方法将词条的x2统计值引入到特征向量中,将此类向量作为遗传算法的初始种群进行启发式搜索,与此同时,针对特征提取的性质,提出新的适应度函数和交叉规则.实验表明,基于x2统计-遗传算法的特征提取算法能选择出准确表征文本类别的特征项,将其运用到文本分类系统中能有效地提高文本分类的准确率.
特徵提取技術是決定分類結果優良的主要因素,傳統特徵提取方法存在許多不足,諸如,噹類彆和特徵分佈高度不平衡時,不能有效地處理低頻詞;對于單箇特徵的處理不噹,導緻跼部最優解的產生.針對特徵提取技術中的問題,提齣基于x2統計-遺傳算法的特徵提取算法,此方法將詞條的x2統計值引入到特徵嚮量中,將此類嚮量作為遺傳算法的初始種群進行啟髮式搜索,與此同時,針對特徵提取的性質,提齣新的適應度函數和交扠規則.實驗錶明,基于x2統計-遺傳算法的特徵提取算法能選擇齣準確錶徵文本類彆的特徵項,將其運用到文本分類繫統中能有效地提高文本分類的準確率.
특정제취기술시결정분류결과우량적주요인소,전통특정제취방법존재허다불족,제여,당유별화특정분포고도불평형시,불능유효지처리저빈사;대우단개특정적처리불당,도치국부최우해적산생.침대특정제취기술중적문제,제출기우x2통계-유전산법적특정제취산법,차방법장사조적x2통계치인입도특정향량중,장차류향량작위유전산법적초시충군진행계발식수색,여차동시,침대특정제취적성질,제출신적괄응도함수화교차규칙.실험표명,기우x2통계-유전산법적특정제취산법능선택출준학표정문본유별적특정항,장기운용도문본분류계통중능유효지제고문본분류적준학솔.