计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
22期
107-110,217
,共5页
文本分类%特征选择%遗传算法%并行策略
文本分類%特徵選擇%遺傳算法%併行策略
문본분류%특정선택%유전산법%병행책략
text categorization%feature selection%Genetic Algorithm(GA)%parallel strategy
特征选择是文本分类系统的核心步骤之一.然而现有的特征选择方法都是串行化的,应用于中文海量文本数据时时间效率较低,因此利用并行策略来提高特征选择的效率,已经成为研究的热点.详细设计了一个用于特征选择的并行遗传算法,该算法采用遗传算法搜索特征,利用并行策略评价特征子集,即将种群中个体的适应度计算并行在多个计算节点上同时进行,从而较快地获得较具代表性的特征子集.实验结果表明该方法是有效的.
特徵選擇是文本分類繫統的覈心步驟之一.然而現有的特徵選擇方法都是串行化的,應用于中文海量文本數據時時間效率較低,因此利用併行策略來提高特徵選擇的效率,已經成為研究的熱點.詳細設計瞭一箇用于特徵選擇的併行遺傳算法,該算法採用遺傳算法搜索特徵,利用併行策略評價特徵子集,即將種群中箇體的適應度計算併行在多箇計算節點上同時進行,從而較快地穫得較具代錶性的特徵子集.實驗結果錶明該方法是有效的.
특정선택시문본분류계통적핵심보취지일.연이현유적특정선택방법도시천행화적,응용우중문해량문본수거시시간효솔교저,인차이용병행책략래제고특정선택적효솔,이경성위연구적열점.상세설계료일개용우특정선택적병행유전산법,해산법채용유전산법수색특정,이용병행책략평개특정자집,즉장충군중개체적괄응도계산병행재다개계산절점상동시진행,종이교쾌지획득교구대표성적특정자집.실험결과표명해방법시유효적.
Feature selection is one of the key steps in text classification system.However,most of existing feature selection methods are serial and are inefficient timely to be applied to Chinese massive text data sets,so it is a hotspot how to improve efficiency of feature selection by means of parallel strategy.h detailedly designs a Parallel Genetic Algorithm(PGA) which is used to select features.The algorithm uses genetic algorithm to search features and calculates fitness of feature subsets in multiple computing nodes at the same time,so can acquire quickly feature subsets which are more representative.Experimental results show that the method is effective.