计算机应用与软件
計算機應用與軟件
계산궤응용여연건
Computer Applications and Software
2015年
11期
264-268
,共5页
文本聚类%权重因子%特征向量%遗传控制因子%遗传K-均值
文本聚類%權重因子%特徵嚮量%遺傳控製因子%遺傳K-均值
문본취류%권중인자%특정향량%유전공제인자%유전K-균치
Text clustering%Weighting factor%Feature vector%Genetic control factor%Genetic k-means
针对特征词权重表示文本时存在的局限性和遗传K-均值算子操作的低效性,首先通过特征词权重因子(WF)和特征向量结合位置权重信息的方法进行文本预处理,在此基础上通过遗传控制因子(GCF)改进遗传K-均值文本聚类算法.在个体进行交叉和变异时,使用GCF对其进行控制,并对交叉和变异概率采用自适应控制,确保了优质个体顺利进入到下一代种群.实验表明,该研究不仅对特征词分类及其权重的有效计算作出改进,还使文本聚类精度得到提高.
針對特徵詞權重錶示文本時存在的跼限性和遺傳K-均值算子操作的低效性,首先通過特徵詞權重因子(WF)和特徵嚮量結閤位置權重信息的方法進行文本預處理,在此基礎上通過遺傳控製因子(GCF)改進遺傳K-均值文本聚類算法.在箇體進行交扠和變異時,使用GCF對其進行控製,併對交扠和變異概率採用自適應控製,確保瞭優質箇體順利進入到下一代種群.實驗錶明,該研究不僅對特徵詞分類及其權重的有效計算作齣改進,還使文本聚類精度得到提高.
침대특정사권중표시문본시존재적국한성화유전K-균치산자조작적저효성,수선통과특정사권중인자(WF)화특정향량결합위치권중신식적방법진행문본예처리,재차기출상통과유전공제인자(GCF)개진유전K-균치문본취류산법.재개체진행교차화변이시,사용GCF대기진행공제,병대교차화변이개솔채용자괄응공제,학보료우질개체순리진입도하일대충군.실험표명,해연구불부대특정사분류급기권중적유효계산작출개진,환사문본취류정도득도제고.