巢湖学院学报
巢湖學院學報
소호학원학보
CHAOHU TEACHERS COLLEGE JOURNAL
2013年
3期
27-31
,共5页
吴晓琴%陈圣兵%何立新
吳曉琴%陳聖兵%何立新
오효금%진골병%하립신
遗传算法%文本聚类%向量空间模型
遺傳算法%文本聚類%嚮量空間模型
유전산법%문본취류%향량공간모형
Genetic algorithm%Text clustering%Vector space model
分析了K均值聚类算法(K-means)存在的不足和改进遗传算法的全局优化能力,提出一种基于改进遗传算法的文本聚类方法,该方法将原始文档转化成用向量空间模型来描述的文本向量,首先随机产生若干个文档向量作为初始聚类中心形成遗传算法的染色体种群,经过改进遗传算法的选择、交叉、变异进化运算,得到较为优化的K均值聚类算法的初始聚类中心。实验表明该算法文本聚类提高了查准率和查全率,算法的高效性也得到了验证。
分析瞭K均值聚類算法(K-means)存在的不足和改進遺傳算法的全跼優化能力,提齣一種基于改進遺傳算法的文本聚類方法,該方法將原始文檔轉化成用嚮量空間模型來描述的文本嚮量,首先隨機產生若榦箇文檔嚮量作為初始聚類中心形成遺傳算法的染色體種群,經過改進遺傳算法的選擇、交扠、變異進化運算,得到較為優化的K均值聚類算法的初始聚類中心。實驗錶明該算法文本聚類提高瞭查準率和查全率,算法的高效性也得到瞭驗證。
분석료K균치취류산법(K-means)존재적불족화개진유전산법적전국우화능력,제출일충기우개진유전산법적문본취류방법,해방법장원시문당전화성용향량공간모형래묘술적문본향량,수선수궤산생약간개문당향량작위초시취류중심형성유전산법적염색체충군,경과개진유전산법적선택、교차、변이진화운산,득도교위우화적K균치취류산법적초시취류중심。실험표명해산법문본취류제고료사준솔화사전솔,산법적고효성야득도료험증。