软件
軟件
연건
SOFT WARE
2011年
4期
84-86,90
,共4页
短文本聚类%Ant-Tree%K-means%轮廓系数
短文本聚類%Ant-Tree%K-means%輪廓繫數
단문본취류%Ant-Tree%K-means%륜곽계수
短文本由于词频过低,使用常规的聚类算法如K-means效果不理想,难得到可接受的准确度.而最近结合使用生物启发及聚类内部有效性测量改进的方法,能够有效改善短文本的聚类效果.针对短文本聚类,提出了改进Ant-Tree的算法.该算法引入了轮廓系数作为内部效度测量,对K-means算法获得的初始聚类划分计算轮廓系数值,根据各聚簇样本值大小排序,将排序结果应用于Ant-Tree算法的初始化步骤中,使Ant-Tree算法性能得到提高.实验结果表明,该算法准确度超过了其它的算法.
短文本由于詞頻過低,使用常規的聚類算法如K-means效果不理想,難得到可接受的準確度.而最近結閤使用生物啟髮及聚類內部有效性測量改進的方法,能夠有效改善短文本的聚類效果.針對短文本聚類,提齣瞭改進Ant-Tree的算法.該算法引入瞭輪廓繫數作為內部效度測量,對K-means算法穫得的初始聚類劃分計算輪廓繫數值,根據各聚簇樣本值大小排序,將排序結果應用于Ant-Tree算法的初始化步驟中,使Ant-Tree算法性能得到提高.實驗結果錶明,該算法準確度超過瞭其它的算法.
단문본유우사빈과저,사용상규적취류산법여K-means효과불이상,난득도가접수적준학도.이최근결합사용생물계발급취류내부유효성측량개진적방법,능구유효개선단문본적취류효과.침대단문본취류,제출료개진Ant-Tree적산법.해산법인입료륜곽계수작위내부효도측량,대K-means산법획득적초시취류화분계산륜곽계수치,근거각취족양본치대소배서,장배서결과응용우Ant-Tree산법적초시화보취중,사Ant-Tree산법성능득도제고.실험결과표명,해산법준학도초과료기타적산법.