计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2011年
1期
195-197
,共3页
特征选择%聚类%K均值%文本分类
特徵選擇%聚類%K均值%文本分類
특정선택%취류%K균치%문본분류
文本特征降维是文本自动分类的核心技术.K-means方法是一种常用的基于划分的方法.针对该算法对类中心初始值及孤立点过于敏感的问题,提出了一种改进的K-means算法用于文本特征选择.通过优化初始类中心的选择模式及对孤立点的剔除,改善了文本特征聚类的效果.随后的文本分类试验表明,提出的改进K-means算法具有较好的特征选择能力,文本分类的效率较高.
文本特徵降維是文本自動分類的覈心技術.K-means方法是一種常用的基于劃分的方法.針對該算法對類中心初始值及孤立點過于敏感的問題,提齣瞭一種改進的K-means算法用于文本特徵選擇.通過優化初始類中心的選擇模式及對孤立點的剔除,改善瞭文本特徵聚類的效果.隨後的文本分類試驗錶明,提齣的改進K-means算法具有較好的特徵選擇能力,文本分類的效率較高.
문본특정강유시문본자동분류적핵심기술.K-means방법시일충상용적기우화분적방법.침대해산법대류중심초시치급고립점과우민감적문제,제출료일충개진적K-means산법용우문본특정선택.통과우화초시류중심적선택모식급대고립점적척제,개선료문본특정취류적효과.수후적문본분류시험표명,제출적개진K-means산법구유교호적특정선택능력,문본분류적효솔교고.