现代计算机(专业版)
現代計算機(專業版)
현대계산궤(전업판)
MODERN COMPUTER
2014年
2期
3-6,25
,共5页
文本聚类%算法%评价方法
文本聚類%算法%評價方法
문본취류%산법%평개방법
Text Clustering%Algorithm%Evaluation Methods
聚类算法作为发现数据内在结构与分布特征的无监督学习方法,被广泛应用于各个领域。伴随着互联网的高速发展和在线文档数量的大幅增加,文本聚类已成为一项重要任务。讨论文本聚类算法的基本概念与应用场景,对文本聚类算法及评价方法进行综述。
聚類算法作為髮現數據內在結構與分佈特徵的無鑑督學習方法,被廣汎應用于各箇領域。伴隨著互聯網的高速髮展和在線文檔數量的大幅增加,文本聚類已成為一項重要任務。討論文本聚類算法的基本概唸與應用場景,對文本聚類算法及評價方法進行綜述。
취류산법작위발현수거내재결구여분포특정적무감독학습방법,피엄범응용우각개영역。반수착호련망적고속발전화재선문당수량적대폭증가,문본취류이성위일항중요임무。토논문본취류산법적기본개념여응용장경,대문본취류산법급평개방법진행종술。
As an unsupervised machine learning method, clustering algorithms discover the inherent struct and distrubution of data, which are widely used in various fields. With the rapid development of the Internet and substantial increase of online documents, text clustering has be-come an important task. Discusses the basic concepts and application scenarios of text clustering, reviews the algorithms and evaluation methods of text clustering.