阜阳师范学院学报:自然科学版
阜暘師範學院學報:自然科學版
부양사범학원학보:자연과학판
Journal of Fuyang Teachers College:Natural Science
2012年
2期
66-68,85
,共4页
数据挖掘%文本聚类%聚类算法%K.Means%DBSCAN
數據挖掘%文本聚類%聚類算法%K.Means%DBSCAN
수거알굴%문본취류%취류산법%K.Means%DBSCAN
Data Mining%Document Clustering%Clustering algorithm%K-Means%DBSCAN
在使用K.Means进行文本聚类的研究中,针对K.Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。
在使用K.Means進行文本聚類的研究中,針對K.Means算法缺點,提齣瞭利用DBSACN算法確定參數K的方法,將基于密度的聚類算法應用于特徵選取上,使得K值計算有瞭一定的確定性,從而提高瞭聚類質量。這種將多種算法混閤運用的方法,為文本聚類算法的設計提供一箇新的方嚮。
재사용K.Means진행문본취류적연구중,침대K.Means산법결점,제출료이용DBSACN산법학정삼수K적방법,장기우밀도적취류산법응용우특정선취상,사득K치계산유료일정적학정성,종이제고료취류질량。저충장다충산법혼합운용적방법,위문본취류산법적설계제공일개신적방향。
In the K-Means document clustering for the shortcomings of the K-Means algorithm Document Clustering,it is proposed to use DBSCAN algorithm to determine the constant K, the density-based clustering algorithm in feature selection, making the determination of the K value no longer in randomness, thereby improving the quality of the clustering. The idea of this hybrid clustering algorithm provides a new direction for design of text clustering algorithm.