微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2011年
5期
168-169,65
,共3页
徐东亮%董开坤%李斌%王研芬
徐東亮%董開坤%李斌%王研芬
서동량%동개곤%리빈%왕연분
文本挖掘%K-means%K-medoids%准确率%召回率
文本挖掘%K-means%K-medoids%準確率%召迴率
문본알굴%K-means%K-medoids%준학솔%소회솔
随着网络中数据信息的大量积累,如何从海量文本数据中有效提取所需要的信息成为当前文本挖掘的重要内容.本文主要研究 K-means 和 K-medoids 两种聚类算法在文本挖掘中的应用,并通过实验利用基于人工判定的指标对两类算法在聚类文档的准确率和召回率方面进行了性能比较.实验结果表明,与K-means 算法相比,K-medoids 算法无论在准确率还是召回率方面都要高出 5 个百分点以上,且后者在处理异常数据和噪声数据方面更为鲁棒.
隨著網絡中數據信息的大量積纍,如何從海量文本數據中有效提取所需要的信息成為噹前文本挖掘的重要內容.本文主要研究 K-means 和 K-medoids 兩種聚類算法在文本挖掘中的應用,併通過實驗利用基于人工判定的指標對兩類算法在聚類文檔的準確率和召迴率方麵進行瞭性能比較.實驗結果錶明,與K-means 算法相比,K-medoids 算法無論在準確率還是召迴率方麵都要高齣 5 箇百分點以上,且後者在處理異常數據和譟聲數據方麵更為魯棒.
수착망락중수거신식적대량적루,여하종해량문본수거중유효제취소수요적신식성위당전문본알굴적중요내용.본문주요연구 K-means 화 K-medoids 량충취류산법재문본알굴중적응용,병통과실험이용기우인공판정적지표대량류산법재취류문당적준학솔화소회솔방면진행료성능비교.실험결과표명,여K-means 산법상비,K-medoids 산법무론재준학솔환시소회솔방면도요고출 5 개백분점이상,차후자재처리이상수거화조성수거방면경위로봉.