计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
5期
178-181,188
,共5页
术语簇%关联规则%文档聚类%Web挖掘%矢量空间模型
術語簇%關聯規則%文檔聚類%Web挖掘%矢量空間模型
술어족%관련규칙%문당취류%Web알굴%시량공간모형
提出一种新的基于术语簇和关联规则的文档聚类方法.首先对文档集合进行分词,根据术语之间的平均互信息形成术语簇,用术语簇来表示文档矢量空间模型,使用关联规则挖掘文档的初始聚类,对此进行聚类分析获得最终的文档聚类.实验结果表明,与传统的聚类方法相比,其运行速度快,聚类效果和聚类质量都有明显提高.
提齣一種新的基于術語簇和關聯規則的文檔聚類方法.首先對文檔集閤進行分詞,根據術語之間的平均互信息形成術語簇,用術語簇來錶示文檔矢量空間模型,使用關聯規則挖掘文檔的初始聚類,對此進行聚類分析穫得最終的文檔聚類.實驗結果錶明,與傳統的聚類方法相比,其運行速度快,聚類效果和聚類質量都有明顯提高.
제출일충신적기우술어족화관련규칙적문당취류방법.수선대문당집합진행분사,근거술어지간적평균호신식형성술어족,용술어족래표시문당시량공간모형,사용관련규칙알굴문당적초시취류,대차진행취류분석획득최종적문당취류.실험결과표명,여전통적취류방법상비,기운행속도쾌,취류효과화취류질량도유명현제고.