计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2011年
5期
220-223,249
,共5页
聚类%文本聚类%属性加权%聚类算法
聚類%文本聚類%屬性加權%聚類算法
취류%문본취류%속성가권%취류산법
研究文本聚类问题.传统的文本聚类算法存在着假设各特征词对聚类结果影响相同,聚类准确率较低的缺陷.还有一些算法通过加权的方法,能赋予重要特征词较大的权重,却造成了算法时间复杂度的增加.为解决上述问题,提出了一种新的属性加权模糊C均值文本聚类算法.算法能在迭代过程中标注出每一特征词的权重,却不影响算法的执行效率.使得类内距离之和较小的属性,权值较大;反之则权值较小.经多次仿真证明,提出的文本聚类算法在运算速度、准确率和标注不同属性的重要程度方面都有一定的优势.为文档自动文摘、数字图书馆服务和文档集合自动整理等系统的设计提供了可靠的依据.
研究文本聚類問題.傳統的文本聚類算法存在著假設各特徵詞對聚類結果影響相同,聚類準確率較低的缺陷.還有一些算法通過加權的方法,能賦予重要特徵詞較大的權重,卻造成瞭算法時間複雜度的增加.為解決上述問題,提齣瞭一種新的屬性加權模糊C均值文本聚類算法.算法能在迭代過程中標註齣每一特徵詞的權重,卻不影響算法的執行效率.使得類內距離之和較小的屬性,權值較大;反之則權值較小.經多次倣真證明,提齣的文本聚類算法在運算速度、準確率和標註不同屬性的重要程度方麵都有一定的優勢.為文檔自動文摘、數字圖書館服務和文檔集閤自動整理等繫統的設計提供瞭可靠的依據.
연구문본취류문제.전통적문본취류산법존재착가설각특정사대취류결과영향상동,취류준학솔교저적결함.환유일사산법통과가권적방법,능부여중요특정사교대적권중,각조성료산법시간복잡도적증가.위해결상술문제,제출료일충신적속성가권모호C균치문본취류산법.산법능재질대과정중표주출매일특정사적권중,각불영향산법적집행효솔.사득류내거리지화교소적속성,권치교대;반지칙권치교소.경다차방진증명,제출적문본취류산법재운산속도、준학솔화표주불동속성적중요정도방면도유일정적우세.위문당자동문적、수자도서관복무화문당집합자동정리등계통적설계제공료가고적의거.