计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2005年
7期
1570-1572
,共3页
文档挖掘%文档聚类%关联规则%文档主题特征向量%文档关键字特征向量
文檔挖掘%文檔聚類%關聯規則%文檔主題特徵嚮量%文檔關鍵字特徵嚮量
문당알굴%문당취류%관련규칙%문당주제특정향량%문당관건자특정향량
提出了一种新的基于关联规则的多层文档聚类算法,该算法利用新的文档特征抽取方法构造了文档的主题和关键字特征向量.首先在主题特征向量空间中利用频集快速算法对文档进行初始聚类,然后在基于主题关键字的新的特征向量空间中利用类间距和连接度对初始文档类进行求精,从而得到最终聚类.由于使用了两层聚类方法,使算法的效率和精度都大大提高;使用新的文档特征抽取方法还解决了由于文档关键字过多而导致文档特征向量的维数过高的问题.
提齣瞭一種新的基于關聯規則的多層文檔聚類算法,該算法利用新的文檔特徵抽取方法構造瞭文檔的主題和關鍵字特徵嚮量.首先在主題特徵嚮量空間中利用頻集快速算法對文檔進行初始聚類,然後在基于主題關鍵字的新的特徵嚮量空間中利用類間距和連接度對初始文檔類進行求精,從而得到最終聚類.由于使用瞭兩層聚類方法,使算法的效率和精度都大大提高;使用新的文檔特徵抽取方法還解決瞭由于文檔關鍵字過多而導緻文檔特徵嚮量的維數過高的問題.
제출료일충신적기우관련규칙적다층문당취류산법,해산법이용신적문당특정추취방법구조료문당적주제화관건자특정향량.수선재주제특정향량공간중이용빈집쾌속산법대문당진행초시취류,연후재기우주제관건자적신적특정향량공간중이용류간거화련접도대초시문당류진행구정,종이득도최종취류.유우사용료량층취류방법,사산법적효솔화정도도대대제고;사용신적문당특정추취방법환해결료유우문당관건자과다이도치문당특정향량적유수과고적문제.