计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
23期
169-171,186
,共4页
李云%田素方%李拓%徐涛
李雲%田素方%李拓%徐濤
리운%전소방%리탁%서도
Web文档%聚类%概念格%约简
Web文檔%聚類%概唸格%約簡
Web문당%취류%개념격%약간
Web文本聚类大多是基于空间向量文本表示模型的,它没有考虑特征词之间的语义关系,并且特征词的维数非常高,造成文本语义信息的损失和时间复杂度的增加.把文本作为对象,文本中的特征词作为对应的属性,形成了基于文本的形式背景,从中提取概念来表示文本并度量文本之间的相似度,从而降低了特征词的维数,减少了计算的复杂度,取得了良好的聚类结果.
Web文本聚類大多是基于空間嚮量文本錶示模型的,它沒有攷慮特徵詞之間的語義關繫,併且特徵詞的維數非常高,造成文本語義信息的損失和時間複雜度的增加.把文本作為對象,文本中的特徵詞作為對應的屬性,形成瞭基于文本的形式揹景,從中提取概唸來錶示文本併度量文本之間的相似度,從而降低瞭特徵詞的維數,減少瞭計算的複雜度,取得瞭良好的聚類結果.
Web문본취류대다시기우공간향량문본표시모형적,타몰유고필특정사지간적어의관계,병차특정사적유수비상고,조성문본어의신식적손실화시간복잡도적증가.파문본작위대상,문본중적특정사작위대응적속성,형성료기우문본적형식배경,종중제취개념래표시문본병도량문본지간적상사도,종이강저료특정사적유수,감소료계산적복잡도,취득료량호적취류결과.