计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
2期
546-548
,共3页
杨炳儒%邵阔义%宋泽锋%张克君
楊炳儒%邵闊義%宋澤鋒%張剋君
양병유%소활의%송택봉%장극군
文档聚类%Web挖掘%特征选择%降维
文檔聚類%Web挖掘%特徵選擇%降維
문당취류%Web알굴%특정선택%강유
目前常用向量空间模型VSM(vector space model)表示文档,造成的高维问题制约了其实际应用的效果.采用了一种高性能特征选择函数,在构建VSM时选取对区分类别贡献较大的特征词,因此有效地降低了特征空间的纬度,大大提高了系统的效率,改善了聚类的效果.通过真实数据集上的实验,证明其性能优于传统方法.
目前常用嚮量空間模型VSM(vector space model)錶示文檔,造成的高維問題製約瞭其實際應用的效果.採用瞭一種高性能特徵選擇函數,在構建VSM時選取對區分類彆貢獻較大的特徵詞,因此有效地降低瞭特徵空間的緯度,大大提高瞭繫統的效率,改善瞭聚類的效果.通過真實數據集上的實驗,證明其性能優于傳統方法.
목전상용향량공간모형VSM(vector space model)표시문당,조성적고유문제제약료기실제응용적효과.채용료일충고성능특정선택함수,재구건VSM시선취대구분유별공헌교대적특정사,인차유효지강저료특정공간적위도,대대제고료계통적효솔,개선료취류적효과.통과진실수거집상적실험,증명기성능우우전통방법.