广西师范大学学报(自然科学版)
廣西師範大學學報(自然科學版)
엄서사범대학학보(자연과학판)
JOURNAL OF GUANGXI NORMAL UNIVERSITY(NATURAL SCIENCE EDITION)
2007年
2期
131-134
,共4页
信息检索%文档聚类%互信息%特征选取%向量空间模型
信息檢索%文檔聚類%互信息%特徵選取%嚮量空間模型
신식검색%문당취류%호신식%특정선취%향량공간모형
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题.相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率.通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法.在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别.实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高.
由于網絡信息的激增,如何充分利用大量的信息,併有效地為Web用戶服務成為一箇急需解決的問題.相關研究錶明利用Web文檔聚類的方法可以縮小信息檢索的範圍,提高查詢準確率.通過分析Web文檔的特徵以及常用Web文檔聚類方法的優缺點,提齣瞭一種基于互信息理論的Web文檔聚類的方法.在聚類的過程中,計算特徵詞之間的互信息值,根據閾值判斷特徵詞是否屬于同一類彆.實驗結果錶明,該方法與K-Means聚類算法相比較,在準確率和召迴率方麵均有提高.
유우망락신식적격증,여하충분이용대량적신식,병유효지위Web용호복무성위일개급수해결적문제.상관연구표명이용Web문당취류적방법가이축소신식검색적범위,제고사순준학솔.통과분석Web문당적특정이급상용Web문당취류방법적우결점,제출료일충기우호신식이론적Web문당취류적방법.재취류적과정중,계산특정사지간적호신식치,근거역치판단특정사시부속우동일유별.실험결과표명,해방법여K-Means취류산법상비교,재준학솔화소회솔방면균유제고.