计算机辅助设计与图形学学报
計算機輔助設計與圖形學學報
계산궤보조설계여도형학학보
JOURNAL OF COMPUTER-AIDED DESIGN & COMPUTER GRAPHICS
2004年
1期
142-147
,共6页
李振星%陆大珏%任继成%唐卫清%唐荣锡
李振星%陸大玨%任繼成%唐衛清%唐榮錫
리진성%륙대각%임계성%당위청%당영석
潜在语义索引%信息采集%文本过滤
潛在語義索引%信息採集%文本過濾
잠재어의색인%신식채집%문본과려
Web信息急速膨胀使有效定向采集特定领域信息成为网上信息检索中一个日益重要的研究方向.提出一种基于潜在语义索引的Web信息预测采集过滤方法.在样本文档集潜在语义索引对文档相似计算的基础上,构造出用户兴趣模型,判断页面相关性进行文本过滤.通过对Web站点结构分析、对未知网页的相关性预测来控制信息采集过程.在保持定向采集精度的同时,缩短采集时间、减少存储、加快检索,节约了网络资源.
Web信息急速膨脹使有效定嚮採集特定領域信息成為網上信息檢索中一箇日益重要的研究方嚮.提齣一種基于潛在語義索引的Web信息預測採集過濾方法.在樣本文檔集潛在語義索引對文檔相似計算的基礎上,構造齣用戶興趣模型,判斷頁麵相關性進行文本過濾.通過對Web站點結構分析、對未知網頁的相關性預測來控製信息採集過程.在保持定嚮採集精度的同時,縮短採集時間、減少存儲、加快檢索,節約瞭網絡資源.
Web신식급속팽창사유효정향채집특정영역신식성위망상신식검색중일개일익중요적연구방향.제출일충기우잠재어의색인적Web신식예측채집과려방법.재양본문당집잠재어의색인대문당상사계산적기출상,구조출용호흥취모형,판단혈면상관성진행문본과려.통과대Web참점결구분석、대미지망혈적상관성예측래공제신식채집과정.재보지정향채집정도적동시,축단채집시간、감소존저、가쾌검색,절약료망락자원.