信息通信
信息通信
신식통신
XINXI TONGXIN
2014年
2期
37-38
,共2页
主题爬虫%爬行%VSM
主題爬蟲%爬行%VSM
주제파충%파행%VSM
网络爬虫作为搜索引擎重要的组成部分,其抓取网页资源主题相关性的高低直接决定爬虫性能的好坏。文章在VSM模型的基础上引入关键词的同义、继承、属性等关系的相关词汇来增强VSM模型的语义,通过实验进行验证,改进能够取得较好的抓取效果。
網絡爬蟲作為搜索引擎重要的組成部分,其抓取網頁資源主題相關性的高低直接決定爬蟲性能的好壞。文章在VSM模型的基礎上引入關鍵詞的同義、繼承、屬性等關繫的相關詞彙來增彊VSM模型的語義,通過實驗進行驗證,改進能夠取得較好的抓取效果。
망락파충작위수색인경중요적조성부분,기조취망혈자원주제상관성적고저직접결정파충성능적호배。문장재VSM모형적기출상인입관건사적동의、계승、속성등관계적상관사회래증강VSM모형적어의,통과실험진행험증,개진능구취득교호적조취효과。