计算机光盘软件与应用
計算機光盤軟件與應用
계산궤광반연건여응용
COMPUTER CD SOFTWARE ADN APPLICATIONS
2010年
16期
36-38
,共3页
赵德平%蔡立静%李鹏%刘阳
趙德平%蔡立靜%李鵬%劉暘
조덕평%채립정%리붕%류양
空间向量模型%网页标题%主题相关度%布尔模型%主题爬虫
空間嚮量模型%網頁標題%主題相關度%佈爾模型%主題爬蟲
공간향량모형%망혈표제%주제상관도%포이모형%주제파충
首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型;布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页标题的空间向量模型主题相关度计算方法Relative.经过试验分析,该算法具有很好的实用性,基于该算法的主题爬虫系统能够在Web上爬取高度主题相关的网页,极大的提高了网络爬虫的效率.
首先,給齣瞭主題爬蟲的概唸;然後介紹瞭主題相關度計算的兩種模型;佈爾模型和空間嚮量模型;通過對兩種模型進行分析,提齣瞭一種基于網頁標題的空間嚮量模型主題相關度計算方法Relative.經過試驗分析,該算法具有很好的實用性,基于該算法的主題爬蟲繫統能夠在Web上爬取高度主題相關的網頁,極大的提高瞭網絡爬蟲的效率.
수선,급출료주제파충적개념;연후개소료주제상관도계산적량충모형;포이모형화공간향량모형;통과대량충모형진행분석,제출료일충기우망혈표제적공간향량모형주제상관도계산방법Relative.경과시험분석,해산법구유흔호적실용성,기우해산법적주제파충계통능구재Web상파취고도주제상관적망혈,겁대적제고료망락파충적효솔.