现代图书情报技术
現代圖書情報技術
현대도서정보기술
NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE
2005年
5期
41-45
,共5页
Web结构%超链接%主题%预测%算法
Web結構%超鏈接%主題%預測%算法
Web결구%초련접%주제%예측%산법
主要介绍了设计开发Web主题信息采集系统的一个核心算法--超链接主题预测算法.文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法,系统评价结果显示该算法有很好的效果.
主要介紹瞭設計開髮Web主題信息採集繫統的一箇覈心算法--超鏈接主題預測算法.文章在已有理論的基礎上,通過實驗分析,髮現超鏈接的主題主要取決于三箇因素:父網頁的主題相關度、錨文本的主題相關度和Web子圖的鏈接結構特性,從而提齣瞭基于Web頁麵內容和鏈接結構的超鏈接主題預測算法,繫統評價結果顯示該算法有很好的效果.
주요개소료설계개발Web주제신식채집계통적일개핵심산법--초련접주제예측산법.문장재이유이론적기출상,통과실험분석,발현초련접적주제주요취결우삼개인소:부망혈적주제상관도、묘문본적주제상관도화Web자도적련접결구특성,종이제출료기우Web혈면내용화련접결구적초련접주제예측산법,계통평개결과현시해산법유흔호적효과.