现代图书情报技术
現代圖書情報技術
현대도서정보기술
NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE
2004年
10期
51-54
,共4页
Web%主题信息%主题识别%信息采集
Web%主題信息%主題識彆%信息採集
Web%주제신식%주제식별%신식채집
主要介绍了我们设计的Web主题信息采集系统的一项核心工作--Web信息主题的识别,主题识别算法从构造专业性较强的主题词典着手,充分分析和考虑Web网页文本的特点,从而大大提高了主题信息采集的效率和精度,该算法同样适用于其他领域的主题信息识别.
主要介紹瞭我們設計的Web主題信息採集繫統的一項覈心工作--Web信息主題的識彆,主題識彆算法從構造專業性較彊的主題詞典著手,充分分析和攷慮Web網頁文本的特點,從而大大提高瞭主題信息採集的效率和精度,該算法同樣適用于其他領域的主題信息識彆.
주요개소료아문설계적Web주제신식채집계통적일항핵심공작--Web신식주제적식별,주제식별산법종구조전업성교강적주제사전착수,충분분석화고필Web망혈문본적특점,종이대대제고료주제신식채집적효솔화정도,해산법동양괄용우기타영역적주제신식식별.