渤海大学学报(自然科学版)
渤海大學學報(自然科學版)
발해대학학보(자연과학판)
JOURNAL OF BOHAI UNIVERSITY(NATURAL SCIENCE EDITION)
2013年
3期
320-322,327
,共4页
模板%信息抽取%网络爬虫
模闆%信息抽取%網絡爬蟲
모판%신식추취%망락파충
template%information extraction%web crawler
准确挖掘网页中的信息对检索系统非常重要。提出了一种基于模板的网页信息抽取方法进行网页信息抽取。该方法采用网页抓取与数据模板技术实现了网页信息的自动发现与抽取。在Yahoo网站上的实验结果表明,该方法具有较好的检索效果。
準確挖掘網頁中的信息對檢索繫統非常重要。提齣瞭一種基于模闆的網頁信息抽取方法進行網頁信息抽取。該方法採用網頁抓取與數據模闆技術實現瞭網頁信息的自動髮現與抽取。在Yahoo網站上的實驗結果錶明,該方法具有較好的檢索效果。
준학알굴망혈중적신식대검색계통비상중요。제출료일충기우모판적망혈신식추취방법진행망혈신식추취。해방법채용망혈조취여수거모판기술실현료망혈신식적자동발현여추취。재Yahoo망참상적실험결과표명,해방법구유교호적검색효과。
It is significant for retrieval system to mine information of web page .A method of extracting infor-mation in web page based on the template is used for extracting information .The technique of web crawler and data-template technology in this method could self -discover and self -extract the information of web page . The experimental results in Yahoo website indicate that this method is efficient for retrieval information .