自动化技术与应用
自動化技術與應用
자동화기술여응용
TECHNIQUES OF AUTOMATION AND APPLICATIONS
2012年
1期
32-37
,共6页
HTML Parser%正则匹配%爬虫%BBS%信息抽取
HTML Parser%正則匹配%爬蟲%BBS%信息抽取
HTML Parser%정칙필배%파충%BBS%신식추취
针对目前BBS信息爬取时网页噪声严重的特点,研究BBS信息抽取的实现.应用HTML Parser平台以及正则匹配技术,实现BBS信息的抽取、存储.设计建立了包含网页抽取模块、网页解析模块、数据库存储模块组成的信息抽取系统.实验结果表明,此方法能有效抽取BBS信息,减少网页噪声的干扰.
針對目前BBS信息爬取時網頁譟聲嚴重的特點,研究BBS信息抽取的實現.應用HTML Parser平檯以及正則匹配技術,實現BBS信息的抽取、存儲.設計建立瞭包含網頁抽取模塊、網頁解析模塊、數據庫存儲模塊組成的信息抽取繫統.實驗結果錶明,此方法能有效抽取BBS信息,減少網頁譟聲的榦擾.
침대목전BBS신식파취시망혈조성엄중적특점,연구BBS신식추취적실현.응용HTML Parser평태이급정칙필배기술,실현BBS신식적추취、존저.설계건립료포함망혈추취모괴、망혈해석모괴、수거고존저모괴조성적신식추취계통.실험결과표명,차방법능유효추취BBS신식,감소망혈조성적간우.