江西师范大学学报(自然科学版)
江西師範大學學報(自然科學版)
강서사범대학학보(자연과학판)
JOURNAL OF JIANGXI NORMAL UNIVERSITY(NATURAL SCIENCES EDITION)
2013年
4期
382-386
,共5页
杨瑞%胡弘思%张文波%姚天昉
楊瑞%鬍弘思%張文波%姚天昉
양서%호홍사%장문파%요천방
分布式系统%网络爬虫%设计
分佈式繫統%網絡爬蟲%設計
분포식계통%망락파충%설계
distributed system%web crawler%design
利用用户指定的关键字和搜索引擎生成URL种子,通过分布式网络爬虫抽取符合用户需求的网页作为研究所用的语料.实验结果表明:分布式网络爬虫可以较好地解决在短时间内抽取大量语料的需求.
利用用戶指定的關鍵字和搜索引擎生成URL種子,通過分佈式網絡爬蟲抽取符閤用戶需求的網頁作為研究所用的語料.實驗結果錶明:分佈式網絡爬蟲可以較好地解決在短時間內抽取大量語料的需求.
이용용호지정적관건자화수색인경생성URL충자,통과분포식망락파충추취부합용호수구적망혈작위연구소용적어료.실험결과표명:분포식망락파충가이교호지해결재단시간내추취대량어료적수구.