计算机光盘软件与应用
計算機光盤軟件與應用
계산궤광반연건여응용
COMPUTER CD SOFTWARE ADN APPLICATIONS
2013年
17期
79-80,83
,共3页
黄聪%李格人%罗楚
黃聰%李格人%囉楚
황총%리격인%라초
大数据%爬虫%scrapy%歌词爬取
大數據%爬蟲%scrapy%歌詞爬取
대수거%파충%scrapy%가사파취
大数据时代下,人类社会的数据正以前所未有的速度增长。问卷调查法、访谈法等传统的数据收集方法,因样本容量小、信度低等局限已无法满足高质量研究的需求,相比较而言,编写爬虫程序获取到的海量数据更为真实、全面,在信息繁荣的互联网时代更为行之有效。因此编写爬虫程序成为大数据时代信息收集的必备技能。本文主要介绍爬虫原理、scrapy爬虫框架,并以歌词爬取为例,详细讲解使用scrapy爬取数据的步骤。
大數據時代下,人類社會的數據正以前所未有的速度增長。問捲調查法、訪談法等傳統的數據收集方法,因樣本容量小、信度低等跼限已無法滿足高質量研究的需求,相比較而言,編寫爬蟲程序穫取到的海量數據更為真實、全麵,在信息繁榮的互聯網時代更為行之有效。因此編寫爬蟲程序成為大數據時代信息收集的必備技能。本文主要介紹爬蟲原理、scrapy爬蟲框架,併以歌詞爬取為例,詳細講解使用scrapy爬取數據的步驟。
대수거시대하,인류사회적수거정이전소미유적속도증장。문권조사법、방담법등전통적수거수집방법,인양본용량소、신도저등국한이무법만족고질량연구적수구,상비교이언,편사파충정서획취도적해량수거경위진실、전면,재신식번영적호련망시대경위행지유효。인차편사파충정서성위대수거시대신식수집적필비기능。본문주요개소파충원리、scrapy파충광가,병이가사파취위례,상세강해사용scrapy파취수거적보취。