无线互联科技
無線互聯科技
무선호련과기
WUXIAN HULIAN KEJI
2015年
6期
93-94
,共2页
新浪微博%Python%爬虫
新浪微博%Python%爬蟲
신랑미박%Python%파충
Sina micro-blog%Python%Crawler
对比新浪提供的API及传统的爬虫方式获取微博的优缺点,采用模拟登陆和网页解析技术,将获取的信息存入数据库中并进行分析。基于Python设计实现了新浪微博爬虫程序,可以根据指定的关键词获取相应的微博内容及用户信息。
對比新浪提供的API及傳統的爬蟲方式穫取微博的優缺點,採用模擬登陸和網頁解析技術,將穫取的信息存入數據庫中併進行分析。基于Python設計實現瞭新浪微博爬蟲程序,可以根據指定的關鍵詞穫取相應的微博內容及用戶信息。
대비신랑제공적API급전통적파충방식획취미박적우결점,채용모의등륙화망혈해석기술,장획취적신식존입수거고중병진행분석。기우Python설계실현료신랑미박파충정서,가이근거지정적관건사획취상응적미박내용급용호신식。
The advantages and disadvantages of obtaining micro-blog contrast Sina provides API and traditional crawler style, using simulated landing and Webpage analysis technology, the information stored in the database and analysis. The design and implementation of Python based on the Sina micro-blog crawler, can obtain micro-blog content and user information corresponding to the speciifed keyword.