电脑知识与技术
電腦知識與技術
전뇌지식여기술
COMPUTER KNOWLEDGE AND TECHNOLOGY
2010年
30期
8485-8486,8497
,共3页
陈鹤年%季文天%王成%李俊青
陳鶴年%季文天%王成%李俊青
진학년%계문천%왕성%리준청
Gzip%编码%网络爬虫%搜索引擎
Gzip%編碼%網絡爬蟲%搜索引擎
Gzip%편마%망락파충%수색인경
搜索引擎是互联网上最热门的基础应用之一,搜索引擎主要有三部分组成,网页抓取(Web Crawler),建立索引(Indexing)和搜索(Searching).该文阐述了网页爬取部分爬虫的设计,并就其中两项关键技术Gzip解压和UTF-8编码进行了详细的阐述,解决了网页爬的通用型问题,并为第三部分搜索提供直接支持.
搜索引擎是互聯網上最熱門的基礎應用之一,搜索引擎主要有三部分組成,網頁抓取(Web Crawler),建立索引(Indexing)和搜索(Searching).該文闡述瞭網頁爬取部分爬蟲的設計,併就其中兩項關鍵技術Gzip解壓和UTF-8編碼進行瞭詳細的闡述,解決瞭網頁爬的通用型問題,併為第三部分搜索提供直接支持.
수색인경시호련망상최열문적기출응용지일,수색인경주요유삼부분조성,망혈조취(Web Crawler),건립색인(Indexing)화수색(Searching).해문천술료망혈파취부분파충적설계,병취기중량항관건기술Gzip해압화UTF-8편마진행료상세적천술,해결료망혈파적통용형문제,병위제삼부분수색제공직접지지.