航空科学技术
航空科學技術
항공과학기술
AERONAUTICAL SCIENCE AND TECHNOLOGY
2014年
6期
43-46
,共4页
信息采集%网络爬虫%ETL
信息採集%網絡爬蟲%ETL
신식채집%망락파충%ETL
information collection%web crawler%ETL
在分析网络爬虫技术与ETL技术的基础上,探讨了基于网络爬虫技术与ETL技术相融合的算法,并将该算法应用于飞机研制信息采集,实验结果表明,该算法完全满足非结构化数据采集的要求。
在分析網絡爬蟲技術與ETL技術的基礎上,探討瞭基于網絡爬蟲技術與ETL技術相融閤的算法,併將該算法應用于飛機研製信息採集,實驗結果錶明,該算法完全滿足非結構化數據採集的要求。
재분석망락파충기술여ETL기술적기출상,탐토료기우망락파충기술여ETL기술상융합적산법,병장해산법응용우비궤연제신식채집,실험결과표명,해산법완전만족비결구화수거채집적요구。
This paper analyzes the principle of web crawler, discusses the Fusion Algorithm of web crawler and ETL. Extraction Transformation Loading, technology.The Algorithm is applied to Information Collection during airplane development.The experimental results show that the performance of the Fusion Algorithm has met the Unstructured Information Collection.