情报杂志
情報雜誌
정보잡지
JOURNAL OF INFORMATION
2008年
6期
60-63
,共4页
钱建立%吴广茂%张薇%孙滔
錢建立%吳廣茂%張薇%孫滔
전건립%오엄무%장미%손도
开放阅读%搜索引擎%垂直蜘蛛%论文仓储
開放閱讀%搜索引擎%垂直蜘蛛%論文倉儲
개방열독%수색인경%수직지주%논문창저
描述了Paperopen项目中OA期刊论文蜘蛛的总体设计方案、蜘蛛调度机制、论文全文文件命名原则、数据库设计以及页面爬取和蜘蛛调度需要注意的问题,提出通过插件技术可解决一些杂志社网站存在的论文全文链接转向问题.Paperopen采用deep web技术能够获取隐藏在数据库后面的论文数据.采用该方案设计的蜘蛛工作正常,每天可爬取论文1万篇左右,大大提高执行效率.
描述瞭Paperopen項目中OA期刊論文蜘蛛的總體設計方案、蜘蛛調度機製、論文全文文件命名原則、數據庫設計以及頁麵爬取和蜘蛛調度需要註意的問題,提齣通過插件技術可解決一些雜誌社網站存在的論文全文鏈接轉嚮問題.Paperopen採用deep web技術能夠穫取隱藏在數據庫後麵的論文數據.採用該方案設計的蜘蛛工作正常,每天可爬取論文1萬篇左右,大大提高執行效率.
묘술료Paperopen항목중OA기간논문지주적총체설계방안、지주조도궤제、논문전문문건명명원칙、수거고설계이급혈면파취화지주조도수요주의적문제,제출통과삽건기술가해결일사잡지사망참존재적논문전문련접전향문제.Paperopen채용deep web기술능구획취은장재수거고후면적논문수거.채용해방안설계적지주공작정상,매천가파취논문1만편좌우,대대제고집행효솔.