河北软件职业技术学院学报
河北軟件職業技術學院學報
하북연건직업기술학원학보
JOURNAL OF HEBEI SOFTWARE INSTITUTE
2014年
2期
44-47
,共4页
AJAX爬行%文档对象模型%广度优先%算法
AJAX爬行%文檔對象模型%廣度優先%算法
AJAX파행%문당대상모형%엄도우선%산법
Ajax crawling%Document object model%Bread-th-first%Algorithm
许多WEB应用程序采用AJAX技术来增强用户体验。但是AJAX的一些特性使它在传统搜索引擎实施抓取操作时非常困难。如谷歌的AJAX爬行方案需要网站改变架构并添加额外的代码,因此只被谷歌支持。针对这种情况,提出了一种基于文档对象模型和广度优先爬行算法的A-JAX爬行方案,它可以通过跟踪由AJAX事件引发的DOM树的变化,来建立AJAX WEB应用程序的状态转换图,进而生成原始AJAX WEB应用程序的静态镜像站点。实验证明,该AJAX爬行方案确实可以爬行AJAX应用程序。
許多WEB應用程序採用AJAX技術來增彊用戶體驗。但是AJAX的一些特性使它在傳統搜索引擎實施抓取操作時非常睏難。如穀歌的AJAX爬行方案需要網站改變架構併添加額外的代碼,因此隻被穀歌支持。針對這種情況,提齣瞭一種基于文檔對象模型和廣度優先爬行算法的A-JAX爬行方案,它可以通過跟蹤由AJAX事件引髮的DOM樹的變化,來建立AJAX WEB應用程序的狀態轉換圖,進而生成原始AJAX WEB應用程序的靜態鏡像站點。實驗證明,該AJAX爬行方案確實可以爬行AJAX應用程序。
허다WEB응용정서채용AJAX기술래증강용호체험。단시AJAX적일사특성사타재전통수색인경실시조취조작시비상곤난。여곡가적AJAX파행방안수요망참개변가구병첨가액외적대마,인차지피곡가지지。침대저충정황,제출료일충기우문당대상모형화엄도우선파행산법적A-JAX파행방안,타가이통과근종유AJAX사건인발적DOM수적변화,래건립AJAX WEB응용정서적상태전환도,진이생성원시AJAX WEB응용정서적정태경상참점。실험증명,해AJAX파행방안학실가이파행AJAX응용정서。
Many web applications employ AJAX to enhance their user experience. But many properties of AJAX can make traditional search engines crawl web applications hardly. Google’s AJAX crawling scheme was currently sup-ported only by Google, because it suggests webmasters change their website architectures and add additional code. In view of this, the paper presented an AJAX crawling scheme based on document object model and breadth-first crawling algorithm. It can establish a state transition graph of an A-JAX web application, through tracking the changes of the DOM tree. Then it builds a static mirror site of the original AJAX web application. Experimental results show that the AJAX crawling scheme can really crawl Ajax application.