信息技术与信息化
信息技術與信息化
신식기술여신식화
INFORMATION TECHNOLOGY & INFORMATIZATION
2015年
3期
100-102
,共3页
DOM树%HTML信息抽取%CSS选择器
DOM樹%HTML信息抽取%CSS選擇器
DOM수%HTML신식추취%CSS선택기
基于网页结构特征的信息抽取是现阶段最为常用的抽取手段.为了将待抽取的信息从DOM树中准确地抽取出来,需要对欲抽取的信息进行准确地定位.本文提出了一种新的定位方法,在HTML DOM树的基础上,借助于CSS选择器,抽取所需要的信息.
基于網頁結構特徵的信息抽取是現階段最為常用的抽取手段.為瞭將待抽取的信息從DOM樹中準確地抽取齣來,需要對欲抽取的信息進行準確地定位.本文提齣瞭一種新的定位方法,在HTML DOM樹的基礎上,藉助于CSS選擇器,抽取所需要的信息.
기우망혈결구특정적신식추취시현계단최위상용적추취수단.위료장대추취적신식종DOM수중준학지추취출래,수요대욕추취적신식진행준학지정위.본문제출료일충신적정위방법,재HTML DOM수적기출상,차조우CSS선택기,추취소수요적신식.