计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2012年
9期
222-224
,共3页
XML%Web%信息挖掘%数据库
XML%Web%信息挖掘%數據庫
XML%Web%신식알굴%수거고
为了有效地从Web页面上提取数据信息,本文建立一种基于XML的Web信息收集数据库.利用开源工具JTidy将Web页面加以整理,利用XML良好的结构特性,使用Dom4j工具包解析XML文件;按照XML中的标签层次特点作为对数据进行储存的依据;最后使用Hibernate将数据持久化地储存于数据库中,方便数据的储存与查询.
為瞭有效地從Web頁麵上提取數據信息,本文建立一種基于XML的Web信息收集數據庫.利用開源工具JTidy將Web頁麵加以整理,利用XML良好的結構特性,使用Dom4j工具包解析XML文件;按照XML中的標籤層次特點作為對數據進行儲存的依據;最後使用Hibernate將數據持久化地儲存于數據庫中,方便數據的儲存與查詢.
위료유효지종Web혈면상제취수거신식,본문건립일충기우XML적Web신식수집수거고.이용개원공구JTidy장Web혈면가이정리,이용XML량호적결구특성,사용Dom4j공구포해석XML문건;안조XML중적표첨층차특점작위대수거진행저존적의거;최후사용Hibernate장수거지구화지저존우수거고중,방편수거적저존여사순.