四川理工学院学报(自然科学版)
四川理工學院學報(自然科學版)
사천리공학원학보(자연과학판)
JOURNAL OF SICHUAN UNIVERSITY OF SCIENCE & ENGINEERING(NATURAL SCIENCE EDITION)
2013年
3期
64-67
,共4页
WEB挖掘%XML%Tidy%DOM树
WEB挖掘%XML%Tidy%DOM樹
WEB알굴%XML%Tidy%DOM수
面对飞速发展的信息时代,WEB数据的挖掘日益重要,而传统的搜索引擎难以胜任对数据的挖掘处理.基于XML良好的结构性和层次性,提出了利用DOM树进行WEB挖掘的方法.首先利用Tidy工具库将WEB数据转换成良好结构的XML文件,简化生成DOM树,然后通过遍历解析XML的DOM树结构,提取需要的WEB信息,实现对WEB数据挖掘.实验表明,该方法能够方便地对数据进行结构化存储和信息处理.
麵對飛速髮展的信息時代,WEB數據的挖掘日益重要,而傳統的搜索引擎難以勝任對數據的挖掘處理.基于XML良好的結構性和層次性,提齣瞭利用DOM樹進行WEB挖掘的方法.首先利用Tidy工具庫將WEB數據轉換成良好結構的XML文件,簡化生成DOM樹,然後通過遍歷解析XML的DOM樹結構,提取需要的WEB信息,實現對WEB數據挖掘.實驗錶明,該方法能夠方便地對數據進行結構化存儲和信息處理.
면대비속발전적신식시대,WEB수거적알굴일익중요,이전통적수색인경난이성임대수거적알굴처리.기우XML량호적결구성화층차성,제출료이용DOM수진행WEB알굴적방법.수선이용Tidy공구고장WEB수거전환성량호결구적XML문건,간화생성DOM수,연후통과편력해석XML적DOM수결구,제취수요적WEB신식,실현대WEB수거알굴.실험표명,해방법능구방편지대수거진행결구화존저화신식처리.