计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2006年
20期
43-44,77
,共3页
崔建群%何炎祥%郑世珏%吴黎兵
崔建群%何炎祥%鄭世玨%吳黎兵
최건군%하염상%정세각%오려병
Web数据挖掘%XML模型%关键技术
Web數據挖掘%XML模型%關鍵技術
Web수거알굴%XML모형%관건기술
由于存在着大量的在线信息,WWW成为数据挖掘的热点.该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTML Tide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨.
由于存在著大量的在線信息,WWW成為數據挖掘的熱點.該文介紹瞭Web網頁的數據挖掘技術,提齣一種基于XML的Web數據挖掘模型,闡述將半結構化HTML文檔轉換成良構的XML文檔的原因,併給齣基于HTML Tide庫的轉換代碼,介紹瞭利用XML技術從Web網頁析取數據的關鍵技術,包括XHTML、XSLT和XQuery等,對Web數據挖掘的其他方麵如數據檢驗和集成作瞭一定的探討.
유우존재착대량적재선신식,WWW성위수거알굴적열점.해문개소료Web망혈적수거알굴기술,제출일충기우XML적Web수거알굴모형,천술장반결구화HTML문당전환성량구적XML문당적원인,병급출기우HTML Tide고적전환대마,개소료이용XML기술종Web망혈석취수거적관건기술,포괄XHTML、XSLT화XQuery등,대Web수거알굴적기타방면여수거검험화집성작료일정적탐토.