长春工程学院学报(自然科学版)
長春工程學院學報(自然科學版)
장춘공정학원학보(자연과학판)
JOURNAL OF CHANGCHUN INSTITUTE OF TECHNOLOGY(NATURAL SCIENCE EDITION)
2010年
1期
108-110
,共3页
HTML表格%本体%DOM树%启发式规则
HTML錶格%本體%DOM樹%啟髮式規則
HTML표격%본체%DOM수%계발식규칙
由于HTML只描述数据怎样显示而不描述数据的内容,因此识别HTML表格并抽取其数据是Web信息抽取领域中重要的研究课题之一,针对现在包装器技术的不足提出了一种新的基于领域本体的HTML表格结构识别技术,为构造HTML表格信息抽取系统打下基础.
由于HTML隻描述數據怎樣顯示而不描述數據的內容,因此識彆HTML錶格併抽取其數據是Web信息抽取領域中重要的研究課題之一,針對現在包裝器技術的不足提齣瞭一種新的基于領域本體的HTML錶格結構識彆技術,為構造HTML錶格信息抽取繫統打下基礎.
유우HTML지묘술수거즘양현시이불묘술수거적내용,인차식별HTML표격병추취기수거시Web신식추취영역중중요적연구과제지일,침대현재포장기기술적불족제출료일충신적기우영역본체적HTML표격결구식별기술,위구조HTML표격신식추취계통타하기출.