华北水利水电学院学报
華北水利水電學院學報
화북수이수전학원학보
JOURNAL OF NORTH CHINA INSTITUTE OF WATER CONSERVANCY AND HYDROELECTRIC POWER
2011年
3期
108-110
,共3页
表格信息%Html文档%DOM树%二叉树
錶格信息%Html文檔%DOM樹%二扠樹
표격신식%Html문당%DOM수%이차수
针对目前国内外多种信息抽取方法中存在不同程度的局限性,提出一种基于DOM树和二叉树结构的Web表格信息抽取方法.该方法提供了以Web表格为信息抽取对象的、支持抽取方式选择的Web表格信息抽取工具.该工具将Html文档解析成DOM树,再将DOM树构建成一棵含有文本信息的二叉树,最后通过遍历二叉树实现对Web表格信息的抽取.
針對目前國內外多種信息抽取方法中存在不同程度的跼限性,提齣一種基于DOM樹和二扠樹結構的Web錶格信息抽取方法.該方法提供瞭以Web錶格為信息抽取對象的、支持抽取方式選擇的Web錶格信息抽取工具.該工具將Html文檔解析成DOM樹,再將DOM樹構建成一棵含有文本信息的二扠樹,最後通過遍歷二扠樹實現對Web錶格信息的抽取.
침대목전국내외다충신식추취방법중존재불동정도적국한성,제출일충기우DOM수화이차수결구적Web표격신식추취방법.해방법제공료이Web표격위신식추취대상적、지지추취방식선택적Web표격신식추취공구.해공구장Html문당해석성DOM수,재장DOM수구건성일과함유문본신식적이차수,최후통과편력이차수실현대Web표격신식적추취.