计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2008年
20期
55-57
,共3页
Web信息抽取%模板流程配置%包装器%框架
Web信息抽取%模闆流程配置%包裝器%框架
Web신식추취%모판류정배치%포장기%광가
针对Web信息抽取中存在的包装器构造复杂及抽取精度等问题,提出并实现了一种基于模板流程配置的Web信息抽取框架.将用户请求、访问和获取Web页面的动作进行分解,抽取其中的动作模式,并映射到流程配置模板中的节点.通过流程解析器对用户创建的流程配置XML描述文档进行解析,抽取感兴趣的信息.试验结果表明,系统可快速、准确地实现抽取.
針對Web信息抽取中存在的包裝器構造複雜及抽取精度等問題,提齣併實現瞭一種基于模闆流程配置的Web信息抽取框架.將用戶請求、訪問和穫取Web頁麵的動作進行分解,抽取其中的動作模式,併映射到流程配置模闆中的節點.通過流程解析器對用戶創建的流程配置XML描述文檔進行解析,抽取感興趣的信息.試驗結果錶明,繫統可快速、準確地實現抽取.
침대Web신식추취중존재적포장기구조복잡급추취정도등문제,제출병실현료일충기우모판류정배치적Web신식추취광가.장용호청구、방문화획취Web혈면적동작진행분해,추취기중적동작모식,병영사도류정배치모판중적절점.통과류정해석기대용호창건적류정배치XML묘술문당진행해석,추취감흥취적신식.시험결과표명,계통가쾌속、준학지실현추취.