武汉大学学报(工学版)
武漢大學學報(工學版)
무한대학학보(공학판)
ENGINEERING JOURNAL OF WUHAN UNIVERSITY
2005年
6期
128-132
,共5页
李石君%欧伟杰%简伟%黄河
李石君%歐偉傑%簡偉%黃河
리석군%구위걸%간위%황하
信息提取%上下文规则集%有限状态自动机
信息提取%上下文規則集%有限狀態自動機
신식제취%상하문규칙집%유한상태자동궤
大量的不规范表结构信息是当前Web信息提取所必须解决的问题.在现有方法基础上,给出了归纳学习相邻属性间上下文规则集算法,提出了以Web页为粒度的属性转换机和有限状态自动机包装器概念,最后介绍了采用有限状态自动机包装器提取不规范表结构Web信息的算法.
大量的不規範錶結構信息是噹前Web信息提取所必鬚解決的問題.在現有方法基礎上,給齣瞭歸納學習相鄰屬性間上下文規則集算法,提齣瞭以Web頁為粒度的屬性轉換機和有限狀態自動機包裝器概唸,最後介紹瞭採用有限狀態自動機包裝器提取不規範錶結構Web信息的算法.
대량적불규범표결구신식시당전Web신식제취소필수해결적문제.재현유방법기출상,급출료귀납학습상린속성간상하문규칙집산법,제출료이Web혈위립도적속성전환궤화유한상태자동궤포장기개념,최후개소료채용유한상태자동궤포장기제취불규범표결구Web신식적산법.