计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
21期
166-170
,共5页
信息抽取%抽取规则%DOM%学习算法
信息抽取%抽取規則%DOM%學習算法
신식추취%추취규칙%DOM%학습산법
面对Web信息的迅猛增长,信息抽取技术非常适合于从大量的文档中抽取需要的事实数据.通过文档对象模型(DOM)解析以及检索、抽取、映射等规则的定义,设计并实现了一种具有规则归纳能力的信息抽取系统,用于Web信息的自动检索.在用于抽取规则归纳的框架下,还重点对用于生成抽取模式的WHISK学习算法进行了实验对比分析,结果表明系统对于单槽和多槽数据都具有不错的归纳学习能力.
麵對Web信息的迅猛增長,信息抽取技術非常適閤于從大量的文檔中抽取需要的事實數據.通過文檔對象模型(DOM)解析以及檢索、抽取、映射等規則的定義,設計併實現瞭一種具有規則歸納能力的信息抽取繫統,用于Web信息的自動檢索.在用于抽取規則歸納的框架下,還重點對用于生成抽取模式的WHISK學習算法進行瞭實驗對比分析,結果錶明繫統對于單槽和多槽數據都具有不錯的歸納學習能力.
면대Web신식적신맹증장,신식추취기술비상괄합우종대량적문당중추취수요적사실수거.통과문당대상모형(DOM)해석이급검색、추취、영사등규칙적정의,설계병실현료일충구유규칙귀납능력적신식추취계통,용우Web신식적자동검색.재용우추취규칙귀납적광가하,환중점대용우생성추취모식적WHISK학습산법진행료실험대비분석,결과표명계통대우단조화다조수거도구유불착적귀납학습능력.