计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
2期
361-371
,共11页
董永权%李庆忠%丁艳辉%彭朝晖
董永權%李慶忠%丁豔輝%彭朝暉
동영권%리경충%정염휘%팽조휘
语义标注%Web信息抽取%条件随机场%整数线性规划%Web数据集成
語義標註%Web信息抽取%條件隨機場%整數線性規劃%Web數據集成
어의표주%Web신식추취%조건수궤장%정수선성규화%Web수거집성
Web数据语义标注是Web信息抽取中的关键步骤.条件随机场是利用序列特征处理序列标注问题的经典方法.然而现有条件随机场模型无法综合利用已有的Web数据库信息和Web数据元素之间的逻辑关系,导致Web数据语义标注准确率不高.因此,提出一种约束条件随机场模型(CCRF).该模型通过引入可信约束和逻辑约束,有效利用了已有的Web数据库信息和Web数据元素之间的逻辑关系.为了克服现有条件随机场模型Viterbi推理方法无法综合利用这2类约束的不足,该模型采用整数线性规划推理方法,将两类约束同时引入推理过程.通过在多个领域的真实数据集上的实验结果表明,所提出的模型能够显著提高Web数据语义标注的性能,并且为Web信息抽取奠定了良好的基础.
Web數據語義標註是Web信息抽取中的關鍵步驟.條件隨機場是利用序列特徵處理序列標註問題的經典方法.然而現有條件隨機場模型無法綜閤利用已有的Web數據庫信息和Web數據元素之間的邏輯關繫,導緻Web數據語義標註準確率不高.因此,提齣一種約束條件隨機場模型(CCRF).該模型通過引入可信約束和邏輯約束,有效利用瞭已有的Web數據庫信息和Web數據元素之間的邏輯關繫.為瞭剋服現有條件隨機場模型Viterbi推理方法無法綜閤利用這2類約束的不足,該模型採用整數線性規劃推理方法,將兩類約束同時引入推理過程.通過在多箇領域的真實數據集上的實驗結果錶明,所提齣的模型能夠顯著提高Web數據語義標註的性能,併且為Web信息抽取奠定瞭良好的基礎.
Web수거어의표주시Web신식추취중적관건보취.조건수궤장시이용서렬특정처리서렬표주문제적경전방법.연이현유조건수궤장모형무법종합이용이유적Web수거고신식화Web수거원소지간적라집관계,도치Web수거어의표주준학솔불고.인차,제출일충약속조건수궤장모형(CCRF).해모형통과인입가신약속화라집약속,유효이용료이유적Web수거고신식화Web수거원소지간적라집관계.위료극복현유조건수궤장모형Viterbi추리방법무법종합이용저2류약속적불족,해모형채용정수선성규화추리방법,장량류약속동시인입추리과정.통과재다개영역적진실수거집상적실험결과표명,소제출적모형능구현저제고Web수거어의표주적성능,병차위Web신식추취전정료량호적기출.