科技通报
科技通報
과기통보
BULLETIN OF SCIENCE AND TECHNOLOGY
2012年
8期
168-170
,共3页
条件随机场%隐条件随机场%Web数据抽取%判别式模型
條件隨機場%隱條件隨機場%Web數據抽取%判彆式模型
조건수궤장%은조건수궤장%Web수거추취%판별식모형
提出了一种基于改进的隐条件随机场的异构Web数据源数据抽取算法.通过对隐条件随机场进行的改进,对隐含变量进行更为准确的计算,并且克服了该模型的性能严重依赖于初始参数选择的问题,而且进行模型训练时不需要大量的人工标注的样本数据.实验结果表明,对比已有方法,本文算法在对具有缺省属性以及多属性特征的网站进行数据抽取时,在查全率,查准率以及F1值上都获得了令人满意的性能.
提齣瞭一種基于改進的隱條件隨機場的異構Web數據源數據抽取算法.通過對隱條件隨機場進行的改進,對隱含變量進行更為準確的計算,併且剋服瞭該模型的性能嚴重依賴于初始參數選擇的問題,而且進行模型訓練時不需要大量的人工標註的樣本數據.實驗結果錶明,對比已有方法,本文算法在對具有缺省屬性以及多屬性特徵的網站進行數據抽取時,在查全率,查準率以及F1值上都穫得瞭令人滿意的性能.
제출료일충기우개진적은조건수궤장적이구Web수거원수거추취산법.통과대은조건수궤장진행적개진,대은함변량진행경위준학적계산,병차극복료해모형적성능엄중의뢰우초시삼수선택적문제,이차진행모형훈련시불수요대량적인공표주적양본수거.실험결과표명,대비이유방법,본문산법재대구유결성속성이급다속성특정적망참진행수거추취시,재사전솔,사준솔이급F1치상도획득료령인만의적성능.