计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2014年
4期
1264-1268
,共5页
李伟男%李书琴%景旭%魏露%李新乐
李偉男%李書琴%景旭%魏露%李新樂
리위남%리서금%경욱%위로%리신악
Web信息抽取%隐马尔科夫模型%二阶隐马尔科夫模型%模拟退火算法%基于视觉的网页分割算法
Web信息抽取%隱馬爾科伕模型%二階隱馬爾科伕模型%模擬退火算法%基于視覺的網頁分割算法
Web신식추취%은마이과부모형%이계은마이과부모형%모의퇴화산법%기우시각적망혈분할산법
Web information extraction%hidden Markov model%second-order HMM%simulated annealing algorithm%vision-based page segmentation
针对传统隐马尔科夫模型对初值敏感和未考虑历史状态的问题,提出了使用模拟退火算法训练二阶隐马尔科夫模型参数的SA-HMM2.在基于SA-HMM2的Web信息抽取方法中,采用基于视觉的网页分割算法VIPS对网页分块得到状态转移序列,利用提出的SA-HMM2训练算法获取HMM2全局最优模型参数,用改进的Viterbi算法实现了Web信息的抽取.实验结果表明,该方法在平均综合值方面比HMM、GA-HMM分别提高约21%和7%.
針對傳統隱馬爾科伕模型對初值敏感和未攷慮歷史狀態的問題,提齣瞭使用模擬退火算法訓練二階隱馬爾科伕模型參數的SA-HMM2.在基于SA-HMM2的Web信息抽取方法中,採用基于視覺的網頁分割算法VIPS對網頁分塊得到狀態轉移序列,利用提齣的SA-HMM2訓練算法穫取HMM2全跼最優模型參數,用改進的Viterbi算法實現瞭Web信息的抽取.實驗結果錶明,該方法在平均綜閤值方麵比HMM、GA-HMM分彆提高約21%和7%.
침대전통은마이과부모형대초치민감화미고필역사상태적문제,제출료사용모의퇴화산법훈련이계은마이과부모형삼수적SA-HMM2.재기우SA-HMM2적Web신식추취방법중,채용기우시각적망혈분할산법VIPS대망혈분괴득도상태전이서렬,이용제출적SA-HMM2훈련산법획취HMM2전국최우모형삼수,용개진적Viterbi산법실현료Web신식적추취.실험결과표명,해방법재평균종합치방면비HMM、GA-HMM분별제고약21%화7%.