计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
5期
208-212
,共5页
标签抽取%位置特征%表单布局%元素-标签匹配
標籤抽取%位置特徵%錶單佈跼%元素-標籤匹配
표첨추취%위치특정%표단포국%원소-표첨필배
标签抽取和匹配是查询接口理解的重要组成部分.提出了一种基于视觉的标签抽取和匹配方法,深入分析了相关匹配因子,给出了一种对查询接口表单进行重构的方法,它能依据接口HTML源代码自动还原出该表单的视觉布局特征.在最终的匹配算法中,综合考虑了基于label标记的匹配、基于文本语义的匹配以及基于位置特征的匹配.在8个领域共计277个查询接口上的实验证明了所提方法能取得较高的匹配精度.
標籤抽取和匹配是查詢接口理解的重要組成部分.提齣瞭一種基于視覺的標籤抽取和匹配方法,深入分析瞭相關匹配因子,給齣瞭一種對查詢接口錶單進行重構的方法,它能依據接口HTML源代碼自動還原齣該錶單的視覺佈跼特徵.在最終的匹配算法中,綜閤攷慮瞭基于label標記的匹配、基于文本語義的匹配以及基于位置特徵的匹配.在8箇領域共計277箇查詢接口上的實驗證明瞭所提方法能取得較高的匹配精度.
표첨추취화필배시사순접구리해적중요조성부분.제출료일충기우시각적표첨추취화필배방법,심입분석료상관필배인자,급출료일충대사순접구표단진행중구적방법,타능의거접구HTML원대마자동환원출해표단적시각포국특정.재최종적필배산법중,종합고필료기우label표기적필배、기우문본어의적필배이급기우위치특정적필배.재8개영역공계277개사순접구상적실험증명료소제방법능취득교고적필배정도.