计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2012年
23期
154-157
,共4页
Web页面%数据表%特征抽取%支持向量机%核函数
Web頁麵%數據錶%特徵抽取%支持嚮量機%覈函數
Web혈면%수거표%특정추취%지지향량궤%핵함수
为提高Web数据表识别的准确性,提出一种基于支持向量机与混合核函数的数据表识别方法.给出表格的结构特征、内容特征以及行(列)相似特征,将多项式核函数和线性核函数组成混合核函数,利用其进行Web数据表的自动识别.实验结果表明,该方法在7个站点上,准确率和召回率的平均值为95.14%和95.69%.
為提高Web數據錶識彆的準確性,提齣一種基于支持嚮量機與混閤覈函數的數據錶識彆方法.給齣錶格的結構特徵、內容特徵以及行(列)相似特徵,將多項式覈函數和線性覈函數組成混閤覈函數,利用其進行Web數據錶的自動識彆.實驗結果錶明,該方法在7箇站點上,準確率和召迴率的平均值為95.14%和95.69%.
위제고Web수거표식별적준학성,제출일충기우지지향량궤여혼합핵함수적수거표식별방법.급출표격적결구특정、내용특정이급행(렬)상사특정,장다항식핵함수화선성핵함수조성혼합핵함수,이용기진행Web수거표적자동식별.실험결과표명,해방법재7개참점상,준학솔화소회솔적평균치위95.14%화95.69%.