计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2012年
2期
48-50
,共3页
深层网%重复结构%相似URL%语义块%数据区域
深層網%重複結構%相似URL%語義塊%數據區域
심층망%중복결구%상사URL%어의괴%수거구역
针对深层网查询结果页面中噪音信息对数据区域识别的干扰问题,提出一种自动识别深层网查询结果数据区域的方法.该方法利用网页的重复结构和相似URL,将页面划分成不同的语义块,依据不同页面块之间URL的相似性识别出数据区域.实验结果表明,该方法能够提高数据区域识别的召回率和准确率.
針對深層網查詢結果頁麵中譟音信息對數據區域識彆的榦擾問題,提齣一種自動識彆深層網查詢結果數據區域的方法.該方法利用網頁的重複結構和相似URL,將頁麵劃分成不同的語義塊,依據不同頁麵塊之間URL的相似性識彆齣數據區域.實驗結果錶明,該方法能夠提高數據區域識彆的召迴率和準確率.
침대심층망사순결과혈면중조음신식대수거구역식별적간우문제,제출일충자동식별심층망사순결과수거구역적방법.해방법이용망혈적중복결구화상사URL,장혈면화분성불동적어의괴,의거불동혈면괴지간URL적상사성식별출수거구역.실험결과표명,해방법능구제고수거구역식별적소회솔화준학솔.