重庆理工大学学报(自然科学版)
重慶理工大學學報(自然科學版)
중경리공대학학보(자연과학판)
JOURNAL OF CHONGQING INSTITUTE OF TECHNOLOGY
2011年
1期
54-58
,共5页
何友全%徐澄%徐小乐%唐华姣
何友全%徐澄%徐小樂%唐華姣
하우전%서징%서소악%당화교
DOM%统计学特征%信息检索
DOM%統計學特徵%信息檢索
DOM%통계학특정%신식검색
针对特定的网站或网页中抽取出用户感兴趣的信息这一问题,分析现有去噪技术的优缺点,提出了一种基于统计学特征和DOM树的Web页面去噪方法.该方法首先对原始网页进行预处理,然后分析网页的统计学特征,结合启发式的抽取规则,对网页进行去噪.实验证实该方法在较少人为干预的基础上能达到较好的抽取效果.
針對特定的網站或網頁中抽取齣用戶感興趣的信息這一問題,分析現有去譟技術的優缺點,提齣瞭一種基于統計學特徵和DOM樹的Web頁麵去譟方法.該方法首先對原始網頁進行預處理,然後分析網頁的統計學特徵,結閤啟髮式的抽取規則,對網頁進行去譟.實驗證實該方法在較少人為榦預的基礎上能達到較好的抽取效果.
침대특정적망참혹망혈중추취출용호감흥취적신식저일문제,분석현유거조기술적우결점,제출료일충기우통계학특정화DOM수적Web혈면거조방법.해방법수선대원시망혈진행예처리,연후분석망혈적통계학특정,결합계발식적추취규칙,대망혈진행거조.실험증실해방법재교소인위간예적기출상능체도교호적추취효과.