电脑开发与应用
電腦開髮與應用
전뇌개발여응용
COMPUTER DEVELOPMENT & APPLICATIONS
2010年
6期
71-73
,共3页
Web有效信息%信息抽取%网页分类
Web有效信息%信息抽取%網頁分類
Web유효신식%신식추취%망혈분류
随着Internet的迅猛发展,Web上的网页数目呈现指数级的爆炸性增长趋势,在Web上检索及发现有价值的信息已成为了一项重要的任务,"噪音"的出现往往会降低基于页面处理的各种算法的效率.因此,如何删除页面的噪音,提取页面中的主要内容是Web挖掘中的重要问题.给出了抽取网页中各种分类有效的文本的具体实现.
隨著Internet的迅猛髮展,Web上的網頁數目呈現指數級的爆炸性增長趨勢,在Web上檢索及髮現有價值的信息已成為瞭一項重要的任務,"譟音"的齣現往往會降低基于頁麵處理的各種算法的效率.因此,如何刪除頁麵的譟音,提取頁麵中的主要內容是Web挖掘中的重要問題.給齣瞭抽取網頁中各種分類有效的文本的具體實現.
수착Internet적신맹발전,Web상적망혈수목정현지수급적폭작성증장추세,재Web상검색급발현유개치적신식이성위료일항중요적임무,"조음"적출현왕왕회강저기우혈면처리적각충산법적효솔.인차,여하산제혈면적조음,제취혈면중적주요내용시Web알굴중적중요문제.급출료추취망혈중각충분류유효적문본적구체실현.