计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
36期
169-172
,共4页
链接分析%页面评估%互联网%网页采集%链接识别%链接权重%网页权重分析%新闻网页
鏈接分析%頁麵評估%互聯網%網頁採集%鏈接識彆%鏈接權重%網頁權重分析%新聞網頁
련접분석%혈면평고%호련망%망혈채집%련접식별%련접권중%망혈권중분석%신문망혈
设计了一种采集分析互联网新闻网页的方法.该方法根据给定的新闻网站的入口地址在网络上找出所有的相关链接:区分这些链接所指向的页面特征,过滤掉相关性不大的内容,提取所有新闻网页的链接;进而进行多层次链接分析,根据新闻的图片、标题字体属性及日期,采用NewsPageRank算法计算每个新闻链接的权重.测试结果表明该方法对Internet上的新闻站点普遍具有较好的分析效果,性能可以满足实用要求.
設計瞭一種採集分析互聯網新聞網頁的方法.該方法根據給定的新聞網站的入口地阯在網絡上找齣所有的相關鏈接:區分這些鏈接所指嚮的頁麵特徵,過濾掉相關性不大的內容,提取所有新聞網頁的鏈接;進而進行多層次鏈接分析,根據新聞的圖片、標題字體屬性及日期,採用NewsPageRank算法計算每箇新聞鏈接的權重.測試結果錶明該方法對Internet上的新聞站點普遍具有較好的分析效果,性能可以滿足實用要求.
설계료일충채집분석호련망신문망혈적방법.해방법근거급정적신문망참적입구지지재망락상조출소유적상관련접:구분저사련접소지향적혈면특정,과려도상관성불대적내용,제취소유신문망혈적련접;진이진행다층차련접분석,근거신문적도편、표제자체속성급일기,채용NewsPageRank산법계산매개신문련접적권중.측시결과표명해방법대Internet상적신문참점보편구유교호적분석효과,성능가이만족실용요구.