现代计算机(专业版)
現代計算機(專業版)
현대계산궤(전업판)
MODERN COMPUTER
2008年
2期
54-55,64
,共3页
网页清洗%信息滤除%正则表达式
網頁清洗%信息濾除%正則錶達式
망혈청세%신식려제%정칙표체식
摈弃了传统网页清洗算法实现繁琐、效率低下、准确丰差等种种弊端,分析了当前网页的代码结构,提出了基于正则表达式的信息筛选、滤除算法,并在Visual Studio.NET 2003环境下结合Kegex类、MatchCollection类、Match类,用C#语言实现了该算法.
擯棄瞭傳統網頁清洗算法實現繁瑣、效率低下、準確豐差等種種弊耑,分析瞭噹前網頁的代碼結構,提齣瞭基于正則錶達式的信息篩選、濾除算法,併在Visual Studio.NET 2003環境下結閤Kegex類、MatchCollection類、Match類,用C#語言實現瞭該算法.
빈기료전통망혈청세산법실현번쇄、효솔저하、준학봉차등충충폐단,분석료당전망혈적대마결구,제출료기우정칙표체식적신식사선、려제산법,병재Visual Studio.NET 2003배경하결합Kegex류、MatchCollection류、Match류,용C#어언실현료해산법.