北京信息科技大学学报(自然科学版)
北京信息科技大學學報(自然科學版)
북경신식과기대학학보(자연과학판)
JOURNAL OF BEIJING INSTITUTE OF MACHINERY
2011年
6期
86-89
,共4页
Web信息抽取%正则表达式%匹配%替换%提取
Web信息抽取%正則錶達式%匹配%替換%提取
Web신식추취%정칙표체식%필배%체환%제취
针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法.利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用.正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中.
針對基于HTML結構的信息抽取方法,提齣瞭正則錶達式的處理方法.利用正則錶達式的匹配、替換和提取等功能,重點討論瞭正則錶達式在Web信息抽取過程中的應用.正則錶達式已成功的應用在數據搜集、頁麵優化、規則學習和信息抽取等整箇Web信息抽取的過程中.
침대기우HTML결구적신식추취방법,제출료정칙표체식적처리방법.이용정칙표체식적필배、체환화제취등공능,중점토론료정칙표체식재Web신식추취과정중적응용.정칙표체식이성공적응용재수거수집、혈면우화、규칙학습화신식추취등정개Web신식추취적과정중.