计算机光盘软件与应用
計算機光盤軟件與應用
계산궤광반연건여응용
COMPUTER CD SOFTWARE ADN APPLICATIONS
2012年
18期
187-188
,共2页
网页信息%提取%设计
網頁信息%提取%設計
망혈신식%제취%설계
网页信息自动提取是一种重要的网络应用技术,用于提取各类网页的专门信息.网页信息自动提取的设计基于网页的半结构化特征,其流程是先获取HTML源文件,然后去掉HTML标记和无关信息,再进行语义匹配,提取信息到特定的数据结构,进行CSV格式化输出,就可以得到所需的信息.在网站企业化、网店普遍化和网络购物盛行的背景下,推广和应用网页信息自动提取技术,有着重要的经济价值和意义.
網頁信息自動提取是一種重要的網絡應用技術,用于提取各類網頁的專門信息.網頁信息自動提取的設計基于網頁的半結構化特徵,其流程是先穫取HTML源文件,然後去掉HTML標記和無關信息,再進行語義匹配,提取信息到特定的數據結構,進行CSV格式化輸齣,就可以得到所需的信息.在網站企業化、網店普遍化和網絡購物盛行的揹景下,推廣和應用網頁信息自動提取技術,有著重要的經濟價值和意義.
망혈신식자동제취시일충중요적망락응용기술,용우제취각류망혈적전문신식.망혈신식자동제취적설계기우망혈적반결구화특정,기류정시선획취HTML원문건,연후거도HTML표기화무관신식,재진행어의필배,제취신식도특정적수거결구,진행CSV격식화수출,취가이득도소수적신식.재망참기업화、망점보편화화망락구물성행적배경하,추엄화응용망혈신식자동제취기술,유착중요적경제개치화의의.