计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2013年
7期
14-16,42
,共4页
信息抽取%网页分块%本体%抽取规则%准确率
信息抽取%網頁分塊%本體%抽取規則%準確率
신식추취%망혈분괴%본체%추취규칙%준학솔
Information extraction%Webpage segmentation%Ontology%Extraction rules%Precision
针对Web信息抽取主要依据内容进行抽取的思想,通过对基于本体的Web信息抽取技术的分析,在对网页进行预处理的过程中引入网页分块思想.通过网页分块技术准确提取出所需信息的抽取区域,再根据本体抽取规则对得到的抽取区域进行处理,最终得到需要的信息.实验验证了改进的基于本体的Web信息抽取算法具有更高的准确率和召回率,具有良好的应用前景.
針對Web信息抽取主要依據內容進行抽取的思想,通過對基于本體的Web信息抽取技術的分析,在對網頁進行預處理的過程中引入網頁分塊思想.通過網頁分塊技術準確提取齣所需信息的抽取區域,再根據本體抽取規則對得到的抽取區域進行處理,最終得到需要的信息.實驗驗證瞭改進的基于本體的Web信息抽取算法具有更高的準確率和召迴率,具有良好的應用前景.
침대Web신식추취주요의거내용진행추취적사상,통과대기우본체적Web신식추취기술적분석,재대망혈진행예처리적과정중인입망혈분괴사상.통과망혈분괴기술준학제취출소수신식적추취구역,재근거본체추취규칙대득도적추취구역진행처리,최종득도수요적신식.실험험증료개진적기우본체적Web신식추취산법구유경고적준학솔화소회솔,구유량호적응용전경.