计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2010年
9期
1-4,9
,共5页
谭守标%徐超%江元%宁仁霞
譚守標%徐超%江元%寧仁霞
담수표%서초%강원%저인하
Web信息提取%知识表示%数据密集型Web页面%基于本体的关键词库
Web信息提取%知識錶示%數據密集型Web頁麵%基于本體的關鍵詞庫
Web신식제취%지식표시%수거밀집형Web혈면%기우본체적관건사고
研究了从数据密集型Web页面中自动提取结构化数据并形成知识表示系统的问题.基于知识数据库实现动态页面获取,进行预处理后转换为XML文档,采用基于PAT-array的模式发现算法自动发现重复模式,结合基于本体的关键词库自动识别页面数据显示结构模型,利用XML的对象-关系映射技术将数据存入知识数据库,由此实现Web数据自动抽取.同时,利用知识数据库已有知识从互联网抽取新知识,达到知识数据库的自扩展.以交通信息自动抽取及混合交通出行方案生成与表示系统进行的实验表明该系统具有高抽取准确率和良好的适应性.
研究瞭從數據密集型Web頁麵中自動提取結構化數據併形成知識錶示繫統的問題.基于知識數據庫實現動態頁麵穫取,進行預處理後轉換為XML文檔,採用基于PAT-array的模式髮現算法自動髮現重複模式,結閤基于本體的關鍵詞庫自動識彆頁麵數據顯示結構模型,利用XML的對象-關繫映射技術將數據存入知識數據庫,由此實現Web數據自動抽取.同時,利用知識數據庫已有知識從互聯網抽取新知識,達到知識數據庫的自擴展.以交通信息自動抽取及混閤交通齣行方案生成與錶示繫統進行的實驗錶明該繫統具有高抽取準確率和良好的適應性.
연구료종수거밀집형Web혈면중자동제취결구화수거병형성지식표시계통적문제.기우지식수거고실현동태혈면획취,진행예처리후전환위XML문당,채용기우PAT-array적모식발현산법자동발현중복모식,결합기우본체적관건사고자동식별혈면수거현시결구모형,이용XML적대상-관계영사기술장수거존입지식수거고,유차실현Web수거자동추취.동시,이용지식수거고이유지식종호련망추취신지식,체도지식수거고적자확전.이교통신식자동추취급혼합교통출행방안생성여표시계통진행적실험표명해계통구유고추취준학솔화량호적괄응성.