计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
10期
2241-2250
,共10页
贾存鑫%胡伟%柏文阳%瞿裕忠
賈存鑫%鬍偉%柏文暘%瞿裕忠
가존흠%호위%백문양%구유충
本体映射%模式匹配%关系数据库%虚拟文档%归纳逻辑编程
本體映射%模式匹配%關繫數據庫%虛擬文檔%歸納邏輯編程
본체영사%모식필배%관계수거고%허의문당%귀납라집편정
伴随语义网的发展,语义网本体数量激增.然而万维网上绝大多数的数据仍存储在关系数据库中,建立关系数据库模式与语义网本体间的映射是一种实现两者之间互操作性的有效途径.因此,提出了一种基于语义的关系数据库模式与OWL本体间的映射方法SMap,包含简单映射发现和复杂映射学习两个阶段.在简单映射发现阶段,首先通过逆向工程规则将关系数据库模式和本体中的元素对应地分为不同类别,再为每个元素构建虚拟文档并计算它们之间的相似度,其中针对不同类别的元素设计了不同的虚拟文档抽取方案.在复杂映射学习阶段,基于已发现的简单映射以及重叠的数据库记录和本体实例,自动化地生成训练事实数据,然后运用归纳逻辑编程算法学习出多种类型的基于Horn规则的复杂映射.真实数据集上的实验结果表明,SMap在简单映射发现和复杂映射学习上均明显优于现有的关系数据库模式与本体间映射方法.
伴隨語義網的髮展,語義網本體數量激增.然而萬維網上絕大多數的數據仍存儲在關繫數據庫中,建立關繫數據庫模式與語義網本體間的映射是一種實現兩者之間互操作性的有效途徑.因此,提齣瞭一種基于語義的關繫數據庫模式與OWL本體間的映射方法SMap,包含簡單映射髮現和複雜映射學習兩箇階段.在簡單映射髮現階段,首先通過逆嚮工程規則將關繫數據庫模式和本體中的元素對應地分為不同類彆,再為每箇元素構建虛擬文檔併計算它們之間的相似度,其中針對不同類彆的元素設計瞭不同的虛擬文檔抽取方案.在複雜映射學習階段,基于已髮現的簡單映射以及重疊的數據庫記錄和本體實例,自動化地生成訓練事實數據,然後運用歸納邏輯編程算法學習齣多種類型的基于Horn規則的複雜映射.真實數據集上的實驗結果錶明,SMap在簡單映射髮現和複雜映射學習上均明顯優于現有的關繫數據庫模式與本體間映射方法.
반수어의망적발전,어의망본체수량격증.연이만유망상절대다수적수거잉존저재관계수거고중,건립관계수거고모식여어의망본체간적영사시일충실현량자지간호조작성적유효도경.인차,제출료일충기우어의적관계수거고모식여OWL본체간적영사방법SMap,포함간단영사발현화복잡영사학습량개계단.재간단영사발현계단,수선통과역향공정규칙장관계수거고모식화본체중적원소대응지분위불동유별,재위매개원소구건허의문당병계산타문지간적상사도,기중침대불동유별적원소설계료불동적허의문당추취방안.재복잡영사학습계단,기우이발현적간단영사이급중첩적수거고기록화본체실례,자동화지생성훈련사실수거,연후운용귀납라집편정산법학습출다충류형적기우Horn규칙적복잡영사.진실수거집상적실험결과표명,SMap재간단영사발현화복잡영사학습상균명현우우현유적관계수거고모식여본체간영사방법.