科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2014年
18期
81-88,93
,共9页
频繁结构%查询接口%属性布局%模式子树%查询接口树
頻繁結構%查詢接口%屬性佈跼%模式子樹%查詢接口樹
빈번결구%사순접구%속성포국%모식자수%사순접구수
frequent structure%query interface%attribute layout%pattern sub tree%query interface tree
随着网络规模的日益扩大,海量的信息被“深藏”于各类在线数据库中,用户只能通过查询接口才能获取其中的数据,这部分内容称之为Deep Web;因此对同一领域的Deep Web数据进行集成是非常必要的.查询接口的集成是其中一个非常关键的子问题.查询接口的集成分为模式匹配和模式集成两个步骤;重点研究集成查询接口中属性布局的确定.DeepWeb中查询接口数量巨大,以及动态性与异构性的特点给该问题带来了巨大的挑战.将查询接口的结构建模成一棵树,然后通过挖掘频繁的模式子树来构建集成的查询接口树,使其最大化地满足属性间的结构约束和顺序约束.该算法具有较低的时间复杂度,并具有很好的扩展性,对八个领域的查询接口进行集成的实验结果证明了算法的有效性.
隨著網絡規模的日益擴大,海量的信息被“深藏”于各類在線數據庫中,用戶隻能通過查詢接口纔能穫取其中的數據,這部分內容稱之為Deep Web;因此對同一領域的Deep Web數據進行集成是非常必要的.查詢接口的集成是其中一箇非常關鍵的子問題.查詢接口的集成分為模式匹配和模式集成兩箇步驟;重點研究集成查詢接口中屬性佈跼的確定.DeepWeb中查詢接口數量巨大,以及動態性與異構性的特點給該問題帶來瞭巨大的挑戰.將查詢接口的結構建模成一棵樹,然後通過挖掘頻繁的模式子樹來構建集成的查詢接口樹,使其最大化地滿足屬性間的結構約束和順序約束.該算法具有較低的時間複雜度,併具有很好的擴展性,對八箇領域的查詢接口進行集成的實驗結果證明瞭算法的有效性.
수착망락규모적일익확대,해량적신식피“심장”우각류재선수거고중,용호지능통과사순접구재능획취기중적수거,저부분내용칭지위Deep Web;인차대동일영역적Deep Web수거진행집성시비상필요적.사순접구적집성시기중일개비상관건적자문제.사순접구적집성분위모식필배화모식집성량개보취;중점연구집성사순접구중속성포국적학정.DeepWeb중사순접구수량거대,이급동태성여이구성적특점급해문제대래료거대적도전.장사순접구적결구건모성일과수,연후통과알굴빈번적모식자수래구건집성적사순접구수,사기최대화지만족속성간적결구약속화순서약속.해산법구유교저적시간복잡도,병구유흔호적확전성,대팔개영역적사순접구진행집성적실험결과증명료산법적유효성.