计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
10期
2131-2141
,共11页
袁平鹏%刘谱%张文娅%吴步文
袁平鵬%劉譜%張文婭%吳步文
원평붕%류보%장문아%오보문
资源描述框架%语义数据存储%数据编码%查询处理%查询计划
資源描述框架%語義數據存儲%數據編碼%查詢處理%查詢計劃
자원묘술광가%어의수거존저%수거편마%사순처리%사순계화
由于资源描述框架(resource description framework,RDF)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范.近年来,其数据量在以飞快的速度增长.相应地,要求存储RDF数据的系统应具有高扩展性.介绍了一个高可扩展的RDF数据存储系统TripleBit.为尽可能降低存储空间消耗,采用了增量压缩和变长整数编码方法.并采用了数据分块的存储方法,既使得存储管理方便又使得存储结构紧凑,加速了数据读取,系统提供了基于启发式规则的动态查询计划生成方法,所产生的查询计划在执行过程中根据中间结果会相应作调整,以保持最优的执行顺序.对于多变量的查询,使用二步执行策略以减少查询过程中产生的中间结果.与目前流行RDF数据存储系统相比较,在存储空间上RDF-3X比TripleBit至少多40%;在查询性能上,比RDF-3X和MonetDB获得数倍的提升.
由于資源描述框架(resource description framework,RDF)具有錶達靈活、簡潔等優點,已被接受為錶達元數據及萬維網上數據互聯的規範.近年來,其數據量在以飛快的速度增長.相應地,要求存儲RDF數據的繫統應具有高擴展性.介紹瞭一箇高可擴展的RDF數據存儲繫統TripleBit.為儘可能降低存儲空間消耗,採用瞭增量壓縮和變長整數編碼方法.併採用瞭數據分塊的存儲方法,既使得存儲管理方便又使得存儲結構緊湊,加速瞭數據讀取,繫統提供瞭基于啟髮式規則的動態查詢計劃生成方法,所產生的查詢計劃在執行過程中根據中間結果會相應作調整,以保持最優的執行順序.對于多變量的查詢,使用二步執行策略以減少查詢過程中產生的中間結果.與目前流行RDF數據存儲繫統相比較,在存儲空間上RDF-3X比TripleBit至少多40%;在查詢性能上,比RDF-3X和MonetDB穫得數倍的提升.
유우자원묘술광가(resource description framework,RDF)구유표체령활、간길등우점,이피접수위표체원수거급만유망상수거호련적규범.근년래,기수거량재이비쾌적속도증장.상응지,요구존저RDF수거적계통응구유고확전성.개소료일개고가확전적RDF수거존저계통TripleBit.위진가능강저존저공간소모,채용료증량압축화변장정수편마방법.병채용료수거분괴적존저방법,기사득존저관리방편우사득존저결구긴주,가속료수거독취,계통제공료기우계발식규칙적동태사순계화생성방법,소산생적사순계화재집행과정중근거중간결과회상응작조정,이보지최우적집행순서.대우다변량적사순,사용이보집행책략이감소사순과정중산생적중간결과.여목전류행RDF수거존저계통상비교,재존저공간상RDF-3X비TripleBit지소다40%;재사순성능상,비RDF-3X화MonetDB획득수배적제승.