计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
7期
227-231
,共5页
RDF%Hadoop%SPARQL查询%MapReduce
RDF%Hadoop%SPARQL查詢%MapReduce
RDF%Hadoop%SPARQL사순%MapReduce
RDF%Hadoop%SPARQL query%MapReduce
采用分布式来实现SPARQL(Simple Protocol and RDF Query Language)查询是解决海量RDF(Resource Description Framework)查询的一种新思路.目前实现的基于Hadoop的RDF查询都要启用多个MapReduce来完成任务,浪费时间.为了克服此缺点,提出MRQJ (using MapReduce to query and join)算法,用以实现SPARQL的分布式查询.该算法分为连接计划生成与SPARQL查询执行两个部分:连接计划生成采用贪心策略,生成最优的连接方案;在SPARQL查询执行中只需结合一次MapReduce计算即可得到查询结果.在LUBM数据集上进行的测试实验表明:在查询语句较为复杂的情况下,MRQJ方法的查询效率具有明显的优势.
採用分佈式來實現SPARQL(Simple Protocol and RDF Query Language)查詢是解決海量RDF(Resource Description Framework)查詢的一種新思路.目前實現的基于Hadoop的RDF查詢都要啟用多箇MapReduce來完成任務,浪費時間.為瞭剋服此缺點,提齣MRQJ (using MapReduce to query and join)算法,用以實現SPARQL的分佈式查詢.該算法分為連接計劃生成與SPARQL查詢執行兩箇部分:連接計劃生成採用貪心策略,生成最優的連接方案;在SPARQL查詢執行中隻需結閤一次MapReduce計算即可得到查詢結果.在LUBM數據集上進行的測試實驗錶明:在查詢語句較為複雜的情況下,MRQJ方法的查詢效率具有明顯的優勢.
채용분포식래실현SPARQL(Simple Protocol and RDF Query Language)사순시해결해량RDF(Resource Description Framework)사순적일충신사로.목전실현적기우Hadoop적RDF사순도요계용다개MapReduce래완성임무,낭비시간.위료극복차결점,제출MRQJ (using MapReduce to query and join)산법,용이실현SPARQL적분포식사순.해산법분위련접계화생성여SPARQL사순집행량개부분:련접계화생성채용탐심책략,생성최우적련접방안;재SPARQL사순집행중지수결합일차MapReduce계산즉가득도사순결과.재LUBM수거집상진행적측시실험표명:재사순어구교위복잡적정황하,MRQJ방법적사순효솔구유명현적우세.