CAJ | 학술논문

采用分布式来实现SPARQL(Simple Protocol and RDF Query Language)查询是解决海量RDF(Resource Description Framework)查询的一种新思路.目前实现的基于Hadoop的RDF查询都要启用多个MapReduce来完成任务,浪费时间.为了克服此缺点,提出MRQJ (using MapReduce to query and join)算法,用以实现SPARQL的分布式查询.该算法分为连接计划生成与SPARQL查询执行两个部分:连接计划生成采用贪心策略,生成最优的连接方案;在SPARQL查询执行中只需结合一次MapReduce计算即可得到查询结果.在LUBM数据集上进行的测试实验表明:在查询语句较为复杂的情况下,MRQJ方法的查询效率具有明显的优势.
채용분포식래실현SPARQL(Simple Protocol and RDF Query Language)사순시해결해량RDF(Resource Description Framework)사순적일충신사로.목전실현적기우Hadoop적RDF사순도요계용다개MapReduce래완성임무,낭비시간.위료극복차결점,제출MRQJ (using MapReduce to query and join)산법,용이실현SPARQL적분포식사순.해산법분위련접계화생성여SPARQL사순집행량개부분:련접계화생성채용탐심책략,생성최우적련접방안;재SPARQL사순집행중지수결합일차MapReduce계산즉가득도사순결과.재LUBM수거집상진행적측시실험표명:재사순어구교위복잡적정황하,MRQJ방법적사순효솔구유명현적우세.