计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2014年
1期
61-72
,共12页
王红滨%周连科%王念滨%邓胜春
王紅濱%週連科%王唸濱%鄧勝春
왕홍빈%주련과%왕념빈%산성춘
数据空间%索引%iMeMex数据模型%倒排列表
數據空間%索引%iMeMex數據模型%倒排列錶
수거공간%색인%iMeMex수거모형%도배렬표
data space%index%iMeMex data model%inverted list
目前,个人和组织的信息呈现急剧增长趋势,且非结构化数据所占比重在不断增加,这些属于某个主体的海量、分布、异构和共存的数据构成了一个异构数据空间,如何为用户提供高效、便捷和多样化的搜索查询服务是数据空间面临的巨大挑战,为数据空间中异构数据构建高效的索引方法是解决这一问题的基础。对iMeMex数据模型的特点和数据空间中查询方法进行了分析,在此基础上通过扩展倒排列表方法,提出了一种基于iMeMex数据模型的索引方法,来提高对数据空间中异构数据的搜索查询效率。新的索引方法通过扩展倒排列表的关键字列和链表节点信息索引资源视图,来支持和提高关键字查询、谓词查询和路径查询的处理效率。实验结果表明,该索引方法能够有效、可行地解决数据空间中异构数据索引和查询效率问题。
目前,箇人和組織的信息呈現急劇增長趨勢,且非結構化數據所佔比重在不斷增加,這些屬于某箇主體的海量、分佈、異構和共存的數據構成瞭一箇異構數據空間,如何為用戶提供高效、便捷和多樣化的搜索查詢服務是數據空間麵臨的巨大挑戰,為數據空間中異構數據構建高效的索引方法是解決這一問題的基礎。對iMeMex數據模型的特點和數據空間中查詢方法進行瞭分析,在此基礎上通過擴展倒排列錶方法,提齣瞭一種基于iMeMex數據模型的索引方法,來提高對數據空間中異構數據的搜索查詢效率。新的索引方法通過擴展倒排列錶的關鍵字列和鏈錶節點信息索引資源視圖,來支持和提高關鍵字查詢、謂詞查詢和路徑查詢的處理效率。實驗結果錶明,該索引方法能夠有效、可行地解決數據空間中異構數據索引和查詢效率問題。
목전,개인화조직적신식정현급극증장추세,차비결구화수거소점비중재불단증가,저사속우모개주체적해량、분포、이구화공존적수거구성료일개이구수거공간,여하위용호제공고효、편첩화다양화적수색사순복무시수거공간면림적거대도전,위수거공간중이구수거구건고효적색인방법시해결저일문제적기출。대iMeMex수거모형적특점화수거공간중사순방법진행료분석,재차기출상통과확전도배렬표방법,제출료일충기우iMeMex수거모형적색인방법,래제고대수거공간중이구수거적수색사순효솔。신적색인방법통과확전도배렬표적관건자렬화련표절점신식색인자원시도,래지지화제고관건자사순、위사사순화로경사순적처리효솔。실험결과표명,해색인방법능구유효、가행지해결수거공간중이구수거색인화사순효솔문제。
Nowadays, the information of person and organization is still rising rapidly and the percentage of non-structured data increases constantly. Data space consists of vast amounts of data which have characteristics, such as mass, distributivity, heterogeneity and autonomy etc, it is faced with huge challenge for users to obtain the interested information efficiently and quickly. Building an effective index method for the heterogeneous data in the data space is the foundation for addressing this challenge. Through analyzing the characteristics of iMeMex data model and query method of data space, this paper proposes an index method based on iMeMex data model to improve the query efficiency of the heterogeneous data in the data space, which extends the inverted list method. This novel index method supports and improves the keywords query, the predicates query and the path query by extending the key-words column and linked list node index resource view of the inverted list. The experimental results demonstrate the feasibility and effectiveness of the proposed method.