计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2015年
2期
456-474
,共19页
王元卓%贾岩涛%刘大伟%靳小龙%程学旗
王元卓%賈巖濤%劉大偉%靳小龍%程學旂
왕원탁%가암도%류대위%근소룡%정학기
网络大数据%开放网络知识%本体%信息检索%数据挖掘
網絡大數據%開放網絡知識%本體%信息檢索%數據挖掘
망락대수거%개방망락지식%본체%신식검색%수거알굴
network big data%open Web knowledge%ontology%information search%data mining
网络大数据是指“人、机、物”三元世界在网络空间(cyberspace)中交互、融合所产生并在互联网上可获得的大数据.这些数据具有多源异构、交互性、时效性、社会性、突发性和高噪声等特点,不但非结构化数据多,而且数据的实时性强.网络大数据背后蕴含着丰富的、复杂关联的知识.建立面向开放网络的知识库是获取网络大数据中的丰富知识的有效手段.对当前国内外主要的开放网络库进行了比较,分析了相应的构建方法、多源知识的融合以及知识库的更新等关键技术.进一步从用户意图理解、查询扩展、语义问答、线索挖据、关系推理以及关系和属性预测等方面出发,总结了基于开放网络知识库的信息检索、数据挖掘与系统应用的研究现状和主要问题.最后,对开放网络知识库的发展趋势和面临的主要挑战进行了展望.
網絡大數據是指“人、機、物”三元世界在網絡空間(cyberspace)中交互、融閤所產生併在互聯網上可穫得的大數據.這些數據具有多源異構、交互性、時效性、社會性、突髮性和高譟聲等特點,不但非結構化數據多,而且數據的實時性彊.網絡大數據揹後蘊含著豐富的、複雜關聯的知識.建立麵嚮開放網絡的知識庫是穫取網絡大數據中的豐富知識的有效手段.對噹前國內外主要的開放網絡庫進行瞭比較,分析瞭相應的構建方法、多源知識的融閤以及知識庫的更新等關鍵技術.進一步從用戶意圖理解、查詢擴展、語義問答、線索挖據、關繫推理以及關繫和屬性預測等方麵齣髮,總結瞭基于開放網絡知識庫的信息檢索、數據挖掘與繫統應用的研究現狀和主要問題.最後,對開放網絡知識庫的髮展趨勢和麵臨的主要挑戰進行瞭展望.
망락대수거시지“인、궤、물”삼원세계재망락공간(cyberspace)중교호、융합소산생병재호련망상가획득적대수거.저사수거구유다원이구、교호성、시효성、사회성、돌발성화고조성등특점,불단비결구화수거다,이차수거적실시성강.망락대수거배후온함착봉부적、복잡관련적지식.건립면향개방망락적지식고시획취망락대수거중적봉부지식적유효수단.대당전국내외주요적개방망락고진행료비교,분석료상응적구건방법、다원지식적융합이급지식고적경신등관건기술.진일보종용호의도리해、사순확전、어의문답、선색알거、관계추리이급관계화속성예측등방면출발,총결료기우개방망락지식고적신식검색、수거알굴여계통응용적연구현상화주요문제.최후,대개방망락지식고적발전추세화면림적주요도전진행료전망.