南京邮电大学学报(自然科学版)
南京郵電大學學報(自然科學版)
남경유전대학학보(자연과학판)
Journal of Nanjing University of Posts and Telecommunications(Natural Science)
2015年
4期
1-14
,共14页
数据挖掘%文献计量学%知识分析%关键词聚类
數據挖掘%文獻計量學%知識分析%關鍵詞聚類
수거알굴%문헌계량학%지식분석%관건사취류
data mining%bibliometrics%knowledge analysis%keyword clustering
云计算技术目前已经成为研究热点,并有大量的研究成果以科技文献的方式面世.为能使云计算领域的科研人员理清知识脉络、提高文献调研效率,本文采取文献计量、知识分析与数据挖掘相结合的方法,并采用Hadoop的MapReduce分布式计算平台,从定性和定量两个方面对2009至2014年国内研究人员在云计算领域发表的文献进行发文量统计和关键词聚类分析.文中以中国学术期刊网络出版总库2009至2014年收录的核心期刊中与云计算有关的4 195篇文献作为数据来源,具体从发文量、热点关键词排名、关键词聚类三个角度对近六年云计算领域的知识进行统计分析.在分析发文量时,重点分析了发文量随年度的分布情况;在分析关键词的词频时,统计了每一年的关键词词频,将总频次最高的若干关键词作为热点,分析了其随年度的分布情况;在分析关键词的聚类信息时,生成了共现矩阵和相似度矩阵,基于SPSS将相似度矩阵生成关键词聚类树,基于聚类树将目前国内云计算领域的研究总结为三个方向:云平台研究,优化策略研究,云计算应用研究.文中研究成果将有助于研究人员理解云计算的知识体系、研究重点和发展趋势,解决研究人员的认知迷航和知识过载问题.
雲計算技術目前已經成為研究熱點,併有大量的研究成果以科技文獻的方式麵世.為能使雲計算領域的科研人員理清知識脈絡、提高文獻調研效率,本文採取文獻計量、知識分析與數據挖掘相結閤的方法,併採用Hadoop的MapReduce分佈式計算平檯,從定性和定量兩箇方麵對2009至2014年國內研究人員在雲計算領域髮錶的文獻進行髮文量統計和關鍵詞聚類分析.文中以中國學術期刊網絡齣版總庫2009至2014年收錄的覈心期刊中與雲計算有關的4 195篇文獻作為數據來源,具體從髮文量、熱點關鍵詞排名、關鍵詞聚類三箇角度對近六年雲計算領域的知識進行統計分析.在分析髮文量時,重點分析瞭髮文量隨年度的分佈情況;在分析關鍵詞的詞頻時,統計瞭每一年的關鍵詞詞頻,將總頻次最高的若榦關鍵詞作為熱點,分析瞭其隨年度的分佈情況;在分析關鍵詞的聚類信息時,生成瞭共現矩陣和相似度矩陣,基于SPSS將相似度矩陣生成關鍵詞聚類樹,基于聚類樹將目前國內雲計算領域的研究總結為三箇方嚮:雲平檯研究,優化策略研究,雲計算應用研究.文中研究成果將有助于研究人員理解雲計算的知識體繫、研究重點和髮展趨勢,解決研究人員的認知迷航和知識過載問題.
운계산기술목전이경성위연구열점,병유대량적연구성과이과기문헌적방식면세.위능사운계산영역적과연인원리청지식맥락、제고문헌조연효솔,본문채취문헌계량、지식분석여수거알굴상결합적방법,병채용Hadoop적MapReduce분포식계산평태,종정성화정량량개방면대2009지2014년국내연구인원재운계산영역발표적문헌진행발문량통계화관건사취류분석.문중이중국학술기간망락출판총고2009지2014년수록적핵심기간중여운계산유관적4 195편문헌작위수거래원,구체종발문량、열점관건사배명、관건사취류삼개각도대근륙년운계산영역적지식진행통계분석.재분석발문량시,중점분석료발문량수년도적분포정황;재분석관건사적사빈시,통계료매일년적관건사사빈,장총빈차최고적약간관건사작위열점,분석료기수년도적분포정황;재분석관건사적취류신식시,생성료공현구진화상사도구진,기우SPSS장상사도구진생성관건사취류수,기우취류수장목전국내운계산영역적연구총결위삼개방향:운평태연구,우화책략연구,운계산응용연구.문중연구성과장유조우연구인원리해운계산적지식체계、연구중점화발전추세,해결연구인원적인지미항화지식과재문제.