情报学报
情報學報
정보학보
2013年
10期
1058-1067
,共10页
孙建军%鞠秀芳%裴雷%郑彦宁%潘云涛
孫建軍%鞠秀芳%裴雷%鄭彥寧%潘雲濤
손건군%국수방%배뢰%정언저%반운도
期刊引用操纵行为%CART算法%自引率%被引年代分布%被引密度比%引用密度比
期刊引用操縱行為%CART算法%自引率%被引年代分佈%被引密度比%引用密度比
기간인용조종행위%CART산법%자인솔%피인년대분포%피인밀도비%인용밀도비
当前,一些学术期刊在利益的驱使下,通过大量自引和结成"互引同盟"的方式快速提高被引频次和影响因子等指标,影响了引文分析的公平性.基于此,本文首先利用数据挖掘中的CART分类算法构建期刊操纵引用行为的识别模型,设计了识别操纵引用行为的4个评价指标:自引率、被引年代分布、被引密度比和引用密度比.并采用国内某引文数据库中的50本综合性社会科学期刊作为实验样本,采集该期刊群2009年的引文数据作为训练数据集,2008年的引文数据作为验证数据集.最后,运用2010年的引文数据对期刊操控行为识别模型的有效性进行验证,实验结果证明,本文构建的分类模型可以有效地对期刊引用操纵行为进行识别.
噹前,一些學術期刊在利益的驅使下,通過大量自引和結成"互引同盟"的方式快速提高被引頻次和影響因子等指標,影響瞭引文分析的公平性.基于此,本文首先利用數據挖掘中的CART分類算法構建期刊操縱引用行為的識彆模型,設計瞭識彆操縱引用行為的4箇評價指標:自引率、被引年代分佈、被引密度比和引用密度比.併採用國內某引文數據庫中的50本綜閤性社會科學期刊作為實驗樣本,採集該期刊群2009年的引文數據作為訓練數據集,2008年的引文數據作為驗證數據集.最後,運用2010年的引文數據對期刊操控行為識彆模型的有效性進行驗證,實驗結果證明,本文構建的分類模型可以有效地對期刊引用操縱行為進行識彆.
당전,일사학술기간재이익적구사하,통과대량자인화결성"호인동맹"적방식쾌속제고피인빈차화영향인자등지표,영향료인문분석적공평성.기우차,본문수선이용수거알굴중적CART분류산법구건기간조종인용행위적식별모형,설계료식별조종인용행위적4개평개지표:자인솔、피인년대분포、피인밀도비화인용밀도비.병채용국내모인문수거고중적50본종합성사회과학기간작위실험양본,채집해기간군2009년적인문수거작위훈련수거집,2008년적인문수거작위험증수거집.최후,운용2010년적인문수거대기간조공행위식별모형적유효성진행험증,실험결과증명,본문구건적분류모형가이유효지대기간인용조종행위진행식별.