计算机学报
計算機學報
계산궤학보
Chinese Journal of Computers
2015年
10期
2028-2040
,共13页
刘东%吴泉源%韩伟红%周斌
劉東%吳泉源%韓偉紅%週斌
류동%오천원%한위홍%주빈
用户名特征%身份同一性判定%多网络应用%社交网络%社会计算
用戶名特徵%身份同一性判定%多網絡應用%社交網絡%社會計算
용호명특정%신빈동일성판정%다망락응용%사교망락%사회계산
username feature%linking user identities%multiple websites%social networks%social computing
由于用户通常注册使用多个网络应用,因而在互联网中存在着许多重复的用户身份.对重复用户身份的判定与整合在商业领域和网络安全领域都有十分重要的意义.由于用户出于隐私安全的考虑,其在互联网中提供的个人信息通常不完整或者部分内容是虚假的.考虑到用户名能够反映出用户的个性或习惯,较易获得且不涉及隐私问题,因此文中提出了一种仅依靠用户名特征进行用户身份同一性判定的方法.首先文中对用户身份同一性判定问题进行了形式化描述,进而将用户名特征分为直观特征和对比特征两类,并对用户名特征的概率分布进行了量化分析.在此基础上,文中提出了一种身份同一性判定方法,对指定用户名对是否属于同一用户进行鉴别.进而提出了一种给定单个用户名时,在用户名候选集合中检索可能属于该用户的其他用户名的方法.最后在大规模真实数据集上进行了一系列实验,证实了提出的方法的有效性.
由于用戶通常註冊使用多箇網絡應用,因而在互聯網中存在著許多重複的用戶身份.對重複用戶身份的判定與整閤在商業領域和網絡安全領域都有十分重要的意義.由于用戶齣于隱私安全的攷慮,其在互聯網中提供的箇人信息通常不完整或者部分內容是虛假的.攷慮到用戶名能夠反映齣用戶的箇性或習慣,較易穫得且不涉及隱私問題,因此文中提齣瞭一種僅依靠用戶名特徵進行用戶身份同一性判定的方法.首先文中對用戶身份同一性判定問題進行瞭形式化描述,進而將用戶名特徵分為直觀特徵和對比特徵兩類,併對用戶名特徵的概率分佈進行瞭量化分析.在此基礎上,文中提齣瞭一種身份同一性判定方法,對指定用戶名對是否屬于同一用戶進行鑒彆.進而提齣瞭一種給定單箇用戶名時,在用戶名候選集閤中檢索可能屬于該用戶的其他用戶名的方法.最後在大規模真實數據集上進行瞭一繫列實驗,證實瞭提齣的方法的有效性.
유우용호통상주책사용다개망락응용,인이재호련망중존재착허다중복적용호신빈.대중복용호신빈적판정여정합재상업영역화망락안전영역도유십분중요적의의.유우용호출우은사안전적고필,기재호련망중제공적개인신식통상불완정혹자부분내용시허가적.고필도용호명능구반영출용호적개성혹습관,교역획득차불섭급은사문제,인차문중제출료일충부의고용호명특정진행용호신빈동일성판정적방법.수선문중대용호신빈동일성판정문제진행료형식화묘술,진이장용호명특정분위직관특정화대비특정량류,병대용호명특정적개솔분포진행료양화분석.재차기출상,문중제출료일충신빈동일성판정방법,대지정용호명대시부속우동일용호진행감별.진이제출료일충급정단개용호명시,재용호명후선집합중검색가능속우해용호적기타용호명적방법.최후재대규모진실수거집상진행료일계렬실험,증실료제출적방법적유효성.