计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2011年
z2期
457-463
,共7页
张勇%倪巍伟%崇志宏%胡新平
張勇%倪巍偉%崇誌宏%鬍新平
장용%예외위%숭지굉%호신평
隐私保护数据发布%聚类分析%数据扰动%邻域相关性%邻域亲密%数据平移
隱私保護數據髮佈%聚類分析%數據擾動%鄰域相關性%鄰域親密%數據平移
은사보호수거발포%취류분석%수거우동%린역상관성%린역친밀%수거평이
针对面向聚类应用的隐私保护数据发布问题,引入邻域相关性概念,提出了一种基于邻域相关性的数据扰动算法NCDP,分析每个数据点邻域中与其邻域亲密的所有点以及邻域的平衡性,在不平衡情况下除去亲密集中可能的局部噪声数据点,向每个邻域亲密点进行一定长度的平移,得到扰动后的数据点.理论分析表明,扰动后的数据点不仅实现了对原始数值的保护,而且扰动前后数据点的邻域亲密点仍然维持亲密关系,从而保持了邻域的稳定性.实验采用k-means和DBSCAN聚类算法对扰动前后的数据进行聚类,并且与其他扰动算法进行了分析对比.实验结果表明,算法NCDP扰动前后的数据聚类结果有较高的相似度,可以较好地兼顾保护数据隐私与维持聚类可用性.
針對麵嚮聚類應用的隱私保護數據髮佈問題,引入鄰域相關性概唸,提齣瞭一種基于鄰域相關性的數據擾動算法NCDP,分析每箇數據點鄰域中與其鄰域親密的所有點以及鄰域的平衡性,在不平衡情況下除去親密集中可能的跼部譟聲數據點,嚮每箇鄰域親密點進行一定長度的平移,得到擾動後的數據點.理論分析錶明,擾動後的數據點不僅實現瞭對原始數值的保護,而且擾動前後數據點的鄰域親密點仍然維持親密關繫,從而保持瞭鄰域的穩定性.實驗採用k-means和DBSCAN聚類算法對擾動前後的數據進行聚類,併且與其他擾動算法進行瞭分析對比.實驗結果錶明,算法NCDP擾動前後的數據聚類結果有較高的相似度,可以較好地兼顧保護數據隱私與維持聚類可用性.
침대면향취류응용적은사보호수거발포문제,인입린역상관성개념,제출료일충기우린역상관성적수거우동산법NCDP,분석매개수거점린역중여기린역친밀적소유점이급린역적평형성,재불평형정황하제거친밀집중가능적국부조성수거점,향매개린역친밀점진행일정장도적평이,득도우동후적수거점.이론분석표명,우동후적수거점불부실현료대원시수치적보호,이차우동전후수거점적린역친밀점잉연유지친밀관계,종이보지료린역적은정성.실험채용k-means화DBSCAN취류산법대우동전후적수거진행취류,병차여기타우동산법진행료분석대비.실험결과표명,산법NCDP우동전후적수거취류결과유교고적상사도,가이교호지겸고보호수거은사여유지취류가용성.