计算机工程与应用
計算機工程與應用
계산궤공정여응용
Computer Engineering and Applications
2015年
21期
1-5
,共5页
隐私保护%数据挖掘%数据扰动%非负矩阵分解%样本选择%分类
隱私保護%數據挖掘%數據擾動%非負矩陣分解%樣本選擇%分類
은사보호%수거알굴%수거우동%비부구진분해%양본선택%분류
privacy protection%data mining%data perturbation%non-negative matrix factorization%sample selection%classification
针对现有的基于非负矩阵分解的隐私保护数据挖掘方法中,不区分样本的重要性的不同,对所有样本都进行同样强度扰动的问题进行改进。提出了一种结合样本选择的基于非负矩阵分解的隐私保护分类方法。该方法使用样本选择将原始样本区分为重要的和不重要的两类。在对数据进行扰动时,使用现有的基于非负矩阵分解的方法对所有样本进行扰动。随后利用非负矩阵分解的聚类性质,对不重要的样本进行附加扰动。实验表明,该方法在保持数据可用性的同时,可以对隐私信息提供更好的保护。
針對現有的基于非負矩陣分解的隱私保護數據挖掘方法中,不區分樣本的重要性的不同,對所有樣本都進行同樣彊度擾動的問題進行改進。提齣瞭一種結閤樣本選擇的基于非負矩陣分解的隱私保護分類方法。該方法使用樣本選擇將原始樣本區分為重要的和不重要的兩類。在對數據進行擾動時,使用現有的基于非負矩陣分解的方法對所有樣本進行擾動。隨後利用非負矩陣分解的聚類性質,對不重要的樣本進行附加擾動。實驗錶明,該方法在保持數據可用性的同時,可以對隱私信息提供更好的保護。
침대현유적기우비부구진분해적은사보호수거알굴방법중,불구분양본적중요성적불동,대소유양본도진행동양강도우동적문제진행개진。제출료일충결합양본선택적기우비부구진분해적은사보호분류방법。해방법사용양본선택장원시양본구분위중요적화불중요적량류。재대수거진행우동시,사용현유적기우비부구진분해적방법대소유양본진행우동。수후이용비부구진분해적취류성질,대불중요적양본진행부가우동。실험표명,해방법재보지수거가용성적동시,가이대은사신식제공경호적보호。
In existing privacy-preserving data mining method based on NMF(Non-Negative Matrix Factorization), every sample is equally important, and is perturbed with same degree. For solving this problem, a new method using sample selection and based on NMF is proposed. This method uses sample selection to divide samples into two parts:the important samples and the unimportant samples. Both important and unimportant samples are perturbed by using the existing NMF-based method. And then, unimportant samples are perturbed additionally by using the clustering properties of the NMF. The experiments show that, when keeping data utility, this new method can protect privacy well.