计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
7期
1545-1552
,共8页
隐私保护%数据匿名%准标识符%层次聚类%信息损失
隱私保護%數據匿名%準標識符%層次聚類%信息損失
은사보호%수거닉명%준표식부%층차취류%신식손실
数据匿名是发布数据时对隐私信息进行保护的重要手段之一.对数据匿名的基本概念和应用模型进行了介绍,探讨了数据匿名结果应该满足的要求.为了抵制背景知识攻击,提出了一种基于杂度增益与层次聚类的数据匿名方法,该方法以杂度来度量敏感属性随机性,并以概化过程中信息损失最小、杂度增益最大的条件约束来控制聚类的合并过程,可以使数据匿名处理后的数据集在满足k-匿名模型和l-多样模型的同时,使数据概化的信息损失最小且敏感属性的取值均匀化.在实验部分,提出了一种对数据匿名结果进行评估的方法,该方法将匿名结果和原始数据进行对比,并从平均信息损失和平均杂度2个方面来评估数据匿名的质量.实验结果验证了以上方法的有效性.
數據匿名是髮佈數據時對隱私信息進行保護的重要手段之一.對數據匿名的基本概唸和應用模型進行瞭介紹,探討瞭數據匿名結果應該滿足的要求.為瞭牴製揹景知識攻擊,提齣瞭一種基于雜度增益與層次聚類的數據匿名方法,該方法以雜度來度量敏感屬性隨機性,併以概化過程中信息損失最小、雜度增益最大的條件約束來控製聚類的閤併過程,可以使數據匿名處理後的數據集在滿足k-匿名模型和l-多樣模型的同時,使數據概化的信息損失最小且敏感屬性的取值均勻化.在實驗部分,提齣瞭一種對數據匿名結果進行評估的方法,該方法將匿名結果和原始數據進行對比,併從平均信息損失和平均雜度2箇方麵來評估數據匿名的質量.實驗結果驗證瞭以上方法的有效性.
수거닉명시발포수거시대은사신식진행보호적중요수단지일.대수거닉명적기본개념화응용모형진행료개소,탐토료수거닉명결과응해만족적요구.위료저제배경지식공격,제출료일충기우잡도증익여층차취류적수거닉명방법,해방법이잡도래도량민감속성수궤성,병이개화과정중신식손실최소、잡도증익최대적조건약속래공제취류적합병과정,가이사수거닉명처리후적수거집재만족k-닉명모형화l-다양모형적동시,사수거개화적신식손실최소차민감속성적취치균균화.재실험부분,제출료일충대수거닉명결과진행평고적방법,해방법장닉명결과화원시수거진행대비,병종평균신식손실화평균잡도2개방면래평고수거닉명적질량.실험결과험증료이상방법적유효성.