计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2013年
8期
140-145
,共6页
杨高明%李敬兆%杨静%朱广丽
楊高明%李敬兆%楊靜%硃廣麗
양고명%리경조%양정%주엄려
隐私保护%数据发布%l-多样性%数据效用%聚类%相似性度量
隱私保護%數據髮佈%l-多樣性%數據效用%聚類%相似性度量
은사보호%수거발포%l-다양성%수거효용%취류%상사성도량
Privacy preserving%Data publishing%l-Diversity%Data utility%Clustering%Similarity measures
发布未经处理的数据会导致身份泄露和敏感属性泄露,通过概化准标识符可以达到隐私保护的目的,但信息损失过大.针对该问题提出一种基于聚类的(k,l)-多样性数据发布模型并设计算法予以实现.通过使用概率联合分布度量数据对象的离散属性和连续属性相似性,提高了数据的效用.详细论述了簇的合并、调整和概化策略,结合参数k和l提出隐私保护度概念,指出了基于聚类的最优化(k,l)-多样性算法是NP-难问题,并分析了算法的复杂度.理论分析和实验结果表明,该方法可以有效减少执行时间和信息损失,提高查询精度.
髮佈未經處理的數據會導緻身份洩露和敏感屬性洩露,通過概化準標識符可以達到隱私保護的目的,但信息損失過大.針對該問題提齣一種基于聚類的(k,l)-多樣性數據髮佈模型併設計算法予以實現.通過使用概率聯閤分佈度量數據對象的離散屬性和連續屬性相似性,提高瞭數據的效用.詳細論述瞭簇的閤併、調整和概化策略,結閤參數k和l提齣隱私保護度概唸,指齣瞭基于聚類的最優化(k,l)-多樣性算法是NP-難問題,併分析瞭算法的複雜度.理論分析和實驗結果錶明,該方法可以有效減少執行時間和信息損失,提高查詢精度.
발포미경처리적수거회도치신빈설로화민감속성설로,통과개화준표식부가이체도은사보호적목적,단신식손실과대.침대해문제제출일충기우취류적(k,l)-다양성수거발포모형병설계산법여이실현.통과사용개솔연합분포도량수거대상적리산속성화련속속성상사성,제고료수거적효용.상세논술료족적합병、조정화개화책략,결합삼수k화l제출은사보호도개념,지출료기우취류적최우화(k,l)-다양성산법시NP-난문제,병분석료산법적복잡도.이론분석화실험결과표명,해방법가이유효감소집행시간화신식손실,제고사순정도.