计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
1期
104-114
,共11页
频繁模式挖掘%top-k模式%差分隐私%拉普拉斯机制%指数机制
頻繁模式挖掘%top-k模式%差分隱私%拉普拉斯機製%指數機製
빈번모식알굴%top-k모식%차분은사%랍보랍사궤제%지수궤제
frequent pattern mining%top-k pattern%differential privacy%Laplace mechanism%exponential mechanism
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集含有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(differentially private top-k pattern mining).该算法利用指数机制从候选频繁模式集合中挑选出top-k个携带真实支持度计数的模式;采用拉普拉斯机制产生的噪音扰动所选模式的真实支持度计数;为了增强输出模式的可用性,采用后置处理技术对top-k个模式的噪音支持度计数进行求精处理.从理论角度证明了该算法满足ε-差分隐私,并符合(λ,δ)-useful要求.实验结果证明了DP-topkP算法具有较好的准确性、可用性和可扩展性.
頻繁模式挖掘是分析事務數據集常用技術.然而,噹事務數據集含有敏感數據時(如用戶行為記錄、電子病例等),直接髮佈頻繁模式及其支持度計數會給箇人隱私帶來相噹大的風險.對此提齣瞭一種滿足ε-差分隱私的top-k頻繁模式挖掘算法DP-topkP(differentially private top-k pattern mining).該算法利用指數機製從候選頻繁模式集閤中挑選齣top-k箇攜帶真實支持度計數的模式;採用拉普拉斯機製產生的譟音擾動所選模式的真實支持度計數;為瞭增彊輸齣模式的可用性,採用後置處理技術對top-k箇模式的譟音支持度計數進行求精處理.從理論角度證明瞭該算法滿足ε-差分隱私,併符閤(λ,δ)-useful要求.實驗結果證明瞭DP-topkP算法具有較好的準確性、可用性和可擴展性.
빈번모식알굴시분석사무수거집상용기술.연이,당사무수거집함유민감수거시(여용호행위기록、전자병례등),직접발포빈번모식급기지지도계수회급개인은사대래상당대적풍험.대차제출료일충만족ε-차분은사적top-k빈번모식알굴산법DP-topkP(differentially private top-k pattern mining).해산법이용지수궤제종후선빈번모식집합중도선출top-k개휴대진실지지도계수적모식;채용랍보랍사궤제산생적조음우동소선모식적진실지지도계수;위료증강수출모식적가용성,채용후치처리기술대top-k개모식적조음지지도계수진행구정처리.종이론각도증명료해산법만족ε-차분은사,병부합(λ,δ)-useful요구.실험결과증명료DP-topkP산법구유교호적준학성、가용성화가확전성.