计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
11期
2432-2439
,共8页
胡新平%贺玉芝%倪巍伟%张勇
鬍新平%賀玉芝%倪巍偉%張勇
호신평%하옥지%예외위%장용
隐私保护%聚类%赌轮选择%遗传算法%数据干扰
隱私保護%聚類%賭輪選擇%遺傳算法%數據榦擾
은사보호%취류%도륜선택%유전산법%수거간우
面向聚类挖掘的隐私保护微数据发布是数据挖掘研究的新兴热点之一,其目标是通过对微数据数值的修改实现对微数据隐私的保护,同时保证隐藏后数据具有与原数据集相同(或相似)的聚类效果.从保持数据邻域关系稳定的角度,提出一种基于赌轮遗传的干扰方法RWSGA,采用在数据点的k邻域内运用赌轮算子随机选择2个数据点进行交叉或变异的思想实现数据隐藏.进一步,提出从高密度点区域筛选k邻域中心以改进变异操作选择域的优化策略,解决变异操作可能导致数据扰动幅度过大的问题.理论分析和实验结果表明,该方法能较好地对原始数据进行扰动修改以保护数据隐私不泄露,同时保证发布前后的数据聚类结果差异较小.
麵嚮聚類挖掘的隱私保護微數據髮佈是數據挖掘研究的新興熱點之一,其目標是通過對微數據數值的脩改實現對微數據隱私的保護,同時保證隱藏後數據具有與原數據集相同(或相似)的聚類效果.從保持數據鄰域關繫穩定的角度,提齣一種基于賭輪遺傳的榦擾方法RWSGA,採用在數據點的k鄰域內運用賭輪算子隨機選擇2箇數據點進行交扠或變異的思想實現數據隱藏.進一步,提齣從高密度點區域篩選k鄰域中心以改進變異操作選擇域的優化策略,解決變異操作可能導緻數據擾動幅度過大的問題.理論分析和實驗結果錶明,該方法能較好地對原始數據進行擾動脩改以保護數據隱私不洩露,同時保證髮佈前後的數據聚類結果差異較小.
면향취류알굴적은사보호미수거발포시수거알굴연구적신흥열점지일,기목표시통과대미수거수치적수개실현대미수거은사적보호,동시보증은장후수거구유여원수거집상동(혹상사)적취류효과.종보지수거린역관계은정적각도,제출일충기우도륜유전적간우방법RWSGA,채용재수거점적k린역내운용도륜산자수궤선택2개수거점진행교차혹변이적사상실현수거은장.진일보,제출종고밀도점구역사선k린역중심이개진변이조작선택역적우화책략,해결변이조작가능도치수거우동폭도과대적문제.이론분석화실험결과표명,해방법능교호지대원시수거진행우동수개이보호수거은사불설로,동시보증발포전후적수거취류결과차이교소.