计算机应用研究
計算機應用研究
계산궤응용연구
Application Research of Computers
2015年
11期
3264-3268
,共5页
隐私保护%频繁模式%知识粒度%减量式
隱私保護%頻繁模式%知識粒度%減量式
은사보호%빈번모식%지식립도%감량식
privacy preserving%frequent pattern%knowledge granularity%decreasing
为了能够更好地开展隐私保护数据挖掘工作,描述该领域的研究进展。针对基于随机的干扰方法中典型代表 EMASK 算法,用粒度计算的思想提出改进意见,将关系数据表转换成面向机器的粒度关系模型。这种计算方法使用了数据的垂直 Bitmap 表示,利用位操作的方法来保证准确性不降低的情况下,减少 I /O 操作的次数,降低空间开销,同时在生成频繁项集时,也记录了其在扭曲后数据中的支持度,减少了文件的访问次数,由此提高计算效率。针对现实世界事务数据库变化情况,利用减量式更新算法技术来解决减量式事务数据库频繁项集计算问题。实验结果证明,无论是在固定减量集数据库还是可变减量集数据库处理中,BDEMASK 相对于EMASK 而言,时间效率都有很大幅度的提高。
為瞭能夠更好地開展隱私保護數據挖掘工作,描述該領域的研究進展。針對基于隨機的榦擾方法中典型代錶 EMASK 算法,用粒度計算的思想提齣改進意見,將關繫數據錶轉換成麵嚮機器的粒度關繫模型。這種計算方法使用瞭數據的垂直 Bitmap 錶示,利用位操作的方法來保證準確性不降低的情況下,減少 I /O 操作的次數,降低空間開銷,同時在生成頻繁項集時,也記錄瞭其在扭麯後數據中的支持度,減少瞭文件的訪問次數,由此提高計算效率。針對現實世界事務數據庫變化情況,利用減量式更新算法技術來解決減量式事務數據庫頻繁項集計算問題。實驗結果證明,無論是在固定減量集數據庫還是可變減量集數據庫處理中,BDEMASK 相對于EMASK 而言,時間效率都有很大幅度的提高。
위료능구경호지개전은사보호수거알굴공작,묘술해영역적연구진전。침대기우수궤적간우방법중전형대표 EMASK 산법,용립도계산적사상제출개진의견,장관계수거표전환성면향궤기적립도관계모형。저충계산방법사용료수거적수직 Bitmap 표시,이용위조작적방법래보증준학성불강저적정황하,감소 I /O 조작적차수,강저공간개소,동시재생성빈번항집시,야기록료기재뉴곡후수거중적지지도,감소료문건적방문차수,유차제고계산효솔。침대현실세계사무수거고변화정황,이용감량식경신산법기술래해결감량식사무수거고빈번항집계산문제。실험결과증명,무론시재고정감량집수거고환시가변감량집수거고처리중,BDEMASK 상대우EMASK 이언,시간효솔도유흔대폭도적제고。
In order to work better on privacy preserving data mining,described the research progress in this area.Aiming at EMASK algorithm-the typical method based on random perturbation,this paper proposed improvements with granular compu-ting,transforming the relational data forms into granularity relation model for machine.With bit operation method to ensure no reduction of accuracy,this calculation method used vertical Bitmap representation of the data,reducing the number of I /O op-erations and the space overhead.At the same time,it also recorded the distorted data support and reduced file access times in the generation of frequent item sets,thus improved the calculation efficiency.In view of the real world database changes,it solved the calculation problem of decreasing business database frequent item sets by using the decreasing updating algorithm technology.The experimental results show that,whether in fixed or variable decreasing database processing,the time efficien-cy improves greatly by BDEMASK compared with EMASK.