计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2015年
4期
194-198
,共5页
数据挖掘%隐私保护%频繁模式%知识粒度
數據挖掘%隱私保護%頻繁模式%知識粒度
수거알굴%은사보호%빈번모식%지식립도
Data mining%Privacy preserving%Frequent pattern%Knowledge granularity
阐述了隐私保护数据挖掘的目标,即在获取有效的数据挖掘结果的同时,满足用户对隐私保护的要求.针对个体用户及组织用户的隐私保护,论述了不同的方法,并归纳出隐私保护数据挖掘中所采用的两种主流算法.改进了高效隐私保护关联规则挖掘算法(EMASK)中需要完全的数据库扫描并且进行多次比较操作的弊端,提出了基于粒度计算的高效隐私保护频繁模式挖掘算法(BEMASK).该算法将关系数据表转换成面向机器的关系模型,数据处理被转换成粒度计算的方式,计算频繁项集变成了计算基本颗粒的交集.特别是数据的垂直Bitmap表示,在保证准确性不降低的情况下,一方面减少了I/O操作的次数,另一方面较大地提高了效率.
闡述瞭隱私保護數據挖掘的目標,即在穫取有效的數據挖掘結果的同時,滿足用戶對隱私保護的要求.針對箇體用戶及組織用戶的隱私保護,論述瞭不同的方法,併歸納齣隱私保護數據挖掘中所採用的兩種主流算法.改進瞭高效隱私保護關聯規則挖掘算法(EMASK)中需要完全的數據庫掃描併且進行多次比較操作的弊耑,提齣瞭基于粒度計算的高效隱私保護頻繁模式挖掘算法(BEMASK).該算法將關繫數據錶轉換成麵嚮機器的關繫模型,數據處理被轉換成粒度計算的方式,計算頻繁項集變成瞭計算基本顆粒的交集.特彆是數據的垂直Bitmap錶示,在保證準確性不降低的情況下,一方麵減少瞭I/O操作的次數,另一方麵較大地提高瞭效率.
천술료은사보호수거알굴적목표,즉재획취유효적수거알굴결과적동시,만족용호대은사보호적요구.침대개체용호급조직용호적은사보호,논술료불동적방법,병귀납출은사보호수거알굴중소채용적량충주류산법.개진료고효은사보호관련규칙알굴산법(EMASK)중수요완전적수거고소묘병차진행다차비교조작적폐단,제출료기우립도계산적고효은사보호빈번모식알굴산법(BEMASK).해산법장관계수거표전환성면향궤기적관계모형,수거처리피전환성립도계산적방식,계산빈번항집변성료계산기본과립적교집.특별시수거적수직Bitmap표시,재보증준학성불강저적정황하,일방면감소료I/O조작적차수,령일방면교대지제고료효솔.