计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2010年
6期
1271-1273,1304
,共4页
隐私保护%Shamir秘密共享%分布式数据挖掘%决策树%信息论
隱私保護%Shamir祕密共享%分佈式數據挖掘%決策樹%信息論
은사보호%Shamir비밀공향%분포식수거알굴%결책수%신식론
privacy preserving%Shamir secret sharing%distributed data mining%decision tree%information theory
为了在分布式环境下进行数据分类挖掘,使每部分的隐私得到保护,根据Shamir秘密共享思想,提出了一种基于分布式环境下的决策树分类算法.在对集中数据库决策树分类属性的最大的信息增益公式分析的基础上,推导了分布式数据库的同一分类属性的息增益公式.在此基础上对Shamir秘密共享的加密原理进行分析,将其应用到求分布式数据库决策树分类属性的最大的信息增益公式中,并对隐私保护值求和的过程进行了实例分析.实验结果表明,该方法能有效地对分布式同构样本数据集进行隐私保护的决策树分类挖掘.
為瞭在分佈式環境下進行數據分類挖掘,使每部分的隱私得到保護,根據Shamir祕密共享思想,提齣瞭一種基于分佈式環境下的決策樹分類算法.在對集中數據庫決策樹分類屬性的最大的信息增益公式分析的基礎上,推導瞭分佈式數據庫的同一分類屬性的息增益公式.在此基礎上對Shamir祕密共享的加密原理進行分析,將其應用到求分佈式數據庫決策樹分類屬性的最大的信息增益公式中,併對隱私保護值求和的過程進行瞭實例分析.實驗結果錶明,該方法能有效地對分佈式同構樣本數據集進行隱私保護的決策樹分類挖掘.
위료재분포식배경하진행수거분류알굴,사매부분적은사득도보호,근거Shamir비밀공향사상,제출료일충기우분포식배경하적결책수분류산법.재대집중수거고결책수분류속성적최대적신식증익공식분석적기출상,추도료분포식수거고적동일분류속성적식증익공식.재차기출상대Shamir비밀공향적가밀원리진행분석,장기응용도구분포식수거고결책수분류속성적최대적신식증익공식중,병대은사보호치구화적과정진행료실례분석.실험결과표명,해방법능유효지대분포식동구양본수거집진행은사보호적결책수분류알굴.
According to Shamir secret sharing theory, a privacy preserving decision tree classification algorithm based on distributed environment is presented, to Classifying mine on the distributed environment and protect every part privacy. Firstly, the maximal in-formation gain formula of the classification attribute is analyzed on the concentrating database decision tree, and the maximal information gain formula is deduced for the same classification attribute on the distributed data. Then, the enerypt principle of the Shamir shared is analyzed, and apply it to the maximal information gain formula of the decision tree classification attribute on the distributed database. A case planning is presented for the process of the privacy value summation. Finally, the experimental results show that this algorithm can effectively mine decision tree for isomorphism of distributed sample data sets to protect privacy.