计算机科学
計算機科學
계산궤과학
Computer Science
2015年
10期
132-137
,共6页
苏赢彬%杜学绘%夏春涛%曹利峰%陈华成
囌贏彬%杜學繪%夏春濤%曹利峰%陳華成
소영빈%두학회%하춘도%조리봉%진화성
半监督聚类%DBSCAN%主动学习%敏感信息%模糊数学%推导方法
半鑑督聚類%DBSCAN%主動學習%敏感信息%模糊數學%推導方法
반감독취류%DBSCAN%주동학습%민감신식%모호수학%추도방법
Semi-supervised clustering%DBSCAN%Active learning%Sensitive information%Fuzzy math%Inference method
针对当前多文档聚合推导引起的敏感信息泄露问题存在风险大、隐蔽性高的特点,提出了一种基于半监督聚类的文档敏感信息推导方法.首先,为确保在较小的时间开销下获得高质量的约束信息,设计了一种新颖的二阶约束主动学习算法,它通过选择不确定性最大的样本点来生成信息量最大的约束闭包;然后,在引入约束信息的基础上结合DBSCAN提出一种新的半监督聚类算法,它能够有效解决DBSCAN算法存在的边界模糊问题,提高文档聚类准确性;最后,在半监督聚类结果的基础上,对相似文档进行敏感信息可能性测度.实验表明,半监督聚类算法准确率提升明显,推导方法能够有效推导出敏感信息.
針對噹前多文檔聚閤推導引起的敏感信息洩露問題存在風險大、隱蔽性高的特點,提齣瞭一種基于半鑑督聚類的文檔敏感信息推導方法.首先,為確保在較小的時間開銷下穫得高質量的約束信息,設計瞭一種新穎的二階約束主動學習算法,它通過選擇不確定性最大的樣本點來生成信息量最大的約束閉包;然後,在引入約束信息的基礎上結閤DBSCAN提齣一種新的半鑑督聚類算法,它能夠有效解決DBSCAN算法存在的邊界模糊問題,提高文檔聚類準確性;最後,在半鑑督聚類結果的基礎上,對相似文檔進行敏感信息可能性測度.實驗錶明,半鑑督聚類算法準確率提升明顯,推導方法能夠有效推導齣敏感信息.
침대당전다문당취합추도인기적민감신식설로문제존재풍험대、은폐성고적특점,제출료일충기우반감독취류적문당민감신식추도방법.수선,위학보재교소적시간개소하획득고질량적약속신식,설계료일충신영적이계약속주동학습산법,타통과선택불학정성최대적양본점래생성신식량최대적약속폐포;연후,재인입약속신식적기출상결합DBSCAN제출일충신적반감독취류산법,타능구유효해결DBSCAN산법존재적변계모호문제,제고문당취류준학성;최후,재반감독취류결과적기출상,대상사문당진행민감신식가능성측도.실험표명,반감독취류산법준학솔제승명현,추도방법능구유효추도출민감신식.