计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
11期
2311-2319
,共9页
频繁子图%图分类%图挖掘%特征选择%嵌入集%数据挖掘
頻繁子圖%圖分類%圖挖掘%特徵選擇%嵌入集%數據挖掘
빈번자도%도분류%도알굴%특정선택%감입집%수거알굴
随着图数据收集技术在许多科学领域的发展,对图数据分类已成为机器学习和数据挖掘领域的重要课题.目前已经提出许多图分类方法.其中,一些图分类方法采用3步来构筑分类模型;一些图分类方法采用2步来构筑分类模型.这些方法在挖掘频繁子图或特征子图时,只考虑到子图的结构信息,而没有考虑到子图的嵌入信息.为此,在L-CCAM子图编码的基础上,提出了一种基于嵌入集的图分类方法.该方法采用基于类别信息的特征子图选择策略,不但考虑了子图的结构信息,而且在频繁子图挖掘过程中充分利用嵌入信息——嵌入集,通过一步即直接选择特征子图以及生成分类规则.实验结果表明:在对化合物数据分类时,在分类精度上该方法优于采用3步的图分类方法;在运行效率上该方法优于采用2步和3步的图数据分类方法.
隨著圖數據收集技術在許多科學領域的髮展,對圖數據分類已成為機器學習和數據挖掘領域的重要課題.目前已經提齣許多圖分類方法.其中,一些圖分類方法採用3步來構築分類模型;一些圖分類方法採用2步來構築分類模型.這些方法在挖掘頻繁子圖或特徵子圖時,隻攷慮到子圖的結構信息,而沒有攷慮到子圖的嵌入信息.為此,在L-CCAM子圖編碼的基礎上,提齣瞭一種基于嵌入集的圖分類方法.該方法採用基于類彆信息的特徵子圖選擇策略,不但攷慮瞭子圖的結構信息,而且在頻繁子圖挖掘過程中充分利用嵌入信息——嵌入集,通過一步即直接選擇特徵子圖以及生成分類規則.實驗結果錶明:在對化閤物數據分類時,在分類精度上該方法優于採用3步的圖分類方法;在運行效率上該方法優于採用2步和3步的圖數據分類方法.
수착도수거수집기술재허다과학영역적발전,대도수거분류이성위궤기학습화수거알굴영역적중요과제.목전이경제출허다도분류방법.기중,일사도분류방법채용3보래구축분류모형;일사도분류방법채용2보래구축분류모형.저사방법재알굴빈번자도혹특정자도시,지고필도자도적결구신식,이몰유고필도자도적감입신식.위차,재L-CCAM자도편마적기출상,제출료일충기우감입집적도분류방법.해방법채용기우유별신식적특정자도선택책략,불단고필료자도적결구신식,이차재빈번자도알굴과정중충분이용감입신식——감입집,통과일보즉직접선택특정자도이급생성분류규칙.실험결과표명:재대화합물수거분류시,재분류정도상해방법우우채용3보적도분류방법;재운행효솔상해방법우우채용2보화3보적도수거분류방법.