计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
10期
2148-2159
,共12页
模式类别挖掘%主动学习%PM_AL模型%差异度%标记代价
模式類彆挖掘%主動學習%PM_AL模型%差異度%標記代價
모식유별알굴%주동학습%PM_AL모형%차이도%표기대개
pattern class mining%active learning%PM_AL model%discrepancy%labeling cost
在实际应用问题中,由于客观世界物质的多样性、模糊性和复杂性,经常会遇到大量未知样本类别信息的数据挖掘问题,而传统方法往往都依赖于已知样本类别信息才能对数据进行有效挖掘,对于未知模式类别信息的多类数据目前还没有有效的处理方法.针对未知类别信息的多类样本挖掘问题,提出了一种基于主动学习的模式类别挖掘模型(pattern class mining model based on active learning,PM_AL)来解决未知类别信息的模式类别挖掘问题.该模型通过衡量已得到的模式类别与未标记样本间的关系,引入样本差异度的方法来抽取最有价值样本,通过主动学习方式以较小的标记代价快速挖掘无标记样本所蕴含的可能模式类别,从而有助于将无类别标记的多分类问题转化成有类别标记的多分类问题.实验结果表明,PM_AL算法能够以较小的标记代价处理无类别信息的模式类别挖掘问题.
在實際應用問題中,由于客觀世界物質的多樣性、模糊性和複雜性,經常會遇到大量未知樣本類彆信息的數據挖掘問題,而傳統方法往往都依賴于已知樣本類彆信息纔能對數據進行有效挖掘,對于未知模式類彆信息的多類數據目前還沒有有效的處理方法.針對未知類彆信息的多類樣本挖掘問題,提齣瞭一種基于主動學習的模式類彆挖掘模型(pattern class mining model based on active learning,PM_AL)來解決未知類彆信息的模式類彆挖掘問題.該模型通過衡量已得到的模式類彆與未標記樣本間的關繫,引入樣本差異度的方法來抽取最有價值樣本,通過主動學習方式以較小的標記代價快速挖掘無標記樣本所蘊含的可能模式類彆,從而有助于將無類彆標記的多分類問題轉化成有類彆標記的多分類問題.實驗結果錶明,PM_AL算法能夠以較小的標記代價處理無類彆信息的模式類彆挖掘問題.
재실제응용문제중,유우객관세계물질적다양성、모호성화복잡성,경상회우도대량미지양본유별신식적수거알굴문제,이전통방법왕왕도의뢰우이지양본유별신식재능대수거진행유효알굴,대우미지모식유별신식적다류수거목전환몰유유효적처리방법.침대미지유별신식적다류양본알굴문제,제출료일충기우주동학습적모식유별알굴모형(pattern class mining model based on active learning,PM_AL)래해결미지유별신식적모식유별알굴문제.해모형통과형량이득도적모식유별여미표기양본간적관계,인입양본차이도적방법래추취최유개치양본,통과주동학습방식이교소적표기대개쾌속알굴무표기양본소온함적가능모식유별,종이유조우장무유별표기적다분류문제전화성유유별표기적다분류문제.실험결과표명,PM_AL산법능구이교소적표기대개처리무유별신식적모식유별알굴문제.