计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2011年
1期
45-54
,共10页
数据挖掘%均匀取样%偏倚取样%数据流%概要数据结构
數據挖掘%均勻取樣%偏倚取樣%數據流%概要數據結構
수거알굴%균균취양%편의취양%수거류%개요수거결구
取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望.
取樣是一種通用有效的近似技術.在數據挖掘研究中,取樣方法可顯著減小所處理數據集的規模,使得衆多數據挖掘算法得以應用到大規模數據集以及數據流數據上.通過對應用于數據挖掘領域的代錶性取樣方法的比較研究和分析總結,提齣瞭一箇取樣算法分類框架.在指齣瞭均勻取樣跼限性的基礎上闡述瞭某些應用場景中選用偏倚取樣方法的必要性,綜述瞭取樣技術在數據挖掘領域的應用研究與應用髮展,最後對數據流挖掘取樣方法麵臨的挑戰和髮展方嚮進行瞭展望.
취양시일충통용유효적근사기술.재수거알굴연구중,취양방법가현저감소소처리수거집적규모,사득음다수거알굴산법득이응용도대규모수거집이급수거류수거상.통과대응용우수거알굴영역적대표성취양방법적비교연구화분석총결,제출료일개취양산법분류광가.재지출료균균취양국한성적기출상천술료모사응용장경중선용편의취양방법적필요성,종술료취양기술재수거알굴영역적응용연구여응용발전,최후대수거류알굴취양방법면림적도전화발전방향진행료전망.