计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2012年
8期
2193-2197
,共5页
数据挖掘%离群数据%网格%数据分区%单元%微单元%维单元树
數據挖掘%離群數據%網格%數據分區%單元%微單元%維單元樹
수거알굴%리군수거%망격%수거분구%단원%미단원%유단원수
针对已有的基于网格的离群点挖掘算法挖掘效率低和对于大数据集适应性差的问题,提出基于数据分区和网格的离群点挖掘算法.算法首先将数据进行分区,以单元为单位筛选非离群点,并把中间结果暂存起来;然后采用改进的维单元树结构维护数据点的空间信息,以微单元为单位进行非离群点筛选,并通过两个优化策略进行高效操作;最后以数据点为单位挖掘离群点,从而得到离群数据集合.理论分析和实验结果表明了该方法是有效可行的,对大数据集和高维数据具有更好的伸缩性.
針對已有的基于網格的離群點挖掘算法挖掘效率低和對于大數據集適應性差的問題,提齣基于數據分區和網格的離群點挖掘算法.算法首先將數據進行分區,以單元為單位篩選非離群點,併把中間結果暫存起來;然後採用改進的維單元樹結構維護數據點的空間信息,以微單元為單位進行非離群點篩選,併通過兩箇優化策略進行高效操作;最後以數據點為單位挖掘離群點,從而得到離群數據集閤.理論分析和實驗結果錶明瞭該方法是有效可行的,對大數據集和高維數據具有更好的伸縮性.
침대이유적기우망격적리군점알굴산법알굴효솔저화대우대수거집괄응성차적문제,제출기우수거분구화망격적리군점알굴산법.산법수선장수거진행분구,이단원위단위사선비리군점,병파중간결과잠존기래;연후채용개진적유단원수결구유호수거점적공간신식,이미단원위단위진행비리군점사선,병통과량개우화책략진행고효조작;최후이수거점위단위알굴리군점,종이득도리군수거집합.이론분석화실험결과표명료해방법시유효가행적,대대수거집화고유수거구유경호적신축성.