计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2011年
5期
823-830
,共8页
张净%孙志挥%杨明%倪巍伟%杨宜东
張淨%孫誌揮%楊明%倪巍偉%楊宜東
장정%손지휘%양명%예외위%양의동
海量数据%网格%密度%离群点挖掘%增量%LOF算法
海量數據%網格%密度%離群點挖掘%增量%LOF算法
해량수거%망격%밀도%리군점알굴%증량%LOF산법
处理海量和高维数据已经成为设计离群点算法面临的重要任务和挑战,针对海量数据的特点提出一种基于网格和密度的增量式离群点挖掘算法IGDLOF,算法的基本思想为:采用网格的七元组信息减少数据维数和数量,利用增量更新减少内存需求.通过代表点过滤相应的主体数据,先判断再进行近似密度计算的方法减少计算量,降低算法的复杂度.通过在真实和仿真数据集的测试表明,IGDLOF增量算法可与LOF算法保持相同的精确度,而执行效率得到显著的提高.
處理海量和高維數據已經成為設計離群點算法麵臨的重要任務和挑戰,針對海量數據的特點提齣一種基于網格和密度的增量式離群點挖掘算法IGDLOF,算法的基本思想為:採用網格的七元組信息減少數據維數和數量,利用增量更新減少內存需求.通過代錶點過濾相應的主體數據,先判斷再進行近似密度計算的方法減少計算量,降低算法的複雜度.通過在真實和倣真數據集的測試錶明,IGDLOF增量算法可與LOF算法保持相同的精確度,而執行效率得到顯著的提高.
처리해량화고유수거이경성위설계리군점산법면림적중요임무화도전,침대해량수거적특점제출일충기우망격화밀도적증량식리군점알굴산법IGDLOF,산법적기본사상위:채용망격적칠원조신식감소수거유수화수량,이용증량경신감소내존수구.통과대표점과려상응적주체수거,선판단재진행근사밀도계산적방법감소계산량,강저산법적복잡도.통과재진실화방진수거집적측시표명,IGDLOF증량산법가여LOF산법보지상동적정학도,이집행효솔득도현저적제고.