智能系统学报
智能繫統學報
지능계통학보
CAAI TRANSACTIONS ON INTELLIGENT SYSTEMS
2010年
2期
150-155
,共6页
张贺%蔡江辉%张继福%乔衎
張賀%蔡江輝%張繼福%喬衎
장하%채강휘%장계복%교간
离群数据%信息熵%离群度量因子%数据挖掘
離群數據%信息熵%離群度量因子%數據挖掘
리군수거%신식적%리군도량인자%수거알굴
离群数据挖掘是为了找出隐含在海量数据中相对稀疏而孤立的异常数据模式,但传统的离群数据挖掘方法受人为因素影响较大.通过引入基于信息熵的离群度量因子,给出一种离群数据挖掘新算法.该算法先利用信息熵计算每个数据对象的离群度量因子,然后通过离群度量因子来衡量每个对象的离群程度,进而检测离群数据,有效地消除了人为主观因素对离群检测的影响,并能很好地解释离群点的含义.最后,采用UCI和恒星光谱数据作为实验数据,通过对实验的分析,验证了该算法的可行性和有效性.
離群數據挖掘是為瞭找齣隱含在海量數據中相對稀疏而孤立的異常數據模式,但傳統的離群數據挖掘方法受人為因素影響較大.通過引入基于信息熵的離群度量因子,給齣一種離群數據挖掘新算法.該算法先利用信息熵計算每箇數據對象的離群度量因子,然後通過離群度量因子來衡量每箇對象的離群程度,進而檢測離群數據,有效地消除瞭人為主觀因素對離群檢測的影響,併能很好地解釋離群點的含義.最後,採用UCI和恆星光譜數據作為實驗數據,通過對實驗的分析,驗證瞭該算法的可行性和有效性.
리군수거알굴시위료조출은함재해량수거중상대희소이고립적이상수거모식,단전통적리군수거알굴방법수인위인소영향교대.통과인입기우신식적적리군도량인자,급출일충리군수거알굴신산법.해산법선이용신식적계산매개수거대상적리군도량인자,연후통과리군도량인자래형량매개대상적리군정도,진이검측리군수거,유효지소제료인위주관인소대리군검측적영향,병능흔호지해석리군점적함의.최후,채용UCI화항성광보수거작위실험수거,통과대실험적분석,험증료해산법적가행성화유효성.