仪器仪表学报
儀器儀錶學報
의기의표학보
CHINESE JOURNAL OF SCIENTIFIC INSTRUMENT
2012年
12期
2742-2746
,共5页
肖应旺%杨军%张承忠%杜瑛
肖應旺%楊軍%張承忠%杜瑛
초응왕%양군%장승충%두영
改进尺度的近邻修剪%高效鲁棒离群点检测%统计监控建模%数据预处理
改進呎度的近鄰脩剪%高效魯棒離群點檢測%統計鑑控建模%數據預處理
개진척도적근린수전%고효로봉리군점검측%통계감공건모%수거예처리
基于多向主元分析(multi-way principal component analysis,MPCA)(包括主元分析(principal component analysis,PCA))的统计监控模型易受建模数据中离群点影响,将数据点的k-最近邻(k-nearest neighbor,k-NN)距离dk作为离群度指标能有效地发现非线性数据集中的离群点,但现有的基于该定义的鲁棒离群点检测算法对不同尺度的中心化和标准化方法非常敏感,且需要计算每个数据点的dk,引起巨大的计算开销.提出一种改进尺度的近邻修剪(modified scale neighborhood pruning,MSNHP)高效鲁棒离群点检测算法用于对统计监控建模数据集的预处理.该算法利用改进尺度得到离线建模正常数据的均值和标准差,并对数据进行中心化和标准化处理;在每次dk查询过程中计算出其他点的dk上界用于直接修剪非离群点,以减少dk查询的次数;并通过优化搜索次序提高修剪效果和减少每次dk查询的计算开销.将该算法应用于β-甘露聚糖酶发酵间歇过程离群点检测,与其他鲁棒离群点检测算法相比,应用结果表明该算法明显减少了计算开销,对数据集数据个数和算法参数都具有更好的伸缩性.
基于多嚮主元分析(multi-way principal component analysis,MPCA)(包括主元分析(principal component analysis,PCA))的統計鑑控模型易受建模數據中離群點影響,將數據點的k-最近鄰(k-nearest neighbor,k-NN)距離dk作為離群度指標能有效地髮現非線性數據集中的離群點,但現有的基于該定義的魯棒離群點檢測算法對不同呎度的中心化和標準化方法非常敏感,且需要計算每箇數據點的dk,引起巨大的計算開銷.提齣一種改進呎度的近鄰脩剪(modified scale neighborhood pruning,MSNHP)高效魯棒離群點檢測算法用于對統計鑑控建模數據集的預處理.該算法利用改進呎度得到離線建模正常數據的均值和標準差,併對數據進行中心化和標準化處理;在每次dk查詢過程中計算齣其他點的dk上界用于直接脩剪非離群點,以減少dk查詢的次數;併通過優化搜索次序提高脩剪效果和減少每次dk查詢的計算開銷.將該算法應用于β-甘露聚糖酶髮酵間歇過程離群點檢測,與其他魯棒離群點檢測算法相比,應用結果錶明該算法明顯減少瞭計算開銷,對數據集數據箇數和算法參數都具有更好的伸縮性.
기우다향주원분석(multi-way principal component analysis,MPCA)(포괄주원분석(principal component analysis,PCA))적통계감공모형역수건모수거중리군점영향,장수거점적k-최근린(k-nearest neighbor,k-NN)거리dk작위리군도지표능유효지발현비선성수거집중적리군점,단현유적기우해정의적로봉리군점검측산법대불동척도적중심화화표준화방법비상민감,차수요계산매개수거점적dk,인기거대적계산개소.제출일충개진척도적근린수전(modified scale neighborhood pruning,MSNHP)고효로봉리군점검측산법용우대통계감공건모수거집적예처리.해산법이용개진척도득도리선건모정상수거적균치화표준차,병대수거진행중심화화표준화처리;재매차dk사순과정중계산출기타점적dk상계용우직접수전비리군점,이감소dk사순적차수;병통과우화수색차서제고수전효과화감소매차dk사순적계산개소.장해산법응용우β-감로취당매발효간헐과정리군점검측,여기타로봉리군점검측산법상비,응용결과표명해산법명현감소료계산개소,대수거집수거개수화산법삼수도구유경호적신축성.