南京大学学报(自然科学版)
南京大學學報(自然科學版)
남경대학학보(자연과학판)
JOURNAL OF NANJING UNIVERSITY(NATURAL SCIENCES)
2015年
1期
118-124
,共7页
模式识别%特征抽取%维数约减%多重集典型相关分析%分数阶
模式識彆%特徵抽取%維數約減%多重集典型相關分析%分數階
모식식별%특정추취%유수약감%다중집전형상관분석%분수계
pattern recognition%feature extraction%dimensionality reduction%multiset canonical correlation analysis%fractional-order embedding
随着数据处理方式以及描述角度的不同,同一模式总是能够获得多种不同的特征表示。由于这些特征表示总是反映了同一模式的不同特性或视角,因此,对其进行有效地抽取与融合后,不仅可以保留参与抽取的多组特征的有效鉴别信息,还可以在一定程度上消除特征间的冗余信息,降低识别算法的复杂度,对模式分类来说无疑具有重要的实际意义。由于传统的维数约减方法,如主成分分析(PCA)与线性鉴别分析(LDA),主要针对模式的一组特征进行处理,并不适合对多表示数据进行融合与特征抽取,因此,本文以多表示数据为研究对象,深入研究了多重集典型相关分析的相关理论与算法,采用分数阶思想对组内与组间样本协方差的特征值和奇异值进行重新估计,然后建立分数阶组内与组间散布矩阵,同时引入监督信息,构建了分数阶嵌入的多重集典型相关分析(FEGMCCA)理论框架。
隨著數據處理方式以及描述角度的不同,同一模式總是能夠穫得多種不同的特徵錶示。由于這些特徵錶示總是反映瞭同一模式的不同特性或視角,因此,對其進行有效地抽取與融閤後,不僅可以保留參與抽取的多組特徵的有效鑒彆信息,還可以在一定程度上消除特徵間的冗餘信息,降低識彆算法的複雜度,對模式分類來說無疑具有重要的實際意義。由于傳統的維數約減方法,如主成分分析(PCA)與線性鑒彆分析(LDA),主要針對模式的一組特徵進行處理,併不適閤對多錶示數據進行融閤與特徵抽取,因此,本文以多錶示數據為研究對象,深入研究瞭多重集典型相關分析的相關理論與算法,採用分數階思想對組內與組間樣本協方差的特徵值和奇異值進行重新估計,然後建立分數階組內與組間散佈矩陣,同時引入鑑督信息,構建瞭分數階嵌入的多重集典型相關分析(FEGMCCA)理論框架。
수착수거처리방식이급묘술각도적불동,동일모식총시능구획득다충불동적특정표시。유우저사특정표시총시반영료동일모식적불동특성혹시각,인차,대기진행유효지추취여융합후,불부가이보류삼여추취적다조특정적유효감별신식,환가이재일정정도상소제특정간적용여신식,강저식별산법적복잡도,대모식분류래설무의구유중요적실제의의。유우전통적유수약감방법,여주성분분석(PCA)여선성감별분석(LDA),주요침대모식적일조특정진행처리,병불괄합대다표시수거진행융합여특정추취,인차,본문이다표시수거위연구대상,심입연구료다중집전형상관분석적상관이론여산법,채용분수계사상대조내여조간양본협방차적특정치화기이치진행중신고계,연후건립분수계조내여조간산포구진,동시인입감독신식,구건료분수계감입적다중집전형상관분석(FEGMCCA)이론광가。
Due to different data processing and descriptions,the same obj ects usually have multiple representations from different spaces(views).These multiple representations could be not only from different feature vector spaces, but also from different graph spaces.Since multiple feature representations always reflect different characteristics or views of the same patterns,extracting features from them can not only obtain the effectively discriminative information,but also eliminate the redundant information to a certain extent in each feature representation. Furthermore,the complexity of classifiers can be reduced much by using these extracted features.Therefore,the feature extraction of multi-representation data is undoubtablely a very necessary and fundamental problem for recognition tasks.Since traditional feature extraction or dimensionality reduction methods,e.g.,principle component analysis(PCA)and linear discriminant analysis(LDA),etc.,are mainly based on single representation data,they are not suitable to be applied to the feature extraction of multi-representation data.In this dissertation,we focus on studying this problem based multiset canonical correlation analysis(MCCA).We use the idea of fractional order to respectively correct the eigenvalues and singular values in the corresponding sample covariance matrices,and then construct fractional-order within-set and between-set scatter matrices which can obviously alleviate the problem of the deviation.On this basis,we introduce supervision information and a new approach is proposed called fractional-order embedding generalized multiset canonical correlation analysis(FEGMCCA).