光谱学与光谱分析
光譜學與光譜分析
광보학여광보분석
SPECTROSCOPY AND SPECTRAL ANALYSIS
2014年
1期
267-273
,共7页
流形学习算法%Isomap算法%主成分分析%数据挖掘
流形學習算法%Isomap算法%主成分分析%數據挖掘
류형학습산법%Isomap산법%주성분분석%수거알굴
Manifold learning algorithm%Isomap algorithm%PCA%Data mining
如何从已分类的海量光谱中发现被错分的光谱一直是天文数据处理专家重点研究的问题,探讨的Isomap算法在该问题方面有很好的表现。通过Isomap算法与主成分分析方法(PCA )算法的实验结果对比发现:(1)PCA将具有不同特征的光谱投影到邻近的区域,而Isomap算法却可以将具有相似特征的光谱投影到邻近区域,而将具有不同特征的光谱投影到相距较远的区域;(2)Isomap算法给出的大部分离群点较易判断,且是具有很高科学价值的双星;而PCA给出的离群点难以判断,科学价值不高。因此,在光谱离群点发掘上Isomap算法比PCA有明显优势。由于使用的数据为SDSS最新发布的M 型的九种光谱次型的光谱,因而Isomap算法能够快速发现被斯隆数字巡天数据处理流程(SDSS pipeline)错分的光谱,可帮助有效提高现有光谱分类算法的准确率。更进一步,由于被SDSS pipeline错分的光谱大部分是双星,因而Isomap算法还可以进一步帮助我们发现有很高科学研究价值的双星,提高双星的发现效率。虽然实验显示Isomap算法对信噪比变化较为敏感,在具有较低信噪比的光谱上表现较差,但由于信噪比低的光谱的光谱型难以判断,因而该缺点并不影响Isomap算法的在光谱发掘上的应用。
如何從已分類的海量光譜中髮現被錯分的光譜一直是天文數據處理專傢重點研究的問題,探討的Isomap算法在該問題方麵有很好的錶現。通過Isomap算法與主成分分析方法(PCA )算法的實驗結果對比髮現:(1)PCA將具有不同特徵的光譜投影到鄰近的區域,而Isomap算法卻可以將具有相似特徵的光譜投影到鄰近區域,而將具有不同特徵的光譜投影到相距較遠的區域;(2)Isomap算法給齣的大部分離群點較易判斷,且是具有很高科學價值的雙星;而PCA給齣的離群點難以判斷,科學價值不高。因此,在光譜離群點髮掘上Isomap算法比PCA有明顯優勢。由于使用的數據為SDSS最新髮佈的M 型的九種光譜次型的光譜,因而Isomap算法能夠快速髮現被斯隆數字巡天數據處理流程(SDSS pipeline)錯分的光譜,可幫助有效提高現有光譜分類算法的準確率。更進一步,由于被SDSS pipeline錯分的光譜大部分是雙星,因而Isomap算法還可以進一步幫助我們髮現有很高科學研究價值的雙星,提高雙星的髮現效率。雖然實驗顯示Isomap算法對信譟比變化較為敏感,在具有較低信譟比的光譜上錶現較差,但由于信譟比低的光譜的光譜型難以判斷,因而該缺點併不影響Isomap算法的在光譜髮掘上的應用。
여하종이분류적해량광보중발현피착분적광보일직시천문수거처리전가중점연구적문제,탐토적Isomap산법재해문제방면유흔호적표현。통과Isomap산법여주성분분석방법(PCA )산법적실험결과대비발현:(1)PCA장구유불동특정적광보투영도린근적구역,이Isomap산법각가이장구유상사특정적광보투영도린근구역,이장구유불동특정적광보투영도상거교원적구역;(2)Isomap산법급출적대부분리군점교역판단,차시구유흔고과학개치적쌍성;이PCA급출적리군점난이판단,과학개치불고。인차,재광보리군점발굴상Isomap산법비PCA유명현우세。유우사용적수거위SDSS최신발포적M 형적구충광보차형적광보,인이Isomap산법능구쾌속발현피사륭수자순천수거처리류정(SDSS pipeline)착분적광보,가방조유효제고현유광보분류산법적준학솔。경진일보,유우피SDSS pipeline착분적광보대부분시쌍성,인이Isomap산법환가이진일보방조아문발현유흔고과학연구개치적쌍성,제고쌍성적발현효솔。수연실험현시Isomap산법대신조비변화교위민감,재구유교저신조비적광보상표현교차,단유우신조비저적광보적광보형난이판단,인이해결점병불영향Isomap산법적재광보발굴상적응용。
How to find the spectra misclassified by traditional methods is the key problem that has been widely studied by the ex-perts of astronomical data processing .We found that Isomap algorithm performs well for this problem .By comparing the per-formance of Isomap with that of principal component analysis (PCA) ,we found that (1) Isomap can project the spectra with similar features together and project the spectra with different features far away ,while PCA may project the spectra with differ-ent features into nearby regions ;(2) the outliers given by Isomap can be easily determined ,and most of the outliers are binary stars with high scientific values ;while the outliers given by PCA are difficult to determine and most of outliers are not binary stars .Thus ,Isomap is more efficient than PCA in finding the outliers .Since the spectral data used in experiment are the spectra from the ninth data release of Sloan Digital Sky Survey (SDSS DR9) ,Isomap can find the spectra misclassified by SDSS pipeline efficiently and improve the classification accuracy obviously .Furthermore ,since most of the spectra misclassified by SDSS pipe-line are binary stars ,Isomap can improve the efficiency of finding the binary stars with high scientific values .Though the experi-ment results show that Isomap is more sensitive to the noise than PCA ,this disadvantage will not affect the application of Isomap in spectral classification since most of the spectra with low signal-to-noise ratios are the spectra whose spectral type can't be de-termined manually .