光谱学与光谱分析
光譜學與光譜分析
광보학여광보분석
SPECTROSCOPY AND SPECTRAL ANALYSIS
2015年
4期
1103-1106
,共4页
屠良平%魏会明%王志衡%韦鹏%罗阿理%赵永恒
屠良平%魏會明%王誌衡%韋鵬%囉阿理%趙永恆
도량평%위회명%왕지형%위붕%라아리%조영항
光谱分类%K-近邻%近质心近邻%K-近质心近邻
光譜分類%K-近鄰%近質心近鄰%K-近質心近鄰
광보분류%K-근린%근질심근린%K-근질심근린
Spectra classification%K-nearest neighbor%Nearest centroid neighborhood%K-nearest centroid neighbor
天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如SDSS ,LAMOST等)使我们获得了海量的天文光谱数据,因此天文光谱数据的自动分类成为重要的科学研究课题,然而面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不适用,迫切需要寻找高效率的光谱自动分类技术。研究了基于局部均值的 K‐近质心近邻(local mean‐based K‐nearest centroid neighbor , LMKNCN)算法在恒星(Star)、星系(Galaxy)和类星体(Quasar ,QSO)的光谱分类中的应用。LMKNCN算法的基本思想是根据近质心近邻原则,从每一类训练样本集中为待测样本点选取 k个近质心近邻点,然后根据每一类中所选取的 k个近质心近邻点的均值点到待测样本点 x的距离来判别 x 的所属类别。针对美国SDSS‐DR8的天体光谱数据,对比了 K‐近邻、K‐近质心近邻、LMKNCN三种算法在恒星、星系和类星体的光谱分类中所表现的性能,结果表明三种方法中,LMKNCN算法对这三种光谱的识别率高于其他两种算法或者与其相当,而且其平均分类正确率高于另外两种算法,特别是在类星体的识别率上表现的更好。表明了该算法对天文光谱大数据的快速处理和有效利用具有重要的意义。
天體光譜包含著許多重要的關于天體的物理和化學信息,如天體錶麵的有效溫度、重力加速度以及化學豐度等,天體光譜的處理和分析對天文研究具有重要的科學意義。一些大型巡天計劃的實施(如SDSS ,LAMOST等)使我們穫得瞭海量的天文光譜數據,因此天文光譜數據的自動分類成為重要的科學研究課題,然而麵對如此海量的光譜數據,一些傳統的光譜自動分類方法已經不適用,迫切需要尋找高效率的光譜自動分類技術。研究瞭基于跼部均值的 K‐近質心近鄰(local mean‐based K‐nearest centroid neighbor , LMKNCN)算法在恆星(Star)、星繫(Galaxy)和類星體(Quasar ,QSO)的光譜分類中的應用。LMKNCN算法的基本思想是根據近質心近鄰原則,從每一類訓練樣本集中為待測樣本點選取 k箇近質心近鄰點,然後根據每一類中所選取的 k箇近質心近鄰點的均值點到待測樣本點 x的距離來判彆 x 的所屬類彆。針對美國SDSS‐DR8的天體光譜數據,對比瞭 K‐近鄰、K‐近質心近鄰、LMKNCN三種算法在恆星、星繫和類星體的光譜分類中所錶現的性能,結果錶明三種方法中,LMKNCN算法對這三種光譜的識彆率高于其他兩種算法或者與其相噹,而且其平均分類正確率高于另外兩種算法,特彆是在類星體的識彆率上錶現的更好。錶明瞭該算法對天文光譜大數據的快速處理和有效利用具有重要的意義。
천체광보포함착허다중요적관우천체적물리화화학신식,여천체표면적유효온도、중력가속도이급화학봉도등,천체광보적처리화분석대천문연구구유중요적과학의의。일사대형순천계화적실시(여SDSS ,LAMOST등)사아문획득료해량적천문광보수거,인차천문광보수거적자동분류성위중요적과학연구과제,연이면대여차해량적광보수거,일사전통적광보자동분류방법이경불괄용,박절수요심조고효솔적광보자동분류기술。연구료기우국부균치적 K‐근질심근린(local mean‐based K‐nearest centroid neighbor , LMKNCN)산법재항성(Star)、성계(Galaxy)화류성체(Quasar ,QSO)적광보분류중적응용。LMKNCN산법적기본사상시근거근질심근린원칙,종매일류훈련양본집중위대측양본점선취 k개근질심근린점,연후근거매일류중소선취적 k개근질심근린점적균치점도대측양본점 x적거리래판별 x 적소속유별。침대미국SDSS‐DR8적천체광보수거,대비료 K‐근린、K‐근질심근린、LMKNCN삼충산법재항성、성계화류성체적광보분류중소표현적성능,결과표명삼충방법중,LMKNCN산법대저삼충광보적식별솔고우기타량충산법혹자여기상당,이차기평균분류정학솔고우령외량충산법,특별시재류성체적식별솔상표현적경호。표명료해산법대천문광보대수거적쾌속처리화유효이용구유중요적의의。
In the present paper ,a local mean‐based K‐nearest centroid neighbor (LMKNCN) technique is used for the classifica‐tion of stars ,galaxies and quasars(QSOS) .The main idea of LMKNCN is that it depends on the principle of the nearest centroid neighborhood(NCN) ,and selects K centroid neighbors of each class as training samples and then classifies a query pattern into the class with the distance of the local centroid mean vector to the samples .In this paper ,KNN ,KNCN and LMKNCN were experimentally compared with these three different kinds of spectra data which are from the United States SDSS‐DR8 .Among these three methods ,the rate of correct classification of the LMKNCN algorithm is higher than the other two algorithms or com‐parable and the average rate of correct classification is higher than the other two algorithms ,especially for the identification of quasars .Experiment shows that the results in this work have important significance for studying galaxies ,stars and quasars spectra classification .