光谱学与光谱分析
光譜學與光譜分析
광보학여광보분석
SPECTROSCOPY AND SPECTRAL ANALYSIS
2014年
8期
2070-2075
,共6页
贾生尧%唐旭%杨祥龙%李光%张建明
賈生堯%唐旭%楊祥龍%李光%張建明
가생요%당욱%양상룡%리광%장건명
可见近红外光谱%土壤全氮%有机质%递归偏最小二乘%递归变量选择
可見近紅外光譜%土壤全氮%有機質%遞歸偏最小二乘%遞歸變量選擇
가견근홍외광보%토양전담%유궤질%체귀편최소이승%체귀변량선택
Visible and near-infrared spectroscopy%Soil total nitrogen%Organic matter,Recursive partial least squares%Recur-sive variable selection
应用可见-近红外光谱技术进行定量分析时,变量选择起着十分重要的作用。不同土壤样品之间的预测机制可能存在很大差异,当待测样品出现新的特征信息时,基于建模集选择的特征变量不一定能够很好地代表待测样品的有效信息,继续采用原有特征变量建模就易导致预测误差增大。该研究采用递归变量选择方法在预测过程中递归更新土壤全氮与有机质的特征变量,以保持预测模型的鲁棒性;比较了偏最小二乘法(PLS),递归偏最小二乘法(RPLS)和不同递归变量选择方法,如:变量投影重要性与 RPLS 相结合(VIP-RPLS),VIP-RPLS,无信息变量消除法与PLS相结合(UVE-PLS)对于土壤全氮与有机质含量的预测效果。所用195份土壤样品来自浙江省文成县8个乡镇的农田。土壤样品随机分成两部分,一部分作为建模集包含120份样品,另一部分作为预测集包含75份样品。结果表明:VIP-RPLS建立的模型对于预测土壤全氮与有机质含量取得了最优的结果,获得的决定系数(R2)分别为0.85与0.86,获得的预测相对分析误差(RPD)分别为2.6%与2.7%。说明VIP-RPLS通过不断更新模型的特征变量,能够捕获新加入到建模集样品的有效信息。相比于本研究中的其他方法,VIP-RPLS对于土壤全氮与有机质含量具有更高的预测精度。
應用可見-近紅外光譜技術進行定量分析時,變量選擇起著十分重要的作用。不同土壤樣品之間的預測機製可能存在很大差異,噹待測樣品齣現新的特徵信息時,基于建模集選擇的特徵變量不一定能夠很好地代錶待測樣品的有效信息,繼續採用原有特徵變量建模就易導緻預測誤差增大。該研究採用遞歸變量選擇方法在預測過程中遞歸更新土壤全氮與有機質的特徵變量,以保持預測模型的魯棒性;比較瞭偏最小二乘法(PLS),遞歸偏最小二乘法(RPLS)和不同遞歸變量選擇方法,如:變量投影重要性與 RPLS 相結閤(VIP-RPLS),VIP-RPLS,無信息變量消除法與PLS相結閤(UVE-PLS)對于土壤全氮與有機質含量的預測效果。所用195份土壤樣品來自浙江省文成縣8箇鄉鎮的農田。土壤樣品隨機分成兩部分,一部分作為建模集包含120份樣品,另一部分作為預測集包含75份樣品。結果錶明:VIP-RPLS建立的模型對于預測土壤全氮與有機質含量取得瞭最優的結果,穫得的決定繫數(R2)分彆為0.85與0.86,穫得的預測相對分析誤差(RPD)分彆為2.6%與2.7%。說明VIP-RPLS通過不斷更新模型的特徵變量,能夠捕穫新加入到建模集樣品的有效信息。相比于本研究中的其他方法,VIP-RPLS對于土壤全氮與有機質含量具有更高的預測精度。
응용가견-근홍외광보기술진행정량분석시,변량선택기착십분중요적작용。불동토양양품지간적예측궤제가능존재흔대차이,당대측양품출현신적특정신식시,기우건모집선택적특정변량불일정능구흔호지대표대측양품적유효신식,계속채용원유특정변량건모취역도치예측오차증대。해연구채용체귀변량선택방법재예측과정중체귀경신토양전담여유궤질적특정변량,이보지예측모형적로봉성;비교료편최소이승법(PLS),체귀편최소이승법(RPLS)화불동체귀변량선택방법,여:변량투영중요성여 RPLS 상결합(VIP-RPLS),VIP-RPLS,무신식변량소제법여PLS상결합(UVE-PLS)대우토양전담여유궤질함량적예측효과。소용195빈토양양품래자절강성문성현8개향진적농전。토양양품수궤분성량부분,일부분작위건모집포함120빈양품,령일부분작위예측집포함75빈양품。결과표명:VIP-RPLS건립적모형대우예측토양전담여유궤질함량취득료최우적결과,획득적결정계수(R2)분별위0.85여0.86,획득적예측상대분석오차(RPD)분별위2.6%여2.7%。설명VIP-RPLS통과불단경신모형적특정변량,능구포획신가입도건모집양품적유효신식。상비우본연구중적기타방법,VIP-RPLS대우토양전담여유궤질함량구유경고적예측정도。
In the present work,recursive variable selection methods (updating both the model coefficients and effective variables during the prediction process)were applied to maintain the predictive abilities of calibration models.This work compared the performances of partial least squares (PLS),recursive PLS (RPLS)and three recursive variable selection methods,namely vari-able importance in the projection combined with RPLS (VIP-RPLS),VIP-PLS,and uninformative variable elimination combined with PLS (UVE-PLS)for the measurement of soil total nitrogen (TN)and organic matter (OM)using Vis-NIR spectroscopy. The dataset consisted of 195 soil samples collected from eight towns in Wencheng County,Zhejiang Province,China.The entire data set was split randomly into calibration set and prediction set.The calibration set was composed of 120 samples,while the prediction set included 75 samples.The best prediction results were obtained by the VIP-RPLS model.The coefficient of deter-mination (R2 )and residual prediction deviation (RPD)were respectively 0. 85,0. 86 and 2. 6%,2. 7% for soil TN and OM. The results indicate that VIP-RPLS is able to capture the effective information from the latest modeling sample by recursively up-dating the effective variables.The proposed method VIP-RPLS has the advantages of better performance for Vis-NIR prediction of soil N and OM compared with other methods in this work.