计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2014年
1期
24-28
,共5页
李宝强%李翠萍%张琳%郭春涛%张众垚%孔景临
李寶彊%李翠萍%張琳%郭春濤%張衆垚%孔景臨
리보강%리취평%장림%곽춘도%장음요%공경림
谱图检索%相似度计算%加权点积%分段加权
譜圖檢索%相似度計算%加權點積%分段加權
보도검색%상사도계산%가권점적%분단가권
spectrum searching%similarity calculation%weighted dot-product%segment weight
针对信噪比较低或因噪声干扰造成的谱图质量较差时,传统加权点积方法由于不能有效利用谱峰分布规律和不同质量区间谱峰在谱图识别中的作用而易出现相似度较低、假阳性或假阴性等问题,提出了基于分段加权的点积相似度方法.首先利用谱峰的分布规律合理地确定各个质量区间的范围,依据不同的质量区间在谱图识别中的作用设置不同的质量数(mass/z)权重值和丰度权重值,然后按赋予的权重值计算谱图相似度,以甲基磷酸二甲酯谱图为例研究了合理确定各分段权重的方法.采用该方法在NIST08标准参考谱库(191 000张谱图)中检索1000多张谱图的准确性实验表明,与传统加权点积方法相比谱图识别的准确度提高了16.2%;通过质谱仪得到样品的实测谱图在参考谱库中检索结果表明,该方法能有效提高谱图匹配的相似度和准确度,与传统加强点积方法相比,不同浓度的八氟奈谱图相似度平均提高了2.3%;采用该方法处理同分异构体化合物,如邻二甲苯数据时,提高了相似化合物的选择性.
針對信譟比較低或因譟聲榦擾造成的譜圖質量較差時,傳統加權點積方法由于不能有效利用譜峰分佈規律和不同質量區間譜峰在譜圖識彆中的作用而易齣現相似度較低、假暘性或假陰性等問題,提齣瞭基于分段加權的點積相似度方法.首先利用譜峰的分佈規律閤理地確定各箇質量區間的範圍,依據不同的質量區間在譜圖識彆中的作用設置不同的質量數(mass/z)權重值和豐度權重值,然後按賦予的權重值計算譜圖相似度,以甲基燐痠二甲酯譜圖為例研究瞭閤理確定各分段權重的方法.採用該方法在NIST08標準參攷譜庫(191 000張譜圖)中檢索1000多張譜圖的準確性實驗錶明,與傳統加權點積方法相比譜圖識彆的準確度提高瞭16.2%;通過質譜儀得到樣品的實測譜圖在參攷譜庫中檢索結果錶明,該方法能有效提高譜圖匹配的相似度和準確度,與傳統加彊點積方法相比,不同濃度的八氟奈譜圖相似度平均提高瞭2.3%;採用該方法處理同分異構體化閤物,如鄰二甲苯數據時,提高瞭相似化閤物的選擇性.
침대신조비교저혹인조성간우조성적보도질량교차시,전통가권점적방법유우불능유효이용보봉분포규률화불동질량구간보봉재보도식별중적작용이역출현상사도교저、가양성혹가음성등문제,제출료기우분단가권적점적상사도방법.수선이용보봉적분포규률합리지학정각개질량구간적범위,의거불동적질량구간재보도식별중적작용설치불동적질량수(mass/z)권중치화봉도권중치,연후안부여적권중치계산보도상사도,이갑기린산이갑지보도위례연구료합리학정각분단권중적방법.채용해방법재NIST08표준삼고보고(191 000장보도)중검색1000다장보도적준학성실험표명,여전통가권점적방법상비보도식별적준학도제고료16.2%;통과질보의득도양품적실측보도재삼고보고중검색결과표명,해방법능유효제고보도필배적상사도화준학도,여전통가강점적방법상비,불동농도적팔불내보도상사도평균제고료2.3%;채용해방법처리동분이구체화합물,여린이갑분수거시,제고료상사화합물적선택성.