小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2010年
3期
404-407
,共4页
于长永%王国仁%毛克明%翟文丹
于長永%王國仁%毛剋明%翟文丹
우장영%왕국인%모극명%적문단
蛋白质鉴定%串联质谱%数据库搜索%匹配打分
蛋白質鑒定%串聯質譜%數據庫搜索%匹配打分
단백질감정%천련질보%수거고수색%필배타분
protein identification%mass spectra%database search%match scoring
为了有效的利用蛋白质串联质谱数据,提高蛋白质鉴定的准确性,提出一种基于KNN的蛋白质序列与蛋白质串联质谱的匹配打分算法.蛋白质序列与蛋白质串联质谱的匹配打分是蛋白质数据库搜索鉴定过程中的关键技术.然而,现有的算法没有很好的利用蛋白质串联质谱中离子的强度信息.针对此问题,本文根据质谱中离子的类型给出了全体离子的一个合理的划分.进而抽象出一个高维的强度特征向量,在已知的高精度的数据集上建立了强度匹配知识集合,最后基于KNN技术构造了序列和质谱的匹配打分算法.实验结果表明,本文算法更加有效的利用了蛋白质串联质谱的结构信息,提高了蛋白质鉴定的准确性.
為瞭有效的利用蛋白質串聯質譜數據,提高蛋白質鑒定的準確性,提齣一種基于KNN的蛋白質序列與蛋白質串聯質譜的匹配打分算法.蛋白質序列與蛋白質串聯質譜的匹配打分是蛋白質數據庫搜索鑒定過程中的關鍵技術.然而,現有的算法沒有很好的利用蛋白質串聯質譜中離子的彊度信息.針對此問題,本文根據質譜中離子的類型給齣瞭全體離子的一箇閤理的劃分.進而抽象齣一箇高維的彊度特徵嚮量,在已知的高精度的數據集上建立瞭彊度匹配知識集閤,最後基于KNN技術構造瞭序列和質譜的匹配打分算法.實驗結果錶明,本文算法更加有效的利用瞭蛋白質串聯質譜的結構信息,提高瞭蛋白質鑒定的準確性.
위료유효적이용단백질천련질보수거,제고단백질감정적준학성,제출일충기우KNN적단백질서렬여단백질천련질보적필배타분산법.단백질서렬여단백질천련질보적필배타분시단백질수거고수색감정과정중적관건기술.연이,현유적산법몰유흔호적이용단백질천련질보중리자적강도신식.침대차문제,본문근거질보중리자적류형급출료전체리자적일개합리적화분.진이추상출일개고유적강도특정향량,재이지적고정도적수거집상건립료강도필배지식집합,최후기우KNN기술구조료서렬화질보적필배타분산법.실험결과표명,본문산법경가유효적이용료단백질천련질보적결구신식,제고료단백질감정적준학성.
A scoring approach is proposed for protein identification which evaluates the matching between protein sequence and protein tandem mass spectra based on KNN technology in a database search sketch.The scoring method between protein sequence and spectrum has been the key technique for protein identification in database search approaches.However,the available approaches do not make the best use of the intensity information of the ions in the spectrum.Focusing on this problem,we propose a method making use of the intensity information to improve the accuracy of the protein identification.A high-dimensional vector is extracted based on the total intensity of the same kind of ions in the spectrum and a KNN based scoring method is proposed.Experimental results showed that the proposed approach can effectively improve the accuracy of protein identification.