燕山大学学报
燕山大學學報
연산대학학보
JOURNAL OF YANSHAN UNIVERSITY
2015年
1期
35-41
,共7页
蛋白质%三次样条插值%Cα坐标系%黎曼流形%结构比较
蛋白質%三次樣條插值%Cα坐標繫%黎曼流形%結構比較
단백질%삼차양조삽치%Cα좌표계%려만류형%결구비교
protein%cubic spline interpolation%caframe%Riemannian manifold%structural comparison
以NMR技术为代表的海量蛋白质空间结构数据为现代生命科学研究提供了前所未有的机遇,但后续的大数据分析却成为一大难题.充分利用已知的蛋白质三维结构信息来预测未知的蛋白质空间结构信息是研究蛋白质结构和功能关系一种重要手段.本文提出一种基于黎曼流形的蛋白质三维结构相似性比较新方法.该方法通过构建Cα坐标系和提取蛋白质结构具有旋转和平移不变性的几何特征量,将蛋白质的三维坐标序列转换为一维序列,采用黎曼距离作为三维结构相似度指标.本方法不需要对蛋白质结构做旋转和平移变换,避免了主流的RMSD方法中两蛋白质通过最小二乘拟合进行配准时产生的误差,并且完全不依赖于一级结构序列信息,对不具备序列相似性的蛋白质之间的相似性比较具有现实意义.本文分别针对不同相似度的蛋白质、Fischer提出的10个较难识别的蛋白质结构对、HOMSTRAD数据库中的700个数据这3组数据,对本文算法进行了验证.实验结果表明,与其他方法相比,本文方法的匹配精度均得到了较大提升.
以NMR技術為代錶的海量蛋白質空間結構數據為現代生命科學研究提供瞭前所未有的機遇,但後續的大數據分析卻成為一大難題.充分利用已知的蛋白質三維結構信息來預測未知的蛋白質空間結構信息是研究蛋白質結構和功能關繫一種重要手段.本文提齣一種基于黎曼流形的蛋白質三維結構相似性比較新方法.該方法通過構建Cα坐標繫和提取蛋白質結構具有鏇轉和平移不變性的幾何特徵量,將蛋白質的三維坐標序列轉換為一維序列,採用黎曼距離作為三維結構相似度指標.本方法不需要對蛋白質結構做鏇轉和平移變換,避免瞭主流的RMSD方法中兩蛋白質通過最小二乘擬閤進行配準時產生的誤差,併且完全不依賴于一級結構序列信息,對不具備序列相似性的蛋白質之間的相似性比較具有現實意義.本文分彆針對不同相似度的蛋白質、Fischer提齣的10箇較難識彆的蛋白質結構對、HOMSTRAD數據庫中的700箇數據這3組數據,對本文算法進行瞭驗證.實驗結果錶明,與其他方法相比,本文方法的匹配精度均得到瞭較大提升.
이NMR기술위대표적해량단백질공간결구수거위현대생명과학연구제공료전소미유적궤우,단후속적대수거분석각성위일대난제.충분이용이지적단백질삼유결구신식래예측미지적단백질공간결구신식시연구단백질결구화공능관계일충중요수단.본문제출일충기우려만류형적단백질삼유결구상사성비교신방법.해방법통과구건Cα좌표계화제취단백질결구구유선전화평이불변성적궤하특정량,장단백질적삼유좌표서렬전환위일유서렬,채용려만거리작위삼유결구상사도지표.본방법불수요대단백질결구주선전화평이변환,피면료주류적RMSD방법중량단백질통과최소이승의합진행배준시산생적오차,병차완전불의뢰우일급결구서렬신식,대불구비서렬상사성적단백질지간적상사성비교구유현실의의.본문분별침대불동상사도적단백질、Fischer제출적10개교난식별적단백질결구대、HOMSTRAD수거고중적700개수거저3조수거,대본문산법진행료험증.실험결과표명,여기타방법상비,본문방법적필배정도균득도료교대제승.