生物化学与生物物理进展
生物化學與生物物理進展
생물화학여생물물리진전
PROGRESS IN BIOCHEMISTRY AND BIOPHYSICS
2004年
5期
455-458
,共4页
冯秀程%钱敏平%邓明华%马小土%严熙婷
馮秀程%錢敏平%鄧明華%馬小土%嚴熙婷
풍수정%전민평%산명화%마소토%엄희정
隐半马氏模型%剪接%真核生物基因结构预测%EM算法
隱半馬氏模型%剪接%真覈生物基因結構預測%EM算法
은반마씨모형%전접%진핵생물기인결구예측%EM산법
Hidden Semi-Markov Model%splicing%eukaryotic gene structure prediction%EM algorithm
新近的基因识别软件比先前的软件有着显著的提高,但是在外显子水平上的敏感性和特异性仍然不十分令人满意.这是因为已有软件对于剪接位点,翻译起始等生物信号位点的识别还不够有效.如果能够分别提高这些生物信号位点的识别效果,就能够提高整体的基因识别效率.隐半马氏模型能够很好地刻画3'剪接位点(acceptor)的结构.据此开发的一套对acceptor进行识别的算法在Burset/Guigo的数据集上经过检验,获得了比已有算法更好的识别率.该模型的成功还使得我们对剪接点上游的分支位点和嘧啶富含区的概貌有了一定的认识,加深了人们对于acceptor的结构和剪接过程的理解.
新近的基因識彆軟件比先前的軟件有著顯著的提高,但是在外顯子水平上的敏感性和特異性仍然不十分令人滿意.這是因為已有軟件對于剪接位點,翻譯起始等生物信號位點的識彆還不夠有效.如果能夠分彆提高這些生物信號位點的識彆效果,就能夠提高整體的基因識彆效率.隱半馬氏模型能夠很好地刻畫3'剪接位點(acceptor)的結構.據此開髮的一套對acceptor進行識彆的算法在Burset/Guigo的數據集上經過檢驗,穫得瞭比已有算法更好的識彆率.該模型的成功還使得我們對剪接點上遊的分支位點和嘧啶富含區的概貌有瞭一定的認識,加深瞭人們對于acceptor的結構和剪接過程的理解.
신근적기인식별연건비선전적연건유착현저적제고,단시재외현자수평상적민감성화특이성잉연불십분령인만의.저시인위이유연건대우전접위점,번역기시등생물신호위점적식별환불구유효.여과능구분별제고저사생물신호위점적식별효과,취능구제고정체적기인식별효솔.은반마씨모형능구흔호지각화3'전접위점(acceptor)적결구.거차개발적일투대acceptor진행식별적산법재Burset/Guigo적수거집상경과검험,획득료비이유산법경호적식별솔.해모형적성공환사득아문대전접점상유적분지위점화밀정부함구적개모유료일정적인식,가심료인문대우acceptor적결구화전접과정적리해.
In order to improve exon level sensitivity and specificity of recent gene-finding programs, strong "search by signal" components are needed to identify splice sites, translation start and other biological signal sites. A new model for the identification of 3' splice sites (acceptors) using Hidden Semi-Markov Model (HSMM) was introduced. This model is proved to be particularly suitable for modeling the biological structure of acceptors. When tested in Burset/Guigo dataset,this new method demonstrated an improved accuracy compared with existing method. The success of this model gives a deep understanding of the structure of acceptors and the biological process of splicing.