生物化学与生物物理进展
生物化學與生物物理進展
생물화학여생물물리진전
PROGRESS IN BIOCHEMISTRY AND BIOPHYSICS
2007年
7期
724-731
,共8页
吴建盛%谢建明%周童%翁建洪%孙啸
吳建盛%謝建明%週童%翁建洪%孫嘯
오건성%사건명%주동%옹건홍%손소
细菌基因组%水平转移基因%支持向量机%绝对密码子使用频率
細菌基因組%水平轉移基因%支持嚮量機%絕對密碼子使用頻率
세균기인조%수평전이기인%지지향량궤%절대밀마자사용빈솔
随着各种生物基因组序列测定工作的完成,大量的DNA序列数据涌现出来,为研究在基因组中寻找水平转移基因提供了极大的便利.将基因序列特征分析和支持向量机技术结合起来,通过分析基因序列的特征差异发现水平转移基因.依据以前研究工作的基础,选取了绝对密码子使用频率(FCU)作为序列特征,主要因为它既包含了基因密码子使用偏性的信息,也包含了基因所编码蛋白的氨基酸组成信息,支持向量机利用这些信息进行水平转移基因分析和预测,可以提高预测的准确性.另外,提出了基于分链的水平转移基因预测新方法,即将细菌基因组前导链和滞后链上的基因区别对待,分别进行水平转移基因预测.结果显示,基本预测方法要优于目前预测结果最好的Tsirigos等提出的基于八联核苷酸频率的打分算法,命中率的相对提高率最高达31.47%,而基于分链的方法对水平转移基因的预测取得了更好的结果.
隨著各種生物基因組序列測定工作的完成,大量的DNA序列數據湧現齣來,為研究在基因組中尋找水平轉移基因提供瞭極大的便利.將基因序列特徵分析和支持嚮量機技術結閤起來,通過分析基因序列的特徵差異髮現水平轉移基因.依據以前研究工作的基礎,選取瞭絕對密碼子使用頻率(FCU)作為序列特徵,主要因為它既包含瞭基因密碼子使用偏性的信息,也包含瞭基因所編碼蛋白的氨基痠組成信息,支持嚮量機利用這些信息進行水平轉移基因分析和預測,可以提高預測的準確性.另外,提齣瞭基于分鏈的水平轉移基因預測新方法,即將細菌基因組前導鏈和滯後鏈上的基因區彆對待,分彆進行水平轉移基因預測.結果顯示,基本預測方法要優于目前預測結果最好的Tsirigos等提齣的基于八聯覈苷痠頻率的打分算法,命中率的相對提高率最高達31.47%,而基于分鏈的方法對水平轉移基因的預測取得瞭更好的結果.
수착각충생물기인조서렬측정공작적완성,대량적DNA서렬수거용현출래,위연구재기인조중심조수평전이기인제공료겁대적편리.장기인서렬특정분석화지지향량궤기술결합기래,통과분석기인서렬적특정차이발현수평전이기인.의거이전연구공작적기출,선취료절대밀마자사용빈솔(FCU)작위서렬특정,주요인위타기포함료기인밀마자사용편성적신식,야포함료기인소편마단백적안기산조성신식,지지향량궤이용저사신식진행수평전이기인분석화예측,가이제고예측적준학성.령외,제출료기우분련적수평전이기인예측신방법,즉장세균기인조전도련화체후련상적기인구별대대,분별진행수평전이기인예측.결과현시,기본예측방법요우우목전예측결과최호적Tsirigos등제출적기우팔련핵감산빈솔적타분산법,명중솔적상대제고솔최고체31.47%,이기우분련적방법대수평전이기인적예측취득료경호적결과.