生物信息学
生物信息學
생물신식학
BIOINFORMATICS
2009年
2期
117-119,127
,共4页
polⅡ启动子%离散增量%位置打分函数%支持向量机%贝叶斯判别函数
polⅡ啟動子%離散增量%位置打分函數%支持嚮量機%貝葉斯判彆函數
polⅡ계동자%리산증량%위치타분함수%지지향량궤%패협사판별함수
通过选取人类启动子与非启动子序列中不同的k-mer作为预测算法的基础特征,分别以三个区域(-249~-1;0~+50;-30~+30)的6-mer频数作为离散源参数构建离散增量,同时选取24个位点(-31~-21;-4~+2;+25~+29)的3-mer频数作为位置打分函数的参数,分别利用支持向量机和马氏判别式为判别函数对启动子进行预测.用10折叠交叉检验来衡量两种算法的预测能力,预测结果成功率分别达到87.0%和87.9%.对于独立检验集,敏感性分别为62.7%和76.0%,特异性分别为77.5% 和66.8%.
通過選取人類啟動子與非啟動子序列中不同的k-mer作為預測算法的基礎特徵,分彆以三箇區域(-249~-1;0~+50;-30~+30)的6-mer頻數作為離散源參數構建離散增量,同時選取24箇位點(-31~-21;-4~+2;+25~+29)的3-mer頻數作為位置打分函數的參數,分彆利用支持嚮量機和馬氏判彆式為判彆函數對啟動子進行預測.用10摺疊交扠檢驗來衡量兩種算法的預測能力,預測結果成功率分彆達到87.0%和87.9%.對于獨立檢驗集,敏感性分彆為62.7%和76.0%,特異性分彆為77.5% 和66.8%.
통과선취인류계동자여비계동자서렬중불동적k-mer작위예측산법적기출특정,분별이삼개구역(-249~-1;0~+50;-30~+30)적6-mer빈수작위리산원삼수구건리산증량,동시선취24개위점(-31~-21;-4~+2;+25~+29)적3-mer빈수작위위치타분함수적삼수,분별이용지지향량궤화마씨판별식위판별함수대계동자진행예측.용10절첩교차검험래형량량충산법적예측능력,예측결과성공솔분별체도87.0%화87.9%.대우독립검험집,민감성분별위62.7%화76.0%,특이성분별위77.5% 화66.8%.