计算机应用
計算機應用
계산궤응용
Journal of Computer Applications
2015年
10期
2808-2812
,共5页
CpG岛%DNA刚性%人类启动子识别%KL散度%单核苷酸统计%支持向量机
CpG島%DNA剛性%人類啟動子識彆%KL散度%單覈苷痠統計%支持嚮量機
CpG도%DNA강성%인류계동자식별%KL산도%단핵감산통계%지지향량궤
CpG-island%DNA rigidity%human promoter recognition%Kullback-Leibler divergence%nucleotide statistics%Support Vector Machine (SVM)
为高效地判别人类基因启动子,提出了一种基于单核苷酸统计和支持向量机集成的人类基因启动子识别算法.首先通过基因单核苷酸统计,从而将一个基因数据集分为C偏好和G偏好两个子集;然后分别对这两个子集提取DNA刚性特征、词频统计特征和CpG岛特征;最后采用多个支持向量机(SVM)集成的方式来学习这三种特征,并讨论了三种集成方式,包括单层SVM集成、双层SVM集成和级联SVM集成.实验结果表明所提算法能够提高人类基因启动子识别的敏感性和特异性,其中双层SVM集成的敏感性达到79.51%,且级联SVM集成的特异性高达84.58%.
為高效地判彆人類基因啟動子,提齣瞭一種基于單覈苷痠統計和支持嚮量機集成的人類基因啟動子識彆算法.首先通過基因單覈苷痠統計,從而將一箇基因數據集分為C偏好和G偏好兩箇子集;然後分彆對這兩箇子集提取DNA剛性特徵、詞頻統計特徵和CpG島特徵;最後採用多箇支持嚮量機(SVM)集成的方式來學習這三種特徵,併討論瞭三種集成方式,包括單層SVM集成、雙層SVM集成和級聯SVM集成.實驗結果錶明所提算法能夠提高人類基因啟動子識彆的敏感性和特異性,其中雙層SVM集成的敏感性達到79.51%,且級聯SVM集成的特異性高達84.58%.
위고효지판별인류기인계동자,제출료일충기우단핵감산통계화지지향량궤집성적인류기인계동자식별산법.수선통과기인단핵감산통계,종이장일개기인수거집분위C편호화G편호량개자집;연후분별대저량개자집제취DNA강성특정、사빈통계특정화CpG도특정;최후채용다개지지향량궤(SVM)집성적방식래학습저삼충특정,병토론료삼충집성방식,포괄단층SVM집성、쌍층SVM집성화급련SVM집성.실험결과표명소제산법능구제고인류기인계동자식별적민감성화특이성,기중쌍층SVM집성적민감성체도79.51%,차급련SVM집성적특이성고체84.58%.