计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2012年
7期
1429-1439
,共11页
霍红卫%郭丹丹%于强%张懿璞%牛伟
霍紅衛%郭丹丹%于彊%張懿璞%牛偉
곽홍위%곽단단%우강%장의박%우위
模体识别%遗传算法%贝叶斯模型%散列%投影
模體識彆%遺傳算法%貝葉斯模型%散列%投影
모체식별%유전산법%패협사모형%산렬%투영
转录因子结合位点识别在基因表达调控过程中起着重要的作用.文中提出了一种贝叶斯模型驱动的模体识别的遗传优化算法GOBMD(Genetic Optimization with Bayesian Model for Motif Discovery).GOBMD首先使用一个基于位置加权散列的投影过程,将输入序列中的l -mers投影到k维(k<l)子空间,找出DNA序列中的起始良好候选模体,作为遗传算法的初始群体,以进一步求精.在遗传迭代过程中,采用结合贝叶斯模型的适应度函数指导进化过程.模拟数据的实验结果表明,与Gibbs、WINNOWER、SP-STAR、PROJECTION这些模体识别算法相比,GOBMD在对植入(l,d)-模体识别时有较好的性能,能够解决大部分挑战性的植入(l,d)-模体识别问题.此外,作者用Boxplot显示了上述模体识别算法在模拟数据识别上的性能系数分布,结果表明GOBMD具有较好的效率.针对真实生物序列的实验结果同样表明了GOBMD算法的有效性.
轉錄因子結閤位點識彆在基因錶達調控過程中起著重要的作用.文中提齣瞭一種貝葉斯模型驅動的模體識彆的遺傳優化算法GOBMD(Genetic Optimization with Bayesian Model for Motif Discovery).GOBMD首先使用一箇基于位置加權散列的投影過程,將輸入序列中的l -mers投影到k維(k<l)子空間,找齣DNA序列中的起始良好候選模體,作為遺傳算法的初始群體,以進一步求精.在遺傳迭代過程中,採用結閤貝葉斯模型的適應度函數指導進化過程.模擬數據的實驗結果錶明,與Gibbs、WINNOWER、SP-STAR、PROJECTION這些模體識彆算法相比,GOBMD在對植入(l,d)-模體識彆時有較好的性能,能夠解決大部分挑戰性的植入(l,d)-模體識彆問題.此外,作者用Boxplot顯示瞭上述模體識彆算法在模擬數據識彆上的性能繫數分佈,結果錶明GOBMD具有較好的效率.針對真實生物序列的實驗結果同樣錶明瞭GOBMD算法的有效性.
전록인자결합위점식별재기인표체조공과정중기착중요적작용.문중제출료일충패협사모형구동적모체식별적유전우화산법GOBMD(Genetic Optimization with Bayesian Model for Motif Discovery).GOBMD수선사용일개기우위치가권산렬적투영과정,장수입서렬중적l -mers투영도k유(k<l)자공간,조출DNA서렬중적기시량호후선모체,작위유전산법적초시군체,이진일보구정.재유전질대과정중,채용결합패협사모형적괄응도함수지도진화과정.모의수거적실험결과표명,여Gibbs、WINNOWER、SP-STAR、PROJECTION저사모체식별산법상비,GOBMD재대식입(l,d)-모체식별시유교호적성능,능구해결대부분도전성적식입(l,d)-모체식별문제.차외,작자용Boxplot현시료상술모체식별산법재모의수거식별상적성능계수분포,결과표명GOBMD구유교호적효솔.침대진실생물서렬적실험결과동양표명료GOBMD산법적유효성.