硅谷
硅穀
규곡
SILICON VALLEY
2009年
14期
60-61
,共2页
motif%高阶位置特异性得分矩阵%贪婪算法%保守性
motif%高階位置特異性得分矩陣%貪婪算法%保守性
motif%고계위치특이성득분구진%탐람산법%보수성
所要解决的问题是从一组DNA序列中的每一条序列中寻找一条子序列,这些子序列具有相同的长度,同时在序列模式上具有高保守性.为了解决这个问题,首先从输入的序列中随机选择其中的若干条,利用贪婪算法从这些序列中选择一组具有高相似性的长度一致的子序列,把它们作为种子序列,对它们建立高阶位置特异性得分矩阵.然后从余下的序列中随机选择一条,利用这个矩阵对这条序列中的每一条长度与种子序列相同的子序列进行打分,从中选择得分最高的子序列,这就是要找的motif在这条序列中的实例,接下来利用找到的子序列更新高阶位置特异性得分矩阵,然后再重复寻找新的实例,如此迭代下去,直到从所有的输入序列中都找到一条子序列为止.对人工数据和真实的DNA序列进行试验,结果表明本算法可以有效地识别出序列中包含的高保守性motif.
所要解決的問題是從一組DNA序列中的每一條序列中尋找一條子序列,這些子序列具有相同的長度,同時在序列模式上具有高保守性.為瞭解決這箇問題,首先從輸入的序列中隨機選擇其中的若榦條,利用貪婪算法從這些序列中選擇一組具有高相似性的長度一緻的子序列,把它們作為種子序列,對它們建立高階位置特異性得分矩陣.然後從餘下的序列中隨機選擇一條,利用這箇矩陣對這條序列中的每一條長度與種子序列相同的子序列進行打分,從中選擇得分最高的子序列,這就是要找的motif在這條序列中的實例,接下來利用找到的子序列更新高階位置特異性得分矩陣,然後再重複尋找新的實例,如此迭代下去,直到從所有的輸入序列中都找到一條子序列為止.對人工數據和真實的DNA序列進行試驗,結果錶明本算法可以有效地識彆齣序列中包含的高保守性motif.
소요해결적문제시종일조DNA서렬중적매일조서렬중심조일조자서렬,저사자서렬구유상동적장도,동시재서렬모식상구유고보수성.위료해결저개문제,수선종수입적서렬중수궤선택기중적약간조,이용탐람산법종저사서렬중선택일조구유고상사성적장도일치적자서렬,파타문작위충자서렬,대타문건립고계위치특이성득분구진.연후종여하적서렬중수궤선택일조,이용저개구진대저조서렬중적매일조장도여충자서렬상동적자서렬진행타분,종중선택득분최고적자서렬,저취시요조적motif재저조서렬중적실례,접하래이용조도적자서렬경신고계위치특이성득분구진,연후재중복심조신적실례,여차질대하거,직도종소유적수입서렬중도조도일조자서렬위지.대인공수거화진실적DNA서렬진행시험,결과표명본산법가이유효지식별출서렬중포함적고보수성motif.