计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2008年
5期
607-610
,共4页
生物信息学%最大独立集%代表序列%去冗余
生物信息學%最大獨立集%代錶序列%去冗餘
생물신식학%최대독립집%대표서렬%거용여
许多生物序列数据库中都含有大量的冗余序列,这些冗余序列通常不利于对数据库的统计分析和处理,而且它们要占用更多的计算机存储和处理资源.针对这个问题,本文中我们设计了一种去除蛋白质冗余序列的算法.该算法基于图论最大独立集的概念来生成非冗余序列集合,对目前存在的不少蛋白质去冗余程序所采用的由Hobohm和Sander最早设计的一种首先将序列分成若干簇然后取出代表序列的算法进行了改进,使得生成了更多的非冗余代表序列集合,避免了一些非冗余的序列也被去除.我们开发出了实现该算法的程序FastCluster,可以用来去除蛋白质数据库中的冗余序列.
許多生物序列數據庫中都含有大量的冗餘序列,這些冗餘序列通常不利于對數據庫的統計分析和處理,而且它們要佔用更多的計算機存儲和處理資源.針對這箇問題,本文中我們設計瞭一種去除蛋白質冗餘序列的算法.該算法基于圖論最大獨立集的概唸來生成非冗餘序列集閤,對目前存在的不少蛋白質去冗餘程序所採用的由Hobohm和Sander最早設計的一種首先將序列分成若榦簇然後取齣代錶序列的算法進行瞭改進,使得生成瞭更多的非冗餘代錶序列集閤,避免瞭一些非冗餘的序列也被去除.我們開髮齣瞭實現該算法的程序FastCluster,可以用來去除蛋白質數據庫中的冗餘序列.
허다생물서렬수거고중도함유대량적용여서렬,저사용여서렬통상불리우대수거고적통계분석화처리,이차타문요점용경다적계산궤존저화처리자원.침대저개문제,본문중아문설계료일충거제단백질용여서렬적산법.해산법기우도론최대독립집적개념래생성비용여서렬집합,대목전존재적불소단백질거용여정서소채용적유Hobohm화Sander최조설계적일충수선장서렬분성약간족연후취출대표서렬적산법진행료개진,사득생성료경다적비용여대표서렬집합,피면료일사비용여적서렬야피거제.아문개발출료실현해산법적정서FastCluster,가이용래거제단백질수거고중적용여서렬.