计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2013年
11期
165-170,142
,共7页
宏基因组学%DNA序列%物种聚类%仿射聚类%倒排索引
宏基因組學%DNA序列%物種聚類%倣射聚類%倒排索引
굉기인조학%DNA서렬%물충취류%방사취류%도배색인
metagenomics%DNA sequence%binning%affinity propagation%inverted index
随着下一代测序技术的迅猛发展,宏基因组学已经成为新的研究热点,宏基因组学序列聚类问题使用无参考的方法,对包含多个物种的宏基因组序列进行有效分离。为此,提出一种结合相似度信息和结构信息的宏基因组物种聚类算法,并引入仿射聚类来进行序列物种聚类。实验数据表明该方法聚类精度高、执行速度快。我们也开发了基于该方法的宏基因组序列物种聚类软件。
隨著下一代測序技術的迅猛髮展,宏基因組學已經成為新的研究熱點,宏基因組學序列聚類問題使用無參攷的方法,對包含多箇物種的宏基因組序列進行有效分離。為此,提齣一種結閤相似度信息和結構信息的宏基因組物種聚類算法,併引入倣射聚類來進行序列物種聚類。實驗數據錶明該方法聚類精度高、執行速度快。我們也開髮瞭基于該方法的宏基因組序列物種聚類軟件。
수착하일대측서기술적신맹발전,굉기인조학이경성위신적연구열점,굉기인조학서렬취류문제사용무삼고적방법,대포함다개물충적굉기인조서렬진행유효분리。위차,제출일충결합상사도신식화결구신식적굉기인조물충취류산법,병인입방사취류래진행서렬물충취류。실험수거표명해방법취류정도고、집행속도쾌。아문야개발료기우해방법적굉기인조서렬물충취류연건。
Nowadays, with the rapid development of the next generation sequencing technologies, metagenomics have become a new hotspot,However research in metagenomics faces the issue of binning --- identification and taxonomic characterization of the NGS short reads. To solve this problem, this paper first analyzes the next generation sequencing technology characteristics, statistical characteristics of metagenomic sequence, then proposes a new clustering method for DNA sequence binning. Test results show that this method has a very good clustering accuracy. In the same time, we developed an software for metagenomic binning based on this algorithm MetaBinning.