计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2014年
6期
705-708
,共4页
张盈盈%李春%杨闫%贾美多
張盈盈%李春%楊閆%賈美多
장영영%리춘%양염%가미다
多重集%逆序数%系统发生分析
多重集%逆序數%繫統髮生分析
다중집%역서수%계통발생분석
multiset%inverted sequence number%phylogenetic analysis
随着人类和其它一些模式生物基因组计划的实施与完成,DNA序列的数量呈指数方式增长,这使得序列分析成为生物信息学的核心问题之一.众所周知,序列之所以称为“序列”,自然而然地包含了2个重要因素:元素及其之间的序关系.本文介绍一种全新的考虑元素之间序关系的方法,首先将传统集合上的排列的逆序数推广到多重集上,从而提出带有重复元素的排列的逆序数的概念;在此基础上通过将数字1、2、3、4分别赋值给4个碱基,将DNA原始序列转化为多重集上的数字排列,进而借助逆序数构造出DNA序列的24维向量表示;基于3个数据集的系统发生分析,证实了该方法的有效性.
隨著人類和其它一些模式生物基因組計劃的實施與完成,DNA序列的數量呈指數方式增長,這使得序列分析成為生物信息學的覈心問題之一.衆所週知,序列之所以稱為“序列”,自然而然地包含瞭2箇重要因素:元素及其之間的序關繫.本文介紹一種全新的攷慮元素之間序關繫的方法,首先將傳統集閤上的排列的逆序數推廣到多重集上,從而提齣帶有重複元素的排列的逆序數的概唸;在此基礎上通過將數字1、2、3、4分彆賦值給4箇堿基,將DNA原始序列轉化為多重集上的數字排列,進而藉助逆序數構造齣DNA序列的24維嚮量錶示;基于3箇數據集的繫統髮生分析,證實瞭該方法的有效性.
수착인류화기타일사모식생물기인조계화적실시여완성,DNA서렬적수량정지수방식증장,저사득서렬분석성위생물신식학적핵심문제지일.음소주지,서렬지소이칭위“서렬”,자연이연지포함료2개중요인소:원소급기지간적서관계.본문개소일충전신적고필원소지간서관계적방법,수선장전통집합상적배렬적역서수추엄도다중집상,종이제출대유중복원소적배렬적역서수적개념;재차기출상통과장수자1、2、3、4분별부치급4개감기,장DNA원시서렬전화위다중집상적수자배렬,진이차조역서수구조출DNA서렬적24유향량표시;기우3개수거집적계통발생분석,증실료해방법적유효성.