遗传学报
遺傳學報
유전학보
ACTA GENETICA SINICA
2005年
3期
315-321
,共7页
内部重复片段%简单重复序列%蛋白质组
內部重複片段%簡單重複序列%蛋白質組
내부중복편단%간단중복서렬%단백질조
internal repeating segments%simple repeating segments%proteomes
20世纪70年代,Ohno提出了功能蛋白的起源理论,认为寡肽片段的周期性重复是蛋白质起源的一种方式. 蛋白质内部重复片段在蛋白质序列进化的过程中具有重要意义.选取原核生物、古细菌、真核生物的8个代表物种,设计了新的蛋白质内部重复片段的提取方法,并用矩阵的方式对重复片段的类型及其出现的频率进行形象地展现,既保留了重复片段的序列特征又可进行全局性的统计描述.分析表明:真核生物高频率的使用简单重复序列;真细菌也具有低频率使用简单重复序列的现象;而古细菌则几乎没有.进一步研究显示,3大种群生物偏向性使用氨基酸构成蛋白质内部重复片段的形为与蛋白质组的氨基酸使用频率紧密相关.其相关系数在真细菌和古细菌中高于0.95,而真核生物略低.真核生物蛋白质组大量使用简单重复片段,以及两者在氨基酸使用上的较低相关性暗示简单重复序列的快速进化是导致真核生物蛋白质组高复杂性的一个关键因素.
20世紀70年代,Ohno提齣瞭功能蛋白的起源理論,認為寡肽片段的週期性重複是蛋白質起源的一種方式. 蛋白質內部重複片段在蛋白質序列進化的過程中具有重要意義.選取原覈生物、古細菌、真覈生物的8箇代錶物種,設計瞭新的蛋白質內部重複片段的提取方法,併用矩陣的方式對重複片段的類型及其齣現的頻率進行形象地展現,既保留瞭重複片段的序列特徵又可進行全跼性的統計描述.分析錶明:真覈生物高頻率的使用簡單重複序列;真細菌也具有低頻率使用簡單重複序列的現象;而古細菌則幾乎沒有.進一步研究顯示,3大種群生物偏嚮性使用氨基痠構成蛋白質內部重複片段的形為與蛋白質組的氨基痠使用頻率緊密相關.其相關繫數在真細菌和古細菌中高于0.95,而真覈生物略低.真覈生物蛋白質組大量使用簡單重複片段,以及兩者在氨基痠使用上的較低相關性暗示簡單重複序列的快速進化是導緻真覈生物蛋白質組高複雜性的一箇關鍵因素.
20세기70년대,Ohno제출료공능단백적기원이론,인위과태편단적주기성중복시단백질기원적일충방식. 단백질내부중복편단재단백질서렬진화적과정중구유중요의의.선취원핵생물、고세균、진핵생물적8개대표물충,설계료신적단백질내부중복편단적제취방법,병용구진적방식대중복편단적류형급기출현적빈솔진행형상지전현,기보류료중복편단적서렬특정우가진행전국성적통계묘술.분석표명:진핵생물고빈솔적사용간단중복서렬;진세균야구유저빈솔사용간단중복서렬적현상;이고세균칙궤호몰유.진일보연구현시,3대충군생물편향성사용안기산구성단백질내부중복편단적형위여단백질조적안기산사용빈솔긴밀상관.기상관계수재진세균화고세균중고우0.95,이진핵생물략저.진핵생물단백질조대량사용간단중복편단,이급량자재안기산사용상적교저상관성암시간단중복서렬적쾌속진화시도치진핵생물단백질조고복잡성적일개관건인소.
In 1970's,Ohno proposed that primordial proteins might evolve from periodic amplification of oligo-peptides.Internal repeating segments in proteins may play important roles in functional evolution of proteins.In this study,a new method was designed to extract internal repeating segments from proteomes of 8 modern species belong to eukaryota,bacteria and archaea,respectively.The repeating patterns and the frequencies within proteomes of each kingdom were analyzed by matrix plot.Simple repeat segments were found in eukaryotic proteins with high frequencies,but were much lower in bacteria and none in archaea.Further analysis showed that,the biased usage of amino acids in the internal repeating segments was positively related to the frequencies of individual amino acids in the proteome of a given species.The correlation coefficient was up to 0.95 in prokaryota,with the eukaryota to be lower.The high frequency of simple repeat sequences in eukaryotic proteomes,as well as the disparate relationships of amino acid compositions between the internal repeating segments and their haboring eukaryotic proteomes imply that the fast evolution of simple repeat sequences could be one force that generates the high complexity of eukarytic proteomes.