生物化学与生物物理进展
生物化學與生物物理進展
생물화학여생물물리진전
PROGRESS IN BIOCHEMISTRY AND BIOPHYSICS
2002年
4期
543-549
,共7页
张德礼%丁培国%凌伦奖%陈润生%马大龙
張德禮%丁培國%凌倫獎%陳潤生%馬大龍
장덕례%정배국%릉륜장%진윤생%마대룡
C17orf32%LOC124919%XM-058865%XP-058865%生物信息学%电子克隆%RT-PCR%人类基因组注释
C17orf32%LOC124919%XM-058865%XP-058865%生物信息學%電子剋隆%RT-PCR%人類基因組註釋
C17orf32%LOC124919%XM-058865%XP-058865%생물신식학%전자극륭%RT-PCR%인류기인조주석
利用生物信息学与实验验证的技术路线,成功地克隆了人类新基因C17orf32的cDNA(GenBank登记号:AY074907和TPA: BK000260),发现C17orf32的完整开放阅读框架(ORF,31~657 bp)cDNA(627 bp)与人类假定基因LOC124919 ORF(25~807 bp)的25~651位只有一个碱基不同.经RT-PCR验证并cDNA测序、人类表达序列标签(EST)数据库的BLAST检索和基因组成规律分析三方面的结果,均支持C17orf32的序列,而不支持LOC124919的编码序列.C17orf32基因组序列全长4.610 kb,含有6个外显子和5个内含子,cDNA序列全长1 679 bp, ORF横跨全部6个外显子.该基因ORF翻译起始处符合Kozak规则,ORF起始码上游同一相位有终止码,ORF后有2个加尾信号和PolyA尾.C17orf32基因的成功克隆表明,NCBI GENOME Annotation Project在2001年12月预测的人类假定蛋白XP-058865编码基因LOC124919的模式参考序列XM-058865中存在偏差,即在C17orf32基因cDNA的406与407位碱基之间错误插入一个碱基G, 从而导致在插入位点后,ORF编码125位氨基酸以后蛋白质序列的改变,出现260个氨基酸的多肽.因此,应慎重看待计算机注释的人类基因组编码序列.建立的技术路线有助于发现更多新的人类功能基因.
利用生物信息學與實驗驗證的技術路線,成功地剋隆瞭人類新基因C17orf32的cDNA(GenBank登記號:AY074907和TPA: BK000260),髮現C17orf32的完整開放閱讀框架(ORF,31~657 bp)cDNA(627 bp)與人類假定基因LOC124919 ORF(25~807 bp)的25~651位隻有一箇堿基不同.經RT-PCR驗證併cDNA測序、人類錶達序列標籤(EST)數據庫的BLAST檢索和基因組成規律分析三方麵的結果,均支持C17orf32的序列,而不支持LOC124919的編碼序列.C17orf32基因組序列全長4.610 kb,含有6箇外顯子和5箇內含子,cDNA序列全長1 679 bp, ORF橫跨全部6箇外顯子.該基因ORF翻譯起始處符閤Kozak規則,ORF起始碼上遊同一相位有終止碼,ORF後有2箇加尾信號和PolyA尾.C17orf32基因的成功剋隆錶明,NCBI GENOME Annotation Project在2001年12月預測的人類假定蛋白XP-058865編碼基因LOC124919的模式參攷序列XM-058865中存在偏差,即在C17orf32基因cDNA的406與407位堿基之間錯誤插入一箇堿基G, 從而導緻在插入位點後,ORF編碼125位氨基痠以後蛋白質序列的改變,齣現260箇氨基痠的多肽.因此,應慎重看待計算機註釋的人類基因組編碼序列.建立的技術路線有助于髮現更多新的人類功能基因.
이용생물신식학여실험험증적기술로선,성공지극륭료인류신기인C17orf32적cDNA(GenBank등기호:AY074907화TPA: BK000260),발현C17orf32적완정개방열독광가(ORF,31~657 bp)cDNA(627 bp)여인류가정기인LOC124919 ORF(25~807 bp)적25~651위지유일개감기불동.경RT-PCR험증병cDNA측서、인류표체서렬표첨(EST)수거고적BLAST검색화기인조성규률분석삼방면적결과,균지지C17orf32적서렬,이불지지LOC124919적편마서렬.C17orf32기인조서렬전장4.610 kb,함유6개외현자화5개내함자,cDNA서렬전장1 679 bp, ORF횡과전부6개외현자.해기인ORF번역기시처부합Kozak규칙,ORF기시마상유동일상위유종지마,ORF후유2개가미신호화PolyA미.C17orf32기인적성공극륭표명,NCBI GENOME Annotation Project재2001년12월예측적인류가정단백XP-058865편마기인LOC124919적모식삼고서렬XM-058865중존재편차,즉재C17orf32기인cDNA적406여407위감기지간착오삽입일개감기G, 종이도치재삽입위점후,ORF편마125위안기산이후단백질서렬적개변,출현260개안기산적다태.인차,응신중간대계산궤주석적인류기인조편마서렬.건립적기술로선유조우발현경다신적인류공능기인.