遗传
遺傳
유전
HEREDITAS(BEIJING)
2014年
4期
387-394
,共8页
赵小蕾%左晓宇%覃继恒%梁岩%张乃尊%栾奕昭%饶绍奇
趙小蕾%左曉宇%覃繼恆%樑巖%張迺尊%欒奕昭%饒紹奇
조소뢰%좌효우%담계항%량암%장내존%란혁소%요소기
蛋白质-蛋白质互作%基因本体论%富集分析%通路归属%预测
蛋白質-蛋白質互作%基因本體論%富集分析%通路歸屬%預測
단백질-단백질호작%기인본체론%부집분석%통로귀속%예측
protein-protein interaction%Gene Ontology%enrichment analysis%pathway attribution%prediction
生物学通路被广泛应用于基因功能学研究,但现有的生物学通路知识并不完善,仍需进一步扩充.生物信息学预测为通路扩充提供了一种有效且经济的途径.文章提出了一种融合蛋白质-蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法.首先选取目标基因在蛋白质-蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路,然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属.分别利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质-蛋白质互作信息进行预测.结果表明,在两套数据中,随着互作邻居个数的增加,预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中,所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势.当互作邻居个数达到22时,预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID),而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID).进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证,至少有一个更新通路被预测正确的基因有50个,其中43个基因的更新通路被完全正确预测,相对准确率为86.0%.这些结果显示该方法是一种可靠且有效的通路扩充方法.
生物學通路被廣汎應用于基因功能學研究,但現有的生物學通路知識併不完善,仍需進一步擴充.生物信息學預測為通路擴充提供瞭一種有效且經濟的途徑.文章提齣瞭一種融閤蛋白質-蛋白質互作知識以及Gene Ontology(GO)數據庫信息進行基因通路預測的新方法.首先選取目標基因在蛋白質-蛋白質互作層麵上的鄰居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路為候選通路,然後通過檢驗候選通路中的基因是否在與目標基因關聯的GO節點富集來判斷目標基因的通路歸屬.分彆利用Human Protein Reference Database(HPRD)和Biological General Repository for Interaction Datasets(BioGRID)數據庫中的蛋白質-蛋白質互作信息進行預測.結果錶明,在兩套數據中,隨著互作鄰居箇數的增加,預測的平均準確率(在所有目標基因註釋的通路中被成功預測的比例)及相對準確率(在至少有一箇註釋通路被成功預測的基因集中,所有註釋通路均被預測正確的基因所佔的比例)均呈現上升趨勢.噹互作鄰居箇數達到22時,預測的平均準確率分彆達到96.2%(HPRD)和96.3%(BioGRID),而相對準確率分彆為93.3%(HPRD)和84.1%(BioGRID).進一步利用新版數據庫對舊版數據庫中被更新的89箇基因進行驗證,至少有一箇更新通路被預測正確的基因有50箇,其中43箇基因的更新通路被完全正確預測,相對準確率為86.0%.這些結果顯示該方法是一種可靠且有效的通路擴充方法.
생물학통로피엄범응용우기인공능학연구,단현유적생물학통로지식병불완선,잉수진일보확충.생물신식학예측위통로확충제공료일충유효차경제적도경.문장제출료일충융합단백질-단백질호작지식이급Gene Ontology(GO)수거고신식진행기인통로예측적신방법.수선선취목표기인재단백질-단백질호작층면상적린거소재적Kyoto Encyclopedia of Genes and Genomes(KEGG)통로위후선통로,연후통과검험후선통로중적기인시부재여목표기인관련적GO절점부집래판단목표기인적통로귀속.분별이용Human Protein Reference Database(HPRD)화Biological General Repository for Interaction Datasets(BioGRID)수거고중적단백질-단백질호작신식진행예측.결과표명,재량투수거중,수착호작린거개수적증가,예측적평균준학솔(재소유목표기인주석적통로중피성공예측적비례)급상대준학솔(재지소유일개주석통로피성공예측적기인집중,소유주석통로균피예측정학적기인소점적비례)균정현상승추세.당호작린거개수체도22시,예측적평균준학솔분별체도96.2%(HPRD)화96.3%(BioGRID),이상대준학솔분별위93.3%(HPRD)화84.1%(BioGRID).진일보이용신판수거고대구판수거고중피경신적89개기인진행험증,지소유일개경신통로피예측정학적기인유50개,기중43개기인적경신통로피완전정학예측,상대준학솔위86.0%.저사결과현시해방법시일충가고차유효적통로확충방법.